为了账号安全,请及时绑定邮箱和手机立即绑定

检查一个字符串只包含 ASCII 字符

检查一个字符串只包含 ASCII 字符

Go
哔哔one 2023-05-04 17:05:01
Go 是否有任何方法或建议如何检查字符串是否仅包含 ASCII 字符?正确的做法是什么?根据我的研究,解决方案之一是检查任何大于 127 的字符。func isASCII(s string) bool {    for _, c := range s {        if c > unicode.MaxASCII {            return false        }    }    return true}
查看完整描述

3 回答

?
慕桂英546537

TA贡献1848条经验 获得超10个赞

在 Go 中,我们关心性能,因此,我们会对您的代码进行基准测试:


func isASCII(s string) bool {

    for _, c := range s {

        if c > unicode.MaxASCII {

            return false

        }

    }

    return true

}


BenchmarkRange-4    20000000    82.0 ns/op

一个更快(更好,更惯用)的版本,它避免了不必要的符文转换:


func isASCII(s string) bool {

    for i := 0; i < len(s); i++ {

        if s[i] > unicode.MaxASCII {

            return false

        }

    }

    return true

}


BenchmarkIndex-4    30000000    55.4 ns/op

ascii_test.go:


package main


import (

    "testing"

    "unicode"

)


func isASCIIRange(s string) bool {

    for _, c := range s {

        if c > unicode.MaxASCII {

            return false

        }

    }

    return true

}


func BenchmarkRange(b *testing.B) {

    str := ascii()

    b.ResetTimer()

    for N := 0; N < b.N; N++ {

        is := isASCIIRange(str)

        if !is {

            b.Fatal("notASCII")

        }

    }

}


func isASCIIIndex(s string) bool {

    for i := 0; i < len(s); i++ {

        if s[i] > unicode.MaxASCII {

            return false

        }

    }

    return true

}


func BenchmarkIndex(b *testing.B) {

    str := ascii()

    b.ResetTimer()

    for N := 0; N < b.N; N++ {

        is := isASCIIIndex(str)

        if !is {

            b.Log("notASCII")

        }

    }

}


func ascii() string {

    byt := make([]byte, unicode.MaxASCII+1)

    for i := range byt {

        byt[i] = byte(i)

    }

    return string(byt)

}

输出:


$ go test ascii_test.go -bench=.

BenchmarkRange-4    20000000    82.0 ns/op

BenchmarkIndex-4    30000000    55.4 ns/op

$


查看完整回答
反对 回复 2023-05-04
?
心有法竹

TA贡献1866条经验 获得超5个赞

看起来你的方法是最好的。

ASCII简单定义为:

ASCII 将 128 个指定字符编码为七位整数

因此,字符的值为 0-2 7(或 0-127、0x0-0x7F)。

Go 无法检查字符串中的每个符文(或切片中的字节)是否具有特定范围内的数值,因此您的代码似乎是最好的方法。


查看完整回答
反对 回复 2023-05-04
?
撒科打诨

TA贡献1934条经验 获得超2个赞

另外一个选择:


package main

import "golang.org/x/exp/utf8string"


func main() {

   {

      b := utf8string.NewString("south north").IsASCII()

      println(b) // true

   }

   {

      b := utf8string.NewString("🧡💛💚💙💜").IsASCII()

      println(b) // false

   }

}

https://pkg.go.dev/golang.org/x/exp/utf8string#String.IsASCII


查看完整回答
反对 回复 2023-05-04
  • 3 回答
  • 0 关注
  • 138 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信