H5W3
当前位置:H5W3 > go > 正文

【go】go语言截取字符串后乱码

package main
import (
"fmt"
)
func main() {
str := "我爱你"
fmt.Println(str)  // 可以直接显示
fmt.Println(str[0:2]) // 显示乱码??
}

想问一下,这种直接截取字符串的方法,为什么会导致乱码?

不懂go,但八成是编码问题

一个中文字是用多个字节表示,UTF8用3个字节,Unicode用2个字节,GBK用2个字节。

但go可能并不知道,还将它当成单字节字符来看。因此你会截出一个半字。这半个字就表现为乱码。

解决方案: 可一律转成unicode编码,或使用库中可操纵多字节字符的函数

如果包含中文,需要将字符串转换为rune数组后再进行截取,再将结果转换成string

编码问题,一个汉字是三个byte,你只截了两个byte,所以就显示不全了。

转成rune,按照字符去操作

自己做了下测试,有三种显示方法,谢谢各位。

package main
import "fmt"
func main() {
str1 := "我爱你"
str2 := []rune(str1)
// 第一种方法
fmt.Println(string(str2[:]))
// 第二种方法
for i := 0; i < len(str2); i++ {
fmt.Printf("%c", str2[i])
}
// 第三种方法
for _, m := range str1 {
fmt.Printf("%c", m)
}
}

对golang的这种设计,我也是表示很不喜欢
如果你是c#或者java的习惯,可以采用我这个库
https://github.com/golangframework/xstring

import(
"github.com/golangframework/xstring"
)
s1:="你好,我是李萌萌同学"
s2:=xstring.Substring(s1,5,3)://李萌萌

回答

本文地址:H5W3 » 【go】go语言截取字符串后乱码

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址