自学内容网 自学内容网

字符串编码

字符串编码部分

  • 字符串编码概念
#1.字符串编码
#本质上就是二进制数据与语言文字的一一对应的关系

这里指出字符串编码的本质是建立二进制数据与语言文字之间的一一对应关系,以便计算机能够存储和处理文本信息。

  • Unicode 编码
#1.2 Unicode编码:所有的字符都是两个字节
#好处:字符与数字之间的转换比较快
#坏处:占用空间大

介绍了 Unicode 编码,它的特点是将所有字符都用两个字节来表示。其优点是字符与数字之间的转换速度相对较快,而缺点是占用的存储空间较大,因为对于一些原本不需要两个字节表示的字符(比如 ASCII 码中的字符)也使用了两个字节。

  • 字符串编码转化
 #1.4字符串编码转化
 a='hallo'
 print(a,type(a))
 a1=a.encode()
 print(a1)
 print(type(a1))#bytes 以字节为单位进行处理
 a2=a1.decode()
 print(a2)
 print(type(a2))#bytes 以字节为单位进行处理
 #注意:对于bytes只需要知道与字符串类型的相互转化
 st="你好"
 st1=st.encode("utf-8")
 print(type(str))

这段代码展示了字符串与字节类型(bytes)之间的相互转换操作。首先,对于字符串a = 'hallo',通过encode()方法将其转换为字节类型a1,此时a1的类型为bytes,然后再通过decode()方法将字节类型的a1转换回字符串类型的a2。另外,对于包含中文的字符串st = "你好",使用utf-8编码将其转换为字节类型st1。不过这里print(type(str))应该是笔误,可能是想打印print(type(st1))来查看转换后的字节类型对象的类型。

字符串常见操作部分

字符串拼接与重复输出
  • 字符串拼接
#2.1 字符串拼接
print(10+10)#整形相加
print("10"+"10")#字符串拼接
 #注意对于print(a,b) ab中间有空字符可以使用
 print("a","b",sep="")

这里区分了整数相加和字符串拼接的不同操作。整数10 + 10会进行数学加法运算得到20,而字符串"10" + "10"则会进行拼接操作得到"1010"。同时还提到了print函数在输出多个参数时,默认参数之间有空格分隔,可以通过设置sep参数来改变分隔方式,如print("a", "b",


原文地址:https://blog.csdn.net/nofaluse/article/details/144043505

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!