Python Unicode 系统

🕗 发布于 2024-01-08 20:20 python 开发语言 编码系统

Python Unicode 系统

软件应用通常需要以多种语言显示输出信息，如英语，法语，日语，希伯来语或印地语。Python 的字符串类型使用 Unicode 标准表示字符。这使得程序能够处理所有这些不同的字符。

字符是文本的最小可能组成部分。’A’，’B’，’C’ 等是不同的字符。’È’ 和 ‘Í’ 也是。

根据 Unicode 标准，字符由代码点表示。代码点值是一个在 0 到 0x10FFFF 范围内的整数。

代码点序列在内存中表示为一组映射到8位字节的代码单元。将 Unicode 字符串转换为字节序列的规则称为字符编码。

有三种编码类型，UTF-8、UTF-16 和 UTF-32。UTF 代表 Unicode 转换格式 。

Python 3.0 版以后内置支持 Unicode。字符串类型 str 包含 Unicode 字符，因此使用单引号，双引号或三引号的字符串语法创建的任何字符串都以 Unicode 存储。Python 源代码的默认编码是 UTF-8。

因此，字符串可以包含 Unicode 字符的文字表示 (¾) 或其 Unicode 值 (\u00BE)。

var = "Â¾"
print (var)
var = "\u00BE"
print (var)

Python

这段代码将会产生以下输出 −

'Â¾'
Â¾

Python

在下面的示例中，字符串’10’使用Unicode值1和0（分别是\u0031和\u0030）进行存储。

var = "\u0031\u0030"
print (var)

Python

它将产生以下输出 -

Python

字符串以人类可读的格式显示文本，而字节将字符作为二进制数据存储。编码将数据从字符串转换为一系列字节。解码将字节转换回可读的字符和符号。重要的是不要混淆这两种方法。encode是一个字符串方法，而decode是Python字节对象的方法。

在以下示例中，我们有一个由ASCII字符组成的字符串变量。ASCII是Unicode字符集的子集。使用encode()方法将其转换为字节对象。

string = "Hello"
tobytes = string.encode('utf-8')
print (tobytes)
string = tobytes.decode('utf-8')
print (string)

Python

The decode()方法将字节对象重新转换为字符串对象。使用的编码方法是utf-8。

b'Hello'
Hello

Python

在下面的示例中，卢比符号(₹)使用其Unicode值存储在变量中。我们将字符串转换为字节，然后再转换回字符串。

string = "\u20B9"
print (string)
tobytes = string.encode('utf-8')
print (tobytes)
string = tobytes.decode('utf-8')
print (string)

Python

当你执行以上代码时，它将产生以下的输出。

â‚¹
b'\xe2\x82\xb9'
â

原文地址：https://blog.csdn.net/zqzgng/article/details/135453277

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：多模态推荐系统综述：五、挑战
下一篇：大逃杀游戏

基本定时器---内部时钟中断
STM32单片机的基本定时器介绍
阅读更多2024-11-15
高效稳定！新加坡服务器托管方案助力企业全球化布局
在全球化的商业环境中，企业对于高效、稳定的服务器托管方案的需求日益迫切。作为亚洲的服务器托管中心，新加坡凭借其独特的地理位置、稳定的政治环境、先进的科技设施以及开放的市场政策，为企业提供了理想的服务器
阅读更多2024-11-15
我要学kali-linux之shell脚本编程1
学习视频来自B站up主 **泷羽sec** 有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无
阅读更多2024-11-15
【网络安全】公钥基础设施
公钥基础设施（Public Key Infrastructure，简称PKI）是一种基于公钥密码学的系统，它提供了一套完整的解决方案，用于管理和保护通过互联网传输的信息。PKI的核心功能包括密钥管理、
阅读更多2024-11-15
PGMP-练练03 ❥(^_-)
由于项目集负责向组织提供收益，因此项目集经理、项目集团队成员、项目经理和团队成员以及其他项目集利益相关者都在收益管理中具有关键角色和责任。项目集 A 正在实现计划收益，然而项目集 B 的项目集经理刚
阅读更多2024-11-15
【c++笔试强训】（第八篇）
其中，有个游戏是这样的：首先，让 n 个小朋友们围成一个大圈，小朋友们的编号是0~n-1。然后，随机指定一个数 m ，让编号为0的小朋友开始报数。每次喊到 m-1 的那个小朋友要出列唱首歌，然后可以在
阅读更多2024-11-15
C语言之中缀表达式转换为波兰表达式、逆波兰表达式
C语言之中缀表达式转换为波兰表达式、逆波兰表达式，通过将运算符号压入栈、弹出栈等操作实现普通（中缀）表达式和前缀后缀（波兰、逆波兰）表达式之间的转换。
阅读更多2024-11-15
curl 安装最新版
配置编译参数：/usr/local为指定的安装路径，--with-ssl表示需要支持ssl。为了使curl能支持ssl功能，需要提前安装openssl，执行下列指令进行安装。库文件在对应的lib路径，
阅读更多2024-11-15
Conda环境与Ubuntu环境移植详解
迁移Conda环境是数据科学和机器学习开发中的一项重要任务。通过YAML文件迁移或直接复制环境文件夹的方法，可以在不同设备间无缝切换Conda环境，确保项目依赖的一致性。在进行环境迁移时，需要注意CU
阅读更多2024-11-15
Java面向对象高级2
感觉就是有时候简化代码用的？
阅读更多2024-11-15

Python Unicode 系统

Python Unicode 系统

相关文章