Python3中的str和bytes

作者：超可爱萌地1983 | 来源：互联网 | 2023-05-17 12:28

与Python2.X不同，Python3.X严格区分了str和bytes两种类型。文本为Unicode，由str类型表示；二进制数据则由bytes表示。Python3.X

与 Python2.X 不同，Python3.X 严格区分了 str 和 bytes 两种类型。文本为 Unicode，由 str 类型表示；二进制数据则由 bytes 表示。

Python3.X 不会以任意隐式的方式混用 str 和 bytes。因此使用者不能拼接字符串和字节包，也无法在字节包里搜索字符串（反之亦然），也不能将字符串传入参数为字节包的函数（反之亦然）。

例如 Python3.X 中的socket.send()函数，如果传入未编码的字符串，会报错：

>>> client.send("test str")

Traceback (most recent call last):
  File "", line 1, in <module>
TypeError: a bytes-like object is required, not 'str'
    
>>> client.send(b"test str")  #将参数转换成 bytes 类型
8                           #返回发送的数据长度

编码发展的历史

在计算机历史的早期，美国为代表的英语系国家主导了整个计算机行业，26个英文字母组成了多样的英语单词、语句、文章。因此，最早的字符编码规范是ASCII码，一种8位（即1个字节）的编码规范，它可以涵盖整个英语系的编码需要。

编码是什么？编码就是把一个字符用一个二进制来表示。我们都知道，所有的东西，不管是英文、中文还是符号等等，最终存储在磁盘上都是01010101这类东西。在计算机内部，读取和存储数据归根结底，处理的都是0和1组成的比特流。问题来了，人类看不懂这些比特流，如何让这些010101对人类变得可读呢？于是出现了字符编码，它是个翻译机，在计算机内部某个地方，偷偷帮我们将比特流翻译成人类可以直接理解的文字。对于一般用户，不需要知道这个过程是什么原理，是怎么执行的。但是对于程序员却是个必须搞清楚的问题。

以ASCII编码为例，它规定1个字节8个比特位代表1个字符的编码，逐个字节进行解读。例如：01000001表示大写字母A，有时我们会用65这个十进制来表示A在ASCII中的编码。8个比特位，可以无重复地最多表示2的8次方个字符；但标准的ASCII码只有7位，码值范围是0-127，最高位为0。

后来，计算机得到普及，中文、日文、韩文等等国家的文字需要在计算机内表示，像ASCII这种单字节编码已经远远不够了，于是标准组织制定出了UNICODE（万国码），它规定任何一个字符（不管哪国的）至少以两个字节表示。其中，英文字母就是用2个字节，而汉字是3个字节。这个编码虽然很好，满足了所有人的要求，但是它不兼容ASCII，同时还占用较多的空间和内存。而在计算机世界更多的字符是英文字母，明明可以1个字节就能够表示，非要用2个，就造成了空间资源的浪费了。

于是UTF-8编码应运而生，它规定英文字母系列用1个字节表示，汉字用3个字节表示等等。因此，它兼容ASCII，可以解码早期的文档。UTF-8很快就得到了广泛的应用。

在编码的发展历程中，我国还创造了自己的编码方式，例如GBK，GB2312，BIG5。他们只局限于在国内使用，不被国外认可。在GBK编码中，中文汉字占2个字节。

bytes 和 str 之间的转换

test0 = 'abc'
test1 = b'abc'
print(type(test0), test0) --> <class 'str'> 'abc'
print(type(test1), test1) --> <class 'bytes'> b'abc'

test2 = bytes(test0, 'utf-8')
test3 = str(test1, 'utf-8')
test4 = str(test1)
print(type(test2), test2) --> <class 'bytes'> b'abc'
print(type(test3), test3) --> <class 'str'> 'abc'
print(type(test4), test4) --> <class 'str'> "b'abc'"

test5 = test0.encode() #参数可输入编码格式，默认utf-8
test6 = test1.decode()
print(type(test5), test5) --> <class 'bytes'> b'abc'
print(type(test6), test6) --> <class 'str'> 'abc'

推荐阅读

request
HTTP请求与响应机制详解

本文深入探讨了HTTP请求和响应对象的使用，详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外，还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]

蜡笔小新 2024-12-23 20:40:08
io
解决 OpenStack VM 部署 Ceph 集群时外部服务器无法访问的问题

本文探讨了在 OpenStack 环境中使用虚拟机部署 Ceph 集群后，外部服务器通过浮动 IP 无法访问该集群的问题，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-12-23 18:54:47
io
深入解析C++对象模型中的细节问题

本文深入探讨了C++对象模型中的一些细节问题，特别是虚拟继承和析构函数的处理。通过具体代码示例和详细分析，揭示了书中某些观点的不足之处，并提供了更合理的解释。 ... [详细]

蜡笔小新 2024-12-25 19:29:03
cmd
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
cmd
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
request
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
email
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40
email
掌握远程执行Linux脚本和命令的技巧

本文将详细介绍如何利用Python的Paramiko库实现远程执行Linux脚本和命令，帮助读者快速掌握这一实用技能。通过具体的示例和详尽的解释，让初学者也能轻松上手。 ... [详细]

蜡笔小新 2024-12-26 19:47:05
email
利用存储过程构建年度日历表的详细指南

本文将介绍如何使用SQL存储过程创建一个完整的年度日历表。通过实例演示，帮助读者掌握存储过程的应用技巧，并提供详细的代码解析和执行步骤。 ... [详细]

蜡笔小新 2024-12-26 18:20:17
java
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
const
JavaScript 基础语法指南

本文详细介绍了 JavaScript 的基础语法，包括变量、数据类型、运算符、语句和函数等内容，旨在为初学者提供全面的入门指导。 ... [详细]

蜡笔小新 2024-12-23 10:54:44
const
python3 中encode 和decode的使用方法。

编码：　　将文本转换成字节流的过程。即Unicode----------->特定格式的编码方式，产生特定的字节流保存在硬盘中(一般为utf-8格式)。解码：　　将硬盘中的字节流转换成文本的过程。 ... [详细]

蜡笔小新 2023-10-09 19:42:30
io
Python3 Scrapy 安装方法（一脸辛酸泪）

写在前面最近在学习爬虫，在熟悉了Python语言和BeautifulSoup4后打算下个爬虫框架试试。没想到啊，这坑太深了。。。看了看相关介绍后选择了Scrapy框架，然后兴高采烈的 ... [详细]

蜡笔小新 2023-09-24 14:44:19
express
Python3怎么获取文件属性

这篇文章给大家分享的是有关Python3怎么获取文件属性的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。os.stat(path ... [详细]

蜡笔小新 2023-09-23 12:27:42
express
python教程分享python单例模式之selenium driver实现单例

一、使用装饰器实现单例二、web自动化driver实现单例模式2.1编写单例模式的装饰器2.2driver使用装饰器，实现单例模式2.3获取driver的实例，就是单例了三、在自动 ... [详细]

蜡笔小新 2023-09-17 16:48:19

超可爱萌地1983

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章