3.26学习笔记（字符编码,字符与字节,文件操作）

作者：mobiledu2502879663 | 来源：互联网 | 2023-10-13 12:10

1.字符编码:人识别的语言与机器识别的语言转化的媒介*****重点：什么是字符编码人类能识别的是字符等高级标识符，电脑只能识别0,1组成的标识符&#x

1.字符编码:

人识别的语言与机器识别的语言转化的媒介 *****
重点&＃xff1a;什么是字符编码
人类能识别的是字符等高级标识符&＃xff0c;电脑只能识别0,1组成的标识符&＃xff0c;要完成人与机器之间的信息交流&＃xff0c;一定需要一个媒介&＃xff0c;进行两种标识符的转化(两种标识符的对应关系),对应关系形成的结构称之为&＃xff1a;编码表.
了解&＃xff1a;编码表的发展史
1. ascii&＃xff08;ASCII&＃xff09;&＃xff1a;字母、数字、英文符号与计算机01标识符的对应关系
思考&＃xff1a;如何将128个字符用01完全标签
二进制&＃xff1a;11111111 &＃61;> 255 &＃61;> 1bytes(1字节) &＃61;> 8个二进制位
2.中国&＃xff1a;研究汉字与计算机01标识符的对应关系&＃xff1a;gb2312 &＃61;> GBK(***) &＃61;> GB18030
3. 制造一个可以完成万国字符与计算机01标识符的对应关系的编码表
编码表&＃xff1a;unicode表
py2&＃xff1a;ascii&＃xff0c;没有按万国编码&＃xff0c;原因py2要诞生先有万国编码
py3: utf-8, 采用万国编码来解释文本内容
思考&＃xff1a;unicode与utf-8什么关系
unicode&＃xff1a;用2个字节来存储汉字&＃xff0c;用2个字节来存储英文字母&＃xff0c;占有空间较多&＃xff0c;读取效率极高
utf-8&＃xff1a;用3-6个字节来存储汉字&＃xff0c;用1个字节来存储英文字母&＃xff0c;占有空间较少&＃xff0c;读取效率低
总结&＃xff1a;内存都是按unicode存储数据&＃xff0c;硬盘和cpu采用utf-8来存取数据.
unicode与utf-8采用的是一张unicode编码表&＃xff0c;utf-8是unicode编码表体现方式&＃xff0c;变长存储数据
变长优点&＃xff1a;&＃xff08;大量数据都是以英文存在&＃xff0c;所以utf-8空间更小&＃xff09;传输速度更快

2.字符与字节:

字符占多少字节&＃xff0c;字符串转化 ***

# unicode字符串&＃xff0c;默认字符串 s1 &＃61; u&＃39;abc你好\n不好&＃39; print(s1) # 字节字符串 s2 &＃61; b&＃39;abc123\xb7\xb7&＃39; print(s2) # 原义字符串: 不对字符串内存做任何操作(eg:\n的转化) s3 &＃61; r&＃39;abc你好\n不好&＃39; print(s3)# 编码与解码 s &＃61; &＃39;123呵呵&＃39; n_b &＃61; bytes(s, encoding&＃61;&＃39;utf-8&＃39;) print(n_b)b &＃61; b&＃39;123\xe5\x91\xb5\xe5\x91\xb5&＃39; n_s &＃61; str(b, encoding&＃61;&＃39;GBK&＃39;) print(n_s)# 重点&＃xff1a;***** # 将u字符串编码成b字符串 print(u&＃39;你好&＃39;.encode(&＃39;utf-8&＃39;)) # 将b字符串解码成u字符串 print(b&＃39;\xe4\xbd\xa0\xe5\xa5\xbd&＃39;.decode(&＃39;utf-8&＃39;))

3.文件操作:

操作硬盘中的一块区域&＃xff1a;读写操作 *****
文件&＃xff1a;硬盘中一块存储空间(虚拟的文件)
文件操作&＃xff1a;根据文件名来操作硬盘的那块存储空间&＃xff0c;操作方式读read 写write

# 一、使用文件的三步骤 # 1、打开文件 # 变量名 &＃61; 文件空间 # 文件路径操作模式(读|写) 编码 f &＃61; open(&＃39;a.txt&＃39;, &＃39;r&＃39;, encoding&＃61;&＃39;utf-8&＃39;) # 2、操作文件 # data &＃61; f.read(3) # 将所有内容读取出来&＃xff0c;如果设置读取长度&＃xff0c;按照规定长度读取数据 # print(data) # 一次读取一行 # line &＃61; f.readline() # print(line) # line &＃61; f.readline() # print(line)# 按行一次性全部读出 # lines &＃61; f.readlines() # print(lines)# 逐步一行一行读取 # l &＃61; [] # for line in f: # # print(line) # l.append(line) # print(l)s &＃61; set() for line in f:# print(line)s.add(line) print(s)# 3、关闭文件 f.close() # 释放操作系统对文件的持有&＃xff0c;变量f还被应用程序持有 # del f # 系统自动回收 print(f)# 二、模式&＃xff1a;w &＃39;&＃39;&＃39; 主模式&＃xff1a;r:读 | w:写 | a:追加从模式&＃xff1a;b:按字节操作 | t:按字符操作 | &＃43;:可读可写了解&＃xff1a;x:异常写 | U:被遗弃了 &＃39;&＃39;&＃39; # 基础写 # 文件不存在&＃xff1a;会新建文件&＃xff0c;再操作文件 # 文件存在&＃xff1a;先清空文件&＃xff0c;再操作文件 w &＃61; open(&＃39;b.txt&＃39;, &＃39;w&＃39;, encoding&＃61;&＃39;utf-8&＃39;)w.write(&＃39;456&＃39;) w.close() print(&＃39;end&＃39;)

推荐阅读

input
HTTP请求与响应机制详解

本文深入探讨了HTTP请求和响应对象的使用，详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外，还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]

蜡笔小新 2024-12-23 20:40:08
const
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
java
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
bash
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
bash
深入解析TCP/IP五层协议

本文详细介绍了TCP/IP五层协议模型，包括物理层、数据链路层、网络层、传输层和应用层。每层的功能及其相互关系将被逐一解释，帮助读者理解互联网通信的原理。此外，还特别讨论了UDP和TCP协议的特点以及三次握手、四次挥手的过程。 ... [详细]

蜡笔小新 2024-12-24 14:02:48
match
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23
triggers
优化DB2数据库性能的关键策略

本文详细介绍了优化DB2数据库性能的多种方法，涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段，可以显著提升数据库的运行效率和响应速度。 ... [详细]

蜡笔小新 2024-12-22 16:20:33
join
基于目标检测结果的特定类别图像与XML文件快速分析方法

本文介绍了一种根据目标检测结果，从原始XML文件中提取并分析特定类别的方法。通过解析XML文件，筛选出特定类别的图像和标注信息，并保存到新的文件夹中，以便进一步分析和处理。 ... [详细]

蜡笔小新 2024-12-19 17:32:58
join
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
join
Python文本处理与可视化：分词及词云生成

本文介绍如何使用Python进行文本处理，包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图，展示文本数据的可视化分析方法。 ... [详细]

蜡笔小新 2024-12-26 08:37:18
java
Scala 实现 UTF-8 编码属性文件读取与克隆

本文介绍如何使用 Scala 以 UTF-8 编码方式读取属性文件，并实现属性文件的克隆功能。通过这种方式，可以确保配置文件在多线程环境下的一致性和高效性。 ... [详细]

蜡笔小新 2024-12-26 08:25:19
email
实用正则表达式有哪些

小编给大家分享一下实用正则表达式有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下 ... [详细]

蜡笔小新 2024-12-22 13:59:04
c语言
C语言数据类型详解

本文详细介绍了C语言中的基本数据类型，包括整型、浮点型、字符型及其各自的子类型，并探讨了这些类型在不同编译环境下的表现。 ... [详细]

蜡笔小新 2024-12-20 15:03:51
java
Java期末复习：throw与throws的区别及其他核心知识点

本文详细解析了Java中throw和throws的关键区别，同时涵盖了JDK的定义、Java虚拟机的关键约定、Java的跨平台性、自动垃圾回收机制、源文件结构、包的概念及作用等多个核心知识点，旨在帮助学生更好地准备Java期末考试。 ... [详细]

蜡笔小新 2024-12-19 19:00:10
c语言
C语言字符型数据与ASCII码表

1、字符型常量字符型常量指单个字符，是用一对单引号及其所括起来的字符表示。例如：‘A’、‘a’、‘0’、’$‘等都是字符型常量。C语言的字符使用的就是 ... [详细]

蜡笔小新 2024-12-18 19:01:19

mobiledu2502879663

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章