高级python_Python高级

作者：0Hey0ne | 来源：互联网 | 2023-07-29 22:48

GIL面试题如下描述PythonGIL的概念，以及它对python多线程的影响？编写一个多线程抓取网页的程序，并阐明多线程抓取程序是否可比

GIL面试题如下

描述Python GIL的概念&＃xff0c; 以及它对python多线程的影响&＃xff1f;编写一个多线程抓取网页的程序&＃xff0c;并阐明多线程抓取程序是否可比单线程性能有提升&＃xff0c;并解释原因。

he language doesn&＃39;t require the GIL -- it&＃39;s only the CPython virtual machine that has historically been unable to shed it.

参考答案:

Python语言和GIL没有半毛钱关系。仅仅是由于历史原因在Cpython虚拟机(解释器)&＃xff0c;难以移除GIL。

GIL&＃xff1a;全局解释器锁。每个线程在执行的过程都需要先获取GIL&＃xff0c;保证同一时刻只有一个线程可以执行代码。

线程释放GIL锁的情况&＃xff1a; 在IO操作等可能会引起阻塞的system call之前,可以暂时释放GIL,但在执行完毕后,必须重新获取GIL Python 3.x使用计时器(执行时间达到阈值后&＃xff0c;当前线程释放GIL)或Python 2.x&＃xff0c;tickets计数达到100

Python使用多进程是可以利用多核的CPU资源的。

多线程爬取比单线程性能有提升&＃xff0c;因为遇到IO阻塞会自动释放GIL锁

因为GIL的原因&＃xff0c;导致python的多线程并不是真正的多线程&＃xff0c;一次只能执行一个线程。但是开启多线程也比单线程要好。因此如果运行的是计算密集型&＃xff0c;也就是中间没有延时的&＃xff0c;就使用进程。如果是io密集型&＃xff0c;也就是读写的话&＃xff0c;就可以考虑线程和协程。解决python的GIL问题有两个&＃xff0c;一个换解释器&＃xff0c;这个问题只有在CPython解释器中存在。第二个方法就是使用C语言编写子线程&＃xff0c;然后导入进Python程序中。

深拷贝、浅拷贝

1. 浅拷贝

浅拷贝是对于一个对象的顶层拷贝

通俗的理解是&＃xff1a;拷贝了引用&＃xff0c;并没有拷贝内容

2. 深拷贝

深拷贝是对于一个对象所有层次的拷贝(递归)

进一步理解深拷贝

如果copy.copy拷贝的是元组&＃xff0c;那么它不会进行浅拷贝&＃xff0c;而仅仅是指向。

原因&＃xff1a;元组是不可变类型&＃xff0c;那么意味着数据一定不能进行修改&＃xff0c;因此用copy.copy的时候它会进行自动判断&＃xff0c;如果是元组它就是指向了它。

如果用copy.copy、copy.deepcopy对一个全部都是不可变类型的数据进行拷贝&＃xff0c;那么他们结果相同&＃xff0c;都是引用指向.。

如果拷贝的是一个拥有可变类型的数据&＃xff0c;即使元组是最顶层&＃xff0c;那么deepcopy依然是深拷贝&＃xff0c;而copy.copy还是指向。

拷贝的其他方式

分片表达式可以赋值一个序列

字典的copy方法可以拷贝一个字典

注意点

浅拷贝对不可变类型和可变类型的copy不同

copy.copy对于可变类型&＃xff0c;会进行浅拷贝

copy.copy对于不可变类型&＃xff0c;不会拷贝&＃xff0c;仅仅是指向

import导入模块

import aa 的过程是首先导入 aa这个模块&＃xff0c;然后在当前程序中创建aa这个变量指向这个模块。

1. import 搜索路径

路径搜索

从上面列出的目录里依次查找要导入的模块文件

&＃39;&＃39; 表示当前路径

列表中的路径的先后顺序代表了python解释器在搜索模块时的先后顺序

程序执行时添加新的模块路径

sys.path.append(&＃39;/home/itcast/xxx&＃39;)

sys.path.insert(0, &＃39;/home/itcast/xxx&＃39;) # 可以确保先搜索这个路径

In [37]: sys.path.insert(0,"/home/python/xxxx")

In [38]: sys.path

Out[38]:

[&＃39;/home/python/xxxx&＃39;,

&＃39;&＃39;,

&＃39;/usr/bin&＃39;,

&＃39;/usr/lib/python35.zip&＃39;,

&＃39;/usr/lib/python3.5&＃39;,

&＃39;/usr/lib/python3.5/plat-x86_64-linux-gnu&＃39;,

&＃39;/usr/lib/python3.5/lib-dynload&＃39;,

&＃39;/usr/local/lib/python3.5/dist-packages&＃39;,

&＃39;/usr/lib/python3/dist-packages&＃39;,

&＃39;/usr/lib/python3/dist-packages/IPython/extensions&＃39;,

&＃39;/home/python/.ipython&＃39;]

2. 重新导入模块

模块被导入后&＃xff0c;import module不能重新导入模块&＃xff0c;重新导入需用reload

3. 多模块开发时的注意点

# recv_msg.py模块from common importRECV_DATA_LIST#from common import HANDLE_FLAG

importcommondefrecv_msg():"""模拟接收到数据&＃xff0c;然后添加到common模块中的列表中"""

print("--->recv_msg")for i in range(5):

RECV_DATA_LIST.append(i)deftest_recv_data():"""测试接收到的数据"""

print("--->test_recv_data")print(RECV_DATA_LIST)defrecv_msg_next():"""已经处理完成后&＃xff0c;再接收另外的其他数据"""

print("--->recv_msg_next")#if HANDLE_FLAG:

ifcommon.HANDLE_FLAG:print("------发现之前的数据已经处理完成&＃xff0c;这里进行接收其他的数据(模拟过程...)----")else:print("------发现之前的数据未处理完&＃xff0c;等待中....------")

#handle_msg.py模块

from common importRECV_DATA_LIST#from common import HANDLE_FLAG

importcommondefhandle_data():"""模拟处理recv_msg模块接收的数据"""

print("--->handle_data")for i inRECV_DATA_LIST:print(i)#既然处理完成了&＃xff0c;那么将变量HANDLE_FLAG设置为True&＃xff0c;意味着处理完成

#global HANDLE_FLAG

#HANDLE_FLAG &＃61; True

common.HANDLE_FLAG &＃61;Truedeftest_handle_data():"""测试处理是否完成&＃xff0c;变量是否设置为True"""

print("--->test_handle_data")#if HANDLE_FLAG:

ifcommon.HANDLE_FLAG:print("&＃61;&＃61;&＃61;&＃61;&＃61;已经处理完成&＃61;&＃61;&＃61;&＃61;")else:print("&＃61;&＃61;&＃61;&＃61;&＃61;未处理完成&＃61;&＃61;&＃61;&＃61;")

#main.py模块

from recv_msg import *

from handle_msg import *

defmain():#1. 接收数据

recv_msg()#2. 测试是否接收完毕

test_recv_data()#3. 判断如果处理完成&＃xff0c;则接收其它数据

recv_msg_next()#4. 处理数据

handle_data()#5. 测试是否处理完毕

test_handle_data()#6. 判断如果处理完成&＃xff0c;则接收其它数据

recv_msg_next()if __name__ &＃61;&＃61; "__main__":

main()

以上面的图&＃xff0c;如果其他两个模块使用“import common”&＃xff0c;那就是都指向同一个模块common&＃xff1b;如果使用“from common import HANDLE_FLAG”&＃xff0c;那么一开始就是HANDLE_FLAG直接指向common里面的HANDLE_FLAG而已&＃xff0c;没有指向common&＃xff0c;在后面的“HANDLE_FLAG &＃61; True”属于赋值语句&＃xff0c;不会改变common里面的HANDLE_FLAG&＃xff0c;而是重新创建一个值True&＃xff0c;并指向它。(当然如果指向的值是列表list&＃xff0c;那么采用".append"时&＃xff0c;就可以修改common模块里面的值&＃xff0c;但如果还是采用赋值语句就不行&＃xff0c;相当于重新开辟一块内存空间了。)

为啥要封装

好处

在使用面向过程编程时&＃xff0c;当需要对数据处理时&＃xff0c;需要考虑用哪个模板中哪个函数来进行操作&＃xff0c;但是当用面向对象编程时&＃xff0c;因为已经将数据存储到了这个独立的空间中&＃xff0c;这个独立的空间(即对象)中通过一个特殊的变量(__class__)能够获取到类(模板)&＃xff0c;而且这个类中的方法是有一定数量的&＃xff0c;与此类无关的将不会出现在本类中&＃xff0c;因此需要对数据处理时&＃xff0c;可以很快速的定位到需要的方法是谁这样更方便

全局变量是只能有1份的&＃xff0c;多很多个函数需要多个备份时&＃xff0c;往往需要利用其它的变量来进行储存&＃xff1b;而通过封装会将用来存储数据的这个变量变为了对象中的一个“全局”变量&＃xff0c;只要对象不一样那么这个变量就可以再有1份&＃xff0c;所以这样更方便

代码划分更清晰

推荐阅读

include
在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决

在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤，并针对常见的问题提供了有效的解决方案。通过本文的指导，读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]

蜡笔小新 2024-11-11 19:02:49
web
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
buffer
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
filter
Python 忽略警告和错误的方法详解

本文详细介绍了如何在 Python 中忽略警告和错误，提供了多种实现方法，并解释了其背后的原理。对于希望提高代码健壮性和可读性的开发者来说，这些方法非常实用。 ... [详细]

蜡笔小新 2024-11-12 10:06:17
filter
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
command
利用Python Paramiko库批量更新多台服务器的登录密码

本文介绍了如何使用Python的Paramiko库批量更新多台服务器的登录密码。通过示例代码展示了具体实现方法，确保了操作的高效性和安全性。Paramiko库提供了强大的SSH2协议支持，使得远程服务器管理变得更加便捷。此外，文章还详细说明了代码的各个部分，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:17:23
tree
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
bit
您的数据库配置是否安全？DBSAT工具助您一臂之力！

本文探讨了Oracle提供的免费工具DBSAT，该工具能够有效协助用户检测和优化数据库配置的安全性。通过全面的分析和报告，DBSAT帮助用户识别潜在的安全漏洞，并提供针对性的改进建议，确保数据库系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-11-11 14:44:47
include
Android 构建基础流程详解

Android 构建基础流程详解 ... [详细]

蜡笔小新 2024-11-10 15:45:20
c语言
深入解析MDK链接脚本的应用与优化技巧

本文深入探讨了MDK链接脚本的应用与优化技巧。首先，文章介绍了链接脚本的基本概念及其在嵌入式系统开发中的重要性。接着，通过具体实例详细分析了链接脚本的结构和功能，特别是在程序在FLASH中运行时，如何优化链接脚本以提高系统性能。此外，文章还讨论了无需将程序加载到SRAM中的技术细节，为开发者提供了实用的参考和指导。 ... [详细]

蜡笔小新 2024-11-10 12:32:30
format
【源自百度知识】批处理技术详解与应用

本文详细介绍了批处理技术的基本概念及其在实际应用中的重要性。首先，对简单的批处理内部命令进行了概述，重点讲解了Echo命令的功能，包括如何打开或关闭回显功能以及显示消息。如果没有指定任何参数，Echo命令会显示当前的回显设置。此外，文章还探讨了批处理技术在自动化任务执行、系统管理等领域的广泛应用，为读者提供了丰富的实践案例和技术指导。 ... [详细]

蜡笔小新 2024-11-09 10:19:25
php
深入解析Java多线程同步机制与应用

本文深入探讨了Java多线程环境下的同步机制及其应用，重点介绍了`synchronized`关键字的使用方法和原理。`synchronized`关键字主要用于确保多个线程在访问共享资源时的互斥性和原子性。通过具体示例，如在一个类中使用`synchronized`修饰方法，展示了如何实现线程安全的代码块。此外，文章还讨论了`ReentrantLock`等其他同步工具的优缺点，并提供了实际应用场景中的最佳实践。 ... [详细]

蜡笔小新 2024-11-08 16:11:26
case
Scala学习指南：从零开始掌握基础

本指南从零开始介绍Scala编程语言的基础知识，重点讲解了Scala解释器REPL（读取-求值-打印-循环）的使用方法。REPL是Scala开发中的重要工具，能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习，读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]

蜡笔小新 2024-11-07 18:07:59
format
Python编程实现足球联赛赛程安排的策略与简易示例分析

每年，意甲、德甲、英超和西甲等各大足球联赛的赛程表都是球迷们关注的焦点。本文通过 Python 编程实现了一种生成赛程表的方法，该方法基于蛇形环算法。具体而言，将所有球队排列成两列的环形结构，左侧球队对阵右侧球队，首支队伍固定不动，其余队伍按顺时针方向循环移动，从而确保每场比赛不重复。此算法不仅高效，而且易于实现，为赛程安排提供了可靠的解决方案。 ... [详细]

蜡笔小新 2024-11-07 17:41:40
include
Android中将独立SO库封装进JAR包并实现SO库的加载与调用

在Android开发中，将独立的SO库封装进JAR包并实现其加载与调用是一个常见的需求。本文详细介绍了如何将SO库嵌入到JAR包中，并确保在外部应用调用该JAR包时能够正确加载和使用这些SO库。通过这种方式，开发者可以更方便地管理和分发包含原生代码的库文件，提高开发效率和代码复用性。文章还探讨了常见的问题及其解决方案，帮助开发者避免在实际应用中遇到的坑。 ... [详细]

蜡笔小新 2024-11-07 14:28:55

0Hey0ne

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章