热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

高级python_Python高级

GIL面试题如下描述PythonGIL的概念,以及它对python多线程的影响?编写一个多线程抓取网页的程序,并阐明多线程抓取程序是否可比

GIL面试题如下

描述Python GIL的概念, 以及它对python多线程的影响?编写一个多线程抓取网页的程序,并阐明多线程抓取程序是否可比单线程性能有提升,并解释原因。

he language doesn't require the GIL -- it's only the CPython virtual machine that has historically been unable to shed it.

参考答案:

Python语言和GIL没有半毛钱关系。仅仅是由于历史原因在Cpython虚拟机(解释器),难以移除GIL。

GIL:全局解释器锁。每个线程在执行的过程都需要先获取GIL,保证同一时刻只有一个线程可以执行代码。

线程释放GIL锁的情况: 在IO操作等可能会引起阻塞的system call之前,可以暂时释放GIL,但在执行完毕后,必须重新获取GIL Python 3.x使用计时器(执行时间达到阈值后,当前线程释放GIL)或Python 2.x,tickets计数达到100

Python使用多进程是可以利用多核的CPU资源的。

多线程爬取比单线程性能有提升,因为遇到IO阻塞会自动释放GIL锁

因为GIL的原因,导致python的多线程并不是真正的多线程,一次只能执行一个线程。但是开启多线程也比单线程要好。因此如果运行的是计算密集型,也就是中间没有延时的,就使用进程。如果是io密集型,也就是读写的话,就可以考虑线程和协程。解决python的GIL问题有两个,一个换解释器,这个问题只有在CPython解释器中存在。第二个方法就是使用C语言编写子线程,然后导入进Python程序中。

深拷贝、浅拷贝

1. 浅拷贝

浅拷贝是对于一个对象的顶层拷贝

通俗的理解是:拷贝了引用,并没有拷贝内容

2. 深拷贝

深拷贝是对于一个对象所有层次的拷贝(递归)

进一步理解深拷贝

如果copy.copy拷贝的是元组,那么它不会进行浅拷贝,而仅仅是指向。

原因:元组是不可变类型,那么意味着数据一定不能进行修改,因此用copy.copy的时候它会进行自动判断,如果是元组它就是指向了它。

如果用copy.copy、copy.deepcopy对一个全部都是不可变类型的数据进行拷贝,那么他们结果相同,都是引用指向.。

如果拷贝的是一个拥有可变类型的数据,即使元组是最顶层,那么deepcopy依然是深拷贝,而copy.copy还是指向。

拷贝的其他方式

分片表达式可以赋值一个序列

字典的copy方法可以拷贝一个字典

注意点

浅拷贝对不可变类型和可变类型的copy不同

copy.copy对于可变类型,会进行浅拷贝

copy.copy对于不可变类型,不会拷贝,仅仅是指向

import导入模块

import aa 的过程是首先导入 aa这个模块,然后在当前程序中创建aa这个变量指向这个模块。

1. import 搜索路径

路径搜索

从上面列出的目录里依次查找要导入的模块文件

'' 表示当前路径

列表中的路径的先后顺序代表了python解释器在搜索模块时的先后顺序

程序执行时添加新的模块路径

sys.path.append('/home/itcast/xxx')

sys.path.insert(0, '/home/itcast/xxx') # 可以确保先搜索这个路径

In [37]: sys.path.insert(0,"/home/python/xxxx")

In [38]: sys.path

Out[38]:

['/home/python/xxxx',

'',

'/usr/bin',

'/usr/lib/python35.zip',

'/usr/lib/python3.5',

'/usr/lib/python3.5/plat-x86_64-linux-gnu',

'/usr/lib/python3.5/lib-dynload',

'/usr/local/lib/python3.5/dist-packages',

'/usr/lib/python3/dist-packages',

'/usr/lib/python3/dist-packages/IPython/extensions',

'/home/python/.ipython']

2. 重新导入模块

模块被导入后,import module不能重新导入模块,重新导入需用reload

3. 多模块开发时的注意点

# recv_msg.py模块from common importRECV_DATA_LIST#from common import HANDLE_FLAG

importcommondefrecv_msg():"""模拟接收到数据,然后添加到common模块中的列表中"""

print("--->recv_msg")for i in range(5):

RECV_DATA_LIST.append(i)deftest_recv_data():"""测试接收到的数据"""

print("--->test_recv_data")print(RECV_DATA_LIST)defrecv_msg_next():"""已经处理完成后,再接收另外的其他数据"""

print("--->recv_msg_next")#if HANDLE_FLAG:

ifcommon.HANDLE_FLAG:print("------发现之前的数据已经处理完成,这里进行接收其他的数据(模拟过程...)----")else:print("------发现之前的数据未处理完,等待中....------")

#handle_msg.py模块

from common importRECV_DATA_LIST#from common import HANDLE_FLAG

importcommondefhandle_data():"""模拟处理recv_msg模块接收的数据"""

print("--->handle_data")for i inRECV_DATA_LIST:print(i)#既然处理完成了,那么将变量HANDLE_FLAG设置为True,意味着处理完成

#global HANDLE_FLAG

#HANDLE_FLAG = True

common.HANDLE_FLAG =Truedeftest_handle_data():"""测试处理是否完成,变量是否设置为True"""

print("--->test_handle_data")#if HANDLE_FLAG:

ifcommon.HANDLE_FLAG:print("=====已经处理完成====")else:print("=====未处理完成====")

#main.py模块

from recv_msg import *

from handle_msg import *

defmain():#1. 接收数据

recv_msg()#2. 测试是否接收完毕

test_recv_data()#3. 判断如果处理完成,则接收其它数据

recv_msg_next()#4. 处理数据

handle_data()#5. 测试是否处理完毕

test_handle_data()#6. 判断如果处理完成,则接收其它数据

recv_msg_next()if __name__ == "__main__":

main()

以上面的图,如果其他两个模块使用“import  common”,那就是都指向同一个模块common;如果使用“from common import HANDLE_FLAG”,那么一开始就是HANDLE_FLAG直接指向common里面的HANDLE_FLAG而已,没有指向common,在后面的“HANDLE_FLAG = True”属于赋值语句,不会改变common里面的HANDLE_FLAG,而是重新创建一个值True,并指向它。(当然如果指向的值是列表list,那么采用".append"时,就可以修改common模块里面的值,但如果还是采用赋值语句就不行,相当于重新开辟一块内存空间了。)

为啥要封装

好处

在使用面向过程编程时,当需要对数据处理时,需要考虑用哪个模板中哪个函数来进行操作,但是当用面向对象编程时,因为已经将数据存储到了这个独立的空间中,这个独立的空间(即对象)中通过一个特殊的变量(__class__)能够获取到类(模板),而且这个类中的方法是有一定数量的,与此类无关的将不会出现在本类中,因此需要对数据处理时,可以很快速的定位到需要的方法是谁 这样更方便

全局变量是只能有1份的,多很多个函数需要多个备份时,往往需要利用其它的变量来进行储存;而通过封装 会将用来存储数据的这个变量 变为了对象中的一个“全局”变量,只要对象不一样那么这个变量就可以再有1份,所以这样更方便

代码划分更清晰



推荐阅读
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • Linux重启网络命令实例及关机和重启示例教程
    本文介绍了Linux系统中重启网络命令的实例,以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法,以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • Java在运行已编译完成的类时,是通过java虚拟机来装载和执行的,java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]
  • 解决github访问慢的问题的方法集锦
    本文总结了国内用户在访问github网站时可能遇到的加载慢的问题,并提供了解决方法,其中包括修改hosts文件来加速访问。 ... [详细]
  • Skywalking系列博客1安装单机版 Skywalking的快速安装方法
    本文介绍了如何快速安装单机版的Skywalking,包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • javascript  – 概述在Firefox上无法正常工作
    我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观:而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 本文讨论了在openwrt-17.01版本中,mt7628设备上初始化启动时eth0的mac地址总是随机生成的问题。每次随机生成的eth0的mac地址都会写到/sys/class/net/eth0/address目录下,而openwrt-17.01原版的SDK会根据随机生成的eth0的mac地址再生成eth0.1、eth0.2等,生成后的mac地址会保存在/etc/config/network下。 ... [详细]
  • 树莓派语音控制的配置方法和步骤
    本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助,文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行,然后使用Eoman的控制方法,即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]
author-avatar
0Hey0ne
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有