当前位置: 开发笔记 > 编程语言 > 正文

python并发打开网页_python并发_线程

作者：吴佳云怡婷志贤 | 来源：互联网 | 2024-11-17 13:24

关于进程的复习：#管道#数据的共享Managerdictlist#进程池#cpu个数1#retmap(func,iterable)#异步自带close和join#所有

关于进程的复习&＃xff1a;

# 管道

# 数据的共享 Manager dict list

# 进程池

# cpu个数&＃43;1

# ret &＃61; map(func,iterable)

# 异步自带close和join

# 所有结果的[]

# apply

# 同步的:只有当func执行完之后,才会继续向下执行其他代码

# ret &＃61; apply(func,args&＃61;())

# 返回值就是func的return

# apply_async

# 异步的:当func被注册进入一个进程之后,程序就继续向下执行

# apply_async(func,args&＃61;())

# 返回值 : apply_async返回的对象obj

# 为了用户能从中获取func的返回值obj.get()

# get会阻塞直到对应的func执行完毕拿到结果

# 使用apply_async给进程池分配任务,

# 需要先close后join来保持多进程和主进程代码的同步性

# 回调函数是在主进程中执行的

from multiprocessing import Pool

def func1(n):

return n&＃43;1

def func2(m):

print(m)

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

p &＃61; Pool(5)

for i in range(10,20):

p.apply_async(func1,args&＃61;(i,),callback&＃61;func2)

p.close()

p.join()

import requests

from urllib.request import urlopen

from multiprocessing import Pool

## 爬取字节数的例子&＃xff1a;

def get(url):

response &＃61; requests.get(url)

if response.status_code &＃61;&＃61; 200:

return url,response.content.decode(&＃39;utf-8&＃39;)

# def get_urllib(url):

# ret &＃61; urlopen(url)

# return ret.read().decode(&＃39;utf-8&＃39;)

def call_back(args):

url,content &＃61; args

print(url,len(content))

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

url_lst &＃61; [

&＃39;https://www.cnblogs.com/&＃39;,

&＃39;http://www.baidu.com&＃39;,

&＃39;https://www.sogou.com/&＃39;,

&＃39;http://www.sohu.com/&＃39;,

]

p &＃61; Pool(5)

for url in url_lst:

p.apply_async(get,args&＃61;(url,),callback&＃61;call_back)

p.close()

p.join()

线程&＃xff1a;

import os

import time

from threading import Thread

## 多线程并发

# def func(a, b):

# n &＃61; a &＃43; b

# print(n, os.getpid()) # 都在一个进程中

# print(&＃39;主线程&＃39;, os.getpid()) # 都在一个进程中

# for i in range(10):

# t &＃61; Thread(target&＃61;func, args&＃61;(i, 6))

# t.start()

## 同一进程中的各个线程&＃xff0c;都可以共享该进程所拥有的资源

# def func(a,b):

# global g

# g &＃61; 0

# print(g,os.getpid())

# g &＃61; 100

# t_lst &＃61; []

# for i in range(10):

# t &＃61; Thread(target&＃61;func,args&＃61;(i,5))

# t.start()

# t_lst.append(t)

# for t in t_lst : t.join()

# print(g)

## 继承类实现

# class MyThread(Thread):

# # 重写初始化方法

# def __init__(self,arg):

# super().__init__()

# self.arg &＃61; arg

# def run(self):

# time.sleep(1)

# print(&＃39;:::&＃39;,self.arg)

# t &＃61; MyThread(10)

# t.start()

# class Sayhi(Thread):

# def __init__(self,name):

# super().__init__()

# self.name&＃61;name

# def run(self):

# time.sleep(1)

# print(&＃39;%s say hello&＃39; % self.name)

# if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

# t &＃61; Sayhi(&＃39;egon&＃39;)

# t.start()

# print(&＃39;主线程&＃39;)

# https://www.cnblogs.com/Eva-J/articles/8306047.html

# 进程是最小的内存分配单位

# 线程是操作系统调度的最小单位

# 线程直接被CPU执行,进程内至少含有一个线程,也可以开启多个线程

# 开启一个线程所需要的时间要远远小于开启一个进程

# 多个线程内部有自己的数据栈,数据不共享

# 全局变量在多个线程之间是共享的

# GIL锁(即全局解释器锁)

# 在Cpython解释器下的python程序在同一时刻多个线程中只能有一个线程被CPU执行

# 高CPU : 计算类 --- 高CPU利用率

# 如果真的需要高并发&＃xff0c;可使用多进程&＃xff0c;避免多线程GIL锁

# 高IO : 一般程序都不会受GIL影响. 爬取网页 200个网页

# qq聊天 send recv

# 处理日志文件读文件

# 处理web请求

# 读数据库写数据库

import time

from threading import Thread

from multiprocessing import Process

def func(n):

n &＃43; 1

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

start &＃61; time.time()

t_lst &＃61; []

for i in range(100):

t &＃61; Thread(target&＃61;func,args&＃61;(i,))

t.start()

t_lst.append(t)

for t in t_lst:t.join()

t1 &＃61; time.time() - start

## 证明线程比进程快的例子&＃xff1a;

start &＃61; time.time()

t_lst &＃61; []

for i in range(100):

t &＃61; Process(target&＃61;func, args&＃61;(i,))

t.start()

t_lst.append(t)

for t in t_lst: t.join()

t2 &＃61; time.time() - start

print(t1,t2)

Threading模块的其它方法&＃xff1a;

import time

import threading

## Thread实例对象的方法

# isAlive(): 返回线程是否活动的。

# getName(): 返回线程名。

# setName(): 设置线程名。

def wahaha(n):

time.sleep(0.5)

print(n,threading.current_thread(),threading.get_ident())

# print(threading.current_thread().getName())

for i in range(10):

threading.Thread(target&＃61;wahaha,args&＃61;(i,)).start()

# 返回正在运行的线程数量&＃xff0c;与len(threading.enumerate())有相同的结果。

print(threading.active_count()) # 11

print(threading.current_thread()) # 返回当前的线程变量。

# 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前&＃xff0c;不包括启动前和终止后的线程。

print(threading.enumerate())

## https://www.cnblogs.com/Eva-J/articles/8306047.html

守护线程

import time

from threading import Thread

def func1():

while True:

print(&＃39;*&＃39;*10)

time.sleep(1)

def func2():

print(&＃39;in func2&＃39;)

time.sleep(5)

t &＃61; Thread(target&＃61;func1,)

t.daemon &＃61; True

t.start()

t2 &＃61; Thread(target&＃61;func2,)

t2.start()

t2.join() # 等待t2执行完毕

print(&＃39;主线程&＃39;)

# 守护进程随着主进程代码的执行结束而结束

# 守护线程会在主线程结束之后等待其他子线程的结束才结束

# 主进程在执行完自己的代码之后不会立即结束而是等待子进程结束之后回收子进程的资源

#1 主进程在其代码结束后就已经算运行完毕了(守护进程在此时就被回收),然后主进程会一直等非守护的子进程都运行完毕后回收子进程的资源(否则会产生僵尸进程)&＃xff0c;才会结束&＃xff0c;

#2 主线程在其他非守护线程运行完毕后才算运行完毕(守护线程在此时就被回收)。因为主线程的结束意味着进程的结束&＃xff0c;进程整体的资源都将被回收&＃xff0c;

而进程必须保证非守护线程都运行完毕后才能结束。

线程锁&＃xff1a; 互斥锁递归锁

import time

from threading import Lock,Thread

&＃39;&＃39;&＃39;由于线程之间是进行随机调度&＃xff0c;并且每个线程可能只执行n条执行之后&＃xff0c;当多个线程同时修改同一条数据时可能会出现脏数据&＃xff0c;

所以&＃xff0c;出现了线程锁 - 同一时刻允许一个线程执行操作。

&＃39;&＃39;&＃39;

### Lock 互斥锁只有一把钥匙

# def func(lock):

# global n

# lock.acquire() # 加锁

# temp &＃61; n

# time.sleep(0.2)

# n &＃61; temp - 1

# lock.release()

# n &＃61; 10

# t_lst &＃61; []

# lock &＃61; Lock()

# for i in range(10):lkqi

# t &＃61; Thread(target&＃61;func,args&＃61;(lock,)) # 线程锁

# t.start()

# t_lst.append(t)

# for t in t_lst: t.join()

# print(n)

### 科学家吃面问题造成死锁

# noodle_lock &＃61; Lock()

# fork_lock &＃61; Lock()

# def eat1(name):

# noodle_lock.acquire()

# print(&＃39;%s拿到面条啦&＃39;%name)

# fork_lock.acquire()

# print(&＃39;%s拿到叉子了&＃39;%name)

# print(&＃39;%s吃面&＃39;%name)

# fork_lock.release()

# noodle_lock.release()

# def eat2(name):

# fork_lock.acquire()

# print(&＃39;%s拿到叉子了&＃39;%name)

# time.sleep(1)

# noodle_lock.acquire()

# print(&＃39;%s拿到面条啦&＃39;%name)

# print(&＃39;%s吃面&＃39;%name)

# noodle_lock.release()

# fork_lock.release()

# Thread(target&＃61;eat1,args&＃61;(&＃39;alex&＃39;,)).start()

# Thread(target&＃61;eat2,args&＃61;(&＃39;Egon&＃39;,)).start()

# Thread(target&＃61;eat1,args&＃61;(&＃39;bossjin&＃39;,)).start()

# Thread(target&＃61;eat2,args&＃61;(&＃39;nezha&＃39;,)).start()

## 当在同一个进程或线程中用到2把以上的锁时&＃xff0c;就容易产生死锁。

from threading import RLock # 递归锁可以多次使用解决死锁问题

fork_lock &＃61; noodle_lock &＃61; RLock() # 类似于一串上的两把钥匙

def eat1(name):

noodle_lock.acquire() # 一把钥匙

print(&＃39;%s拿到面条啦&＃39;%name)

fork_lock.acquire()

print(&＃39;%s拿到叉子了&＃39;%name)

print(&＃39;%s吃面&＃39;%name)

fork_lock.release()

noodle_lock.release() # 必须全部释放之后&＃xff0c;其它人才能用。

def eat2(name):

fork_lock.acquire()

print(&＃39;%s拿到叉子了&＃39;%name)

time.sleep(1)

noodle_lock.acquire()

print(&＃39;%s拿到面条啦&＃39;%name)

print(&＃39;%s吃面&＃39;%name)

noodle_lock.release()

fork_lock.release()

Thread(target&＃61;eat1,args&＃61;(&＃39;alex&＃39;,)).start()

Thread(target&＃61;eat2,args&＃61;(&＃39;Egon&＃39;,)).start()

Thread(target&＃61;eat1,args&＃61;(&＃39;bossjin&＃39;,)).start()

Thread(target&＃61;eat2,args&＃61;(&＃39;nezha&＃39;,)).start()

线程的信号量&＃xff1a;

# import time

# from threading import Semaphore,Thread

# def func(sem,a,b):

# sem.acquire()

# time.sleep(1)

# print(a&＃43;b)

# sem.release()

# sem &＃61; Semaphore(4)

# for i in range(10):

# t &＃61; Thread(target&＃61;func,args&＃61;(sem,i,i&＃43;5))

# t.start()

&＃39;&＃39;&＃39;互斥锁同时只允许一个线程更改数据&＃xff0c;而Semaphore是同时允许一定数量的线程更改数据 &＃xff0c;

比如厕所有3个坑&＃xff0c;那最多只允许3个人上厕所&＃xff0c;后面的人只能等里面有人出来了才能再进去。

&＃39;&＃39;&＃39;

import threading, time

def run(n):

semaphore.acquire()

time.sleep(1)

print("run the thread: %s" % n)

semaphore.release()

if __name__ &＃61;&＃61; &＃39;__main__&＃39;:

num &＃61; 0

semaphore &＃61; threading.BoundedSemaphore(3) # 最多允许5个线程同时运行

for i in range(12):

t &＃61; threading.Thread(target&＃61;run, args&＃61;(i,))

t.start()

线程的事件&＃xff1a;

# !/usr/bin/env python

# -*- coding:utf-8 -*-

&＃39;&＃39;&＃39;线程的事件用于主线程控制其他线程的执行&＃xff0c;事件主要提供了三个方法 set、wait、clear。

事件处理的机制&＃xff1a;全局定义了一个“Flag”&＃xff0c;如果“Flag”值为 False&＃xff0c;那么当程序执行 event.wait 方法时就会阻塞&＃xff0c;

如果“Flag”值为True&＃xff0c;那么event.wait 方法时便不再阻塞。

&＃39;&＃39;&＃39;

import threading

def do(event):

print(&＃39;start.&＃39;)

event.wait()

print(&＃39;execute&＃39;)

event_obj &＃61; threading.Event() # 默认False

for i in range(6):

t &＃61; threading.Thread(target&＃61;do,args&＃61;(event_obj,))

t.start()

event_obj.clear() # 设为False

input2 &＃61; input(&＃39;>>>&＃39;)

if input2 &＃61;&＃61; &＃39;true&＃39;:

event_obj.set() # 设为 True

# 事件被创建的时候

# False状态

# wait() 阻塞

# True状态

# wait() 非阻塞

# clear 设置状态为False

# set 设置状态为True

定时器 Timer

import time

from threading import Timer

def func():

print(&＃39;时间同步&＃39;) #1-3

while True:

t &＃61; Timer(5,func).start() # 非阻塞的 5秒之后开始

time.sleep(2)

# 定时器&＃xff0c;指定n秒后执行某操作

更多内容&＃xff0c;参考&＃xff1a;http://www.cnblogs.com/wupeiqi/articles/5040827.html

线程队列&＃xff1a;

import queue

# 线程的队列,内置了锁&＃xff0c;保证数据安全

# q &＃61; queue.Queue() # 队列先进先出

# q.put(123)

# print(q.get())

# q.put_nowait(456)

# print(q.get_nowait())

# q &＃61; queue.LifoQueue() # 栈先进后出

# q.put(1)

# q.put(2)

# q.put(3)

# print(q.get())

q &＃61; queue.PriorityQueue() # 优先级队列

q.put((20,&＃39;a&＃39;))

q.put((10,&＃39;b&＃39;))

q.put((30,&＃39;c&＃39;))

q.put((-5,&＃39;f&＃39;))

q.put((-5,&＃39;d&＃39;))

q.put((1,&＃39;?&＃39;))

print(q.get()) # 数字越小&＃xff0c;优先级越高按ascii码顺序

线程池&＃xff1a;https://www.cnblogs.com/Eva-J/articles/8306047.html#_label17

推荐阅读

io
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
io
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
io
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
io
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
install
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
io
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
io
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
eval
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
install
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
io
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
schema
将Web服务部署到Tomcat

本文介绍了如何在JDeveloper 12c中创建一个Java项目，并将其打包为Web服务，然后部署到Tomcat服务器。内容涵盖从项目创建、编写Web服务代码、配置相关XML文件到最终的本地部署和验证。 ... [详细]

蜡笔小新 2024-12-27 11:48:15
io
ImmutableX Poised to Pioneer Web3 Gaming Revolution

ImmutableX is set to spearhead the evolution of Web3 gaming, with its innovative technologies and strategic partnerships driving significant advancements in the industry. ... [详细]

蜡笔小新 2024-12-27 08:55:17
io
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
io
Objective-C 编程中的关键语法点

本文探讨了 Objective-C 中的一些重要语法特性，包括 goto 语句、块（block）的使用、访问修饰符以及属性管理等。通过实例代码和详细解释，帮助开发者更好地理解和应用这些特性。 ... [详细]

蜡笔小新 2024-12-26 19:42:38
main
Python文本处理与可视化：分词及词云生成

本文介绍如何使用Python进行文本处理，包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图，展示文本数据的可视化分析方法。 ... [详细]

蜡笔小新 2024-12-26 08:37:18

吴佳云怡婷志贤

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章