当前位置: 开发笔记 > 编程语言 > 正文

【小破站下载工具】Pythontkinter实现网站下载工具，所有数据一键获取

作者：imjob1234_34706 | 来源：互联网 | 2023-09-15 10:30

开发环境

python 3.8: 解释器
pycharm: 代码编辑器

本次项目案例步骤

先确定想要的功能&＃xff0c;今天这个项目的主要功能为三个

视频
评论
弹幕

创建一个简单的用户交互界面&＃xff0c;简洁明了

先展示下完成品的效果

界面

导入模块

import tkinter as tk from tkinter import ttk import tkinter.messagebox

先创建个窗口

root &＃61; tk.Tk() root.title(&＃39;哔站下载软件&＃39;) root.geometry(&＃39;367x134&＃43;200&＃43;200&＃39;) # 透明度的值:0~1 也可以是小数点&＃xff0c;0&＃xff1a;全透明&＃xff1b;1&＃xff1a;全不透明 root.attributes("-alpha", 0.9)root.mainloop()

功能按键

text_label_1 &＃61; tk.Label(root, text&＃61;&＃39;选择: &＃39;, font&＃61;(&＃39;黑体&＃39;, 15)) text_label_1.grid(row&＃61;1, column&＃61;0, padx&＃61;5, pady&＃61;5)number_int_var &＃61; tk.StringVar() # 创建一个下拉列表 numberChosen &＃61; ttk.Combobox(root, textvariable&＃61;number_int_var, width&＃61;26) # 设置下拉列表的值 numberChosen[&＃39;values&＃39;] &＃61; (&＃39;视频&＃39;, &＃39;弹幕&＃39;, &＃39;评论&＃39;) # 设置其在界面中出现的位置 column代表列 row 代表行 numberChosen.grid(row&＃61;1, column&＃61;1, padx&＃61;5, pady&＃61;5) # 设置下拉列表默认显示的值&＃xff0c;0为 numberChosen[&＃39;values&＃39;] 的下标值 numberChosen.current(0)text_label &＃61; tk.Label(root, text&＃61;&＃39;BV号:&＃39;, font&＃61;(&＃39;黑体&＃39;, 15)) text_label.grid(row&＃61;2, column&＃61;0, padx&＃61;5, pady&＃61;5)bv_va &＃61; tk.Variable() entry_1 &＃61; tk.Entry(root, font&＃61;(&＃39;黑体&＃39;, 15), textvariable&＃61;bv_va) entry_1.grid(row&＃61;2, column&＃61;1)Button_1 &＃61; tk.Button(root, text&＃61;&＃39;下载&＃39;, font&＃61;(&＃39;黑体&＃39;, 13)) Button_1.grid(row&＃61;2, column&＃61;2, padx&＃61;5, pady&＃61;5)

主要功能代码编写

功能一

我们用正则来提取数据
正则表达式 —> 对于字符串数据类型进行提取/解析
re模块findall() ----> 告诉程序从什么地方去找什么数据
re.findall() &＃39;“title”:“(.?)“,“pubdate”&＃39;, response.text
从 response.text 里面去找 “title”:”(.?)”,“pubdate” 其中括号里内容就是我们要的

def Video(bv_id):url &＃61; f&＃39;https://www.bilibili.com/video/{bv_id}&＃39;# 把python代码伪装成浏览器 ---> 在开发者工具里面直接复制粘贴headers &＃61; {# 防盗链&＃39;referer&＃39;: &＃39;https://www.bilibili.com/video/&＃39;,# 浏览器基本身份标识表示浏览器&＃39;user-agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36&＃39;}# 发送请求 ---> 响应对象, 200状态码表示请求成功response &＃61; requests.get(url&＃61;url, headers&＃61;headers)# 获取视频标题title &＃61; re.findall(&＃39;"title":"(.*?)","pubdate"&＃39;, response.text)[0].replace(&＃39; &＃39;, &＃39;&＃39;)# 获取视频数据信息前端标签两个两个一起html_data &＃61; re.findall(&＃39;&＃39;, response.text)[0]# 转换数据类型字符串数据转成json字典数据类型json_data &＃61; json.loads(html_data)audio_url &＃61; json_data[&＃39;data&＃39;][&＃39;dash&＃39;][&＃39;audio&＃39;][0][&＃39;baseUrl&＃39;]video_url &＃61; json_data[&＃39;data&＃39;][&＃39;dash&＃39;][&＃39;video&＃39;][0][&＃39;baseUrl&＃39;]audio_content &＃61; requests.get(url&＃61;audio_url, headers&＃61;headers).contentvideo_content &＃61; requests.get(url&＃61;video_url, headers&＃61;headers).contentif not os.path.exists(&＃39;video\\&＃39;):os.mkdir(&＃39;video\\&＃39;)with open(&＃39;video\\&＃39; &＃43; title &＃43; &＃39;.mp3&＃39;, mode&＃61;&＃39;wb&＃39;) as audio:audio.write(audio_content)with open(&＃39;video\\&＃39; &＃43; title &＃43; &＃39;.mp4&＃39;, mode&＃61;&＃39;wb&＃39;) as video:video.write(video_content)return title

功能二

这个功能&＃xff0c;前段时间已经发布过相关的文章教程
请看这里&＃xff1a;用Python获取弹幕的两种方式&＃xff08;一种简单但量少&＃xff0c;另一量大管饱&＃xff09;

def get_response(html_url):headers &＃61; {&＃39;user-agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36&＃39;}response &＃61; requests.get(url&＃61;html_url, headers&＃61;headers)response.encoding &＃61; response.apparent_encodingreturn responsedef get_Dm_url(bv_id):link &＃61; f&＃39;https://www.ibilibili.com/video/{bv_id}/&＃39;html_data &＃61; get_response(link).textDm_url &＃61; re.findall(&＃39;弹幕&＃39;, html_data)[0]title &＃61; re.findall(&＃39;, html_data)[-1]return Dm_url, titledef get_Dm_content(Dm_url, title):html_data &＃61; get_response(Dm_url).textcontent_list &＃61; re.findall(&＃39;(.*?)&＃39;, html_data)if not os.path.exists(&＃39;弹幕\\&＃39;):os.mkdir(&＃39;弹幕\\&＃39;)for content in content_list:with open(f&＃39;弹幕\\{title}弹幕.txt&＃39;, mode&＃61;&＃39;a&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f:f.write(content)f.write(&＃39;\n&＃39;)def main(bv_id):Dm_url, title &＃61; get_Dm_url(bv_id)get_Dm_content(Dm_url, title)

功能三

单页少量的数据很简单&＃xff0c;但要想翻页&＃xff0c;必须分析网站&＃xff0c;找到规律

def get_response(html_url, params&＃61;None):headers &＃61; {&＃39;user-agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36&＃39;}response &＃61; requests.get(url&＃61;html_url, params&＃61;params, headers&＃61;headers)return responsedef get_oid(bv_id):link &＃61; f&＃39;https://www.bilibili.com/video/{bv_id}/&＃39;html_data &＃61; get_response(link).textoid &＃61; re.findall(&＃39;window.__INITIAL_STATE__&＃61;{"aid":(\d&＃43;),&＃39;, html_data)[0]title &＃61; re.findall(&＃39;"title":"(.*?)","pubdate"&＃39;, html_data)[0].replace(&＃39; &＃39;, &＃39;&＃39;)return oid, titledef get_content(oid, page, title):content_url &＃61; &＃39;https://api.bilibili.com/x/v2/reply/main&＃39;data &＃61; {&＃39;csrf&＃39;: &＃39;6b0592355acbe9296460eab0c0a0b976&＃39;,&＃39;mode&＃39;: &＃39;3&＃39;,&＃39;next&＃39;: page,&＃39;oid&＃39;: oid,&＃39;plat&＃39;: &＃39;1&＃39;,&＃39;type&＃39;: &＃39;1&＃39;,}json_data &＃61; get_response(content_url, data).json()content &＃61; &＃39;\n&＃39;.join([i[&＃39;content&＃39;][&＃39;message&＃39;] for i in json_data[&＃39;data&＃39;][&＃39;replies&＃39;]])if not os.path.exists(&＃39;评论\\&＃39;):os.mkdir(&＃39;评论\\&＃39;)with open(f&＃39;评论\\{title}评论.txt&＃39;, mode&＃61;&＃39;a&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f:f.write(content)def main(bv_id):oid, title &＃61; get_oid(bv_id)for page in range(1, 6):try:get_content(oid, page, title)except:pass

&＃x1f447;问题解答 · 源码获取 · 技术交流 · 抱团学习请联系&＃x1f447;

推荐阅读

string
使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例

本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤，可以获取到网站首页的新闻数据。代码示例使用Python编写，并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-12 19:16:21
string
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
string
lua语言闭包、模式匹配、日期、编译、模块的特性及应用

本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值，函数可以作为变量自由传递，也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性，为程序开发带来了便利。 ... [详细]

蜡笔小新 2023-12-14 18:18:21
string
【译】发送表单数据

这是原文链接：sendingformdata许多情况下，我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单，但是 ... [详细]

蜡笔小新 2023-12-14 16:19:10
string
拥抱Android Design Support Library新变化（导航视图、悬浮ActionBar）

转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一，为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]

蜡笔小新 2023-12-13 16:11:00
range
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
range
响应式页面的概述和实现方式

本文介绍了响应式页面的概念和实现方式，包括针对不同终端制作特定页面和制作一个页面适应不同终端的显示。分析了两种实现方式的优缺点，提出了选择方案的建议。同时，对于响应式页面的需求和背景进行了讨论，解释了为什么需要响应式页面。 ... [详细]

蜡笔小新 2023-12-11 12:37:10
range
JS实现一键分享功能

本文介绍了如何使用JS实现一键分享功能，并提供了2019独角兽企业招聘Python工程师的标准。同时，给出了分享到QQ空间、新浪微博和人人网的链接。 ... [详细]

蜡笔小新 2023-12-10 19:55:57
range
Skywalking系列博客1安装单机版 Skywalking的快速安装方法

本文介绍了如何快速安装单机版的Skywalking，包括下载、环境需求和端口检查等步骤。同时提供了百度盘下载地址和查询端口是否被占用的命令。 ... [详细]

蜡笔小新 2023-12-14 19:05:47
select
实现下拉列表，点击其他位置自动隐藏效果的三种方式比较

目录实现效果：实现环境实现方法一：基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]

蜡笔小新 2023-12-14 15:03:14
select
web.py开发web 第八章 Formalchemy 服务端验证方法

本文介绍了在web.py开发中使用Formalchemy进行服务端表单数据验证的方法。以User表单为例，详细说明了对各字段的验证要求，包括必填、长度限制、唯一性等。同时介绍了如何自定义验证方法来实现验证唯一性和两个密码是否相等的功能。该文提供了相关代码示例。 ... [详细]

蜡笔小新 2023-12-12 16:36:00
install
phpcomposer 那个中文镜像是不是凉了

phpcomposer 那个中文镜像是不是凉了 ... [详细]

蜡笔小新 2023-12-12 16:01:05
export
C#导入、导出功能

导出功能protectedvoidbtnExport(objectsender,EventArgse){用来打开下载窗口stringfileName中 ... [详细]

蜡笔小新 2023-12-12 14:34:29
controller
ScrollView嵌套Collectionview无痕衔接四向滚动，支持自定义TitleView

本文介绍了如何实现ScrollView嵌套Collectionview无痕衔接四向滚动，并支持自定义TitleView。通过使用MainScrollView作为最底层，headView作为上部分，TitleView作为中间部分，Collectionview作为下面部分，实现了滚动效果。同时还介绍了使用runtime拦截_notifyDidScroll方法来实现滚动代理的方法。具体实现代码可以在github地址中找到。 ... [详细]

蜡笔小新 2023-12-12 11:38:19
perl
欢乐的票圈重构之旅——RecyclerView的头尾布局增加

项目重构的Git地址：https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集：http:www.jianshu.comno ... [详细]

蜡笔小新 2023-12-11 19:09:56