分析Ajax爬取今日头条街拍图片

作者：Yyao | 来源：互联网 | 2023-09-17 15:23

#-*-coding:UTF-8-*-importrequestsimporttimeimportosfromhashlibimportmd5defget_page(off

# -*- coding:UTF-8 -*- import requests import time import os from hashlib import md5def get_page(offset):params &＃61; {&＃39;aid&＃39;: &＃39;24&＃39;,&＃39;app_name&＃39;: &＃39;web_search&＃39;,&＃39;offset&＃39;: offset,&＃39;format&＃39;: &＃39;json&＃39;,&＃39;keyword&＃39;: &＃39;街拍&＃39;,&＃39;autoload&＃39;: &＃39;true&＃39;,&＃39;count&＃39;: &＃39;20&＃39;,&＃39;en_qc&＃39;: &＃39;1&＃39;,&＃39;cur_tab&＃39;: &＃39;1&＃39;,&＃39;from&＃39;: &＃39;search_tab&＃39;,&＃39;pd&＃39;: &＃39;synthesis&＃39;,&＃39;timestamp&＃39;: int(time.time() * 1000)}url &＃61; &＃39;http://www.toutiao.com/search_content/?&＃39;headers &＃61; {&＃39;User-Agent&＃39;: &＃39;Mozilla/5.0 (Windows NT 10.0; Win64; x64) Ap&＃39;&＃39;pleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36&＃39;,&＃39;referer&＃39;: &＃39;https://www.toutiao.com/search/?keyword&＃61;%E8%A1%97%E6%8B%8D&＃39;,&＃39;x-requested-with&＃39;: &＃39;XMLHttpRequest&＃39;}try:response &＃61; requests.get(url&＃61;url, params&＃61;params, headers&＃61;headers)if response.status_code &＃61;&＃61; 200:return response.json()except requests.ConnectionError:return Nonedef get_images(json):if json.get(&＃39;data&＃39;):for item in json.get(&＃39;data&＃39;):if &＃39;title&＃39; in item and &＃39;image_list&＃39; in item and item[&＃39;image_list&＃39;] !&＃61; []:title &＃61; item[&＃39;title&＃39;]images &＃61; item[&＃39;image_list&＃39;]for image in images:yield {&＃39;image&＃39;: image.get(&＃39;url&＃39;),&＃39;title&＃39;: title}def save_image(offset, item):if not os.path.exists(&＃39;picture&＃39;&＃43;str(offset)):os.mkdir(&＃39;picture&＃39;&＃43;str(offset))try:response &＃61; requests.get("http:" &＃43; item.get(&＃39;image&＃39;))if response.status_code &＃61;&＃61; 200:file_path &＃61; &＃39;{0}/{1}.{2}&＃39;.format(&＃39;picture&＃39;&＃43;str(offset), md5(response.content).hexdigest(), &＃39;jpg&＃39;)if not os.path.exists(file_path):with open(file_path, &＃39;wb&＃39;) as f:f.write(response.content)else:print(&＃39;Already Downloaded&＃39;, file_path)except requests.ConnectionError:print(&＃39;Failed to Save Image&＃39;)if __name__ &＃61;&＃61; &＃39;__main__&＃39;:for offset in range(0, 120, 20):json &＃61; get_page(offset)for item in get_images(json):save_image(offset, item)

推荐阅读

object
如何使用Java获取服务器硬件信息和磁盘负载率

本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务，并获取服务器的磁盘信息，并将结果输出。然后在本地使用JS编写一个AJAX脚本，远程请求服务端的程序，得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]

蜡笔小新 2023-12-14 13:56:20
copy
PHP图片截取方法及应用实例

本文介绍了使用PHP动态切割JPEG图片的方法，并提供了应用实例，包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用，以及图片切割的具体步骤。同时，还提供了一些注意事项和优化建议。通过本文的学习，读者可以掌握PHP图片截取的技巧，实现自己的需求。 ... [详细]

蜡笔小新 2023-12-14 16:44:09
import
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
import
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
import
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32
java
开发笔记:Java是如何读取和写入浏览器Cookies的

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Java是如何读取和写入浏览器Cookies的相关的知识，希望对你有一定的参考价值。首先我 ... [详细]

蜡笔小新 2023-12-12 20:18:02
require
javaweb多图片打包下载，弹出提示框问题_html/css_WEBITnose

在springmvc框架中，前台ajax调用方法，对图片批量下载，如何弹出提示保存位置选框？Controller方法 ... [详细]

蜡笔小新 2023-12-12 14:56:31
object
模板引擎StringTemplate的使用方法和特点

本文介绍了模板引擎StringTemplate的使用方法和特点，包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时，还介绍了StringTemplate语法中的属性和普通字符的使用方法，并提供了向模板填充属性的示例代码。 ... [详细]

蜡笔小新 2023-12-11 21:45:03
object
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
object
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
list
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
java
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
email
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
email
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
java
Spring特性实现接口多类的动态调用详解

本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍，以及getBeansOfType方法的应用，解决了在实际工作中遇到的接口及多个实现类的问题。同时，文章还提到了SPI使用的不便之处，并介绍了借助ApplicationContext实现需求的方法。阅读本文，你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]

蜡笔小新 2023-12-14 03:24:19

Yyao

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章