当前位置: 开发笔记 > 前端 > 正文

Pyinstaller打包Scrapy项目的实现步骤

作者：无为南子_274 | 来源：互联网 | 2022-07-07 22:09

这篇文章主要介绍了Pyinstaller打包Scrapy项目的实现步骤，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

1.安装pyinstaller https://www.jb51.net/article/177160.htm

2.安装pywin32 https://www.jb51.net/article/187388.htm

3.安装其他模块

注意点:

scrapy用pyinstaller打包不能用

cmdline.execute('scrapy crawl douban -o test.csv --nolog'.split())

我用的是CrawlerProcess方式来输出

举个栗子：

1、在scrapy项目根目录下建一个crawl.py(你可以自己定义)如下图

cralw.py代码如下

# -*- coding: utf-8 -*-
from scrapy.crawler import CrawlerProcess
from scrapy.utils.project import get_project_settings
from douban.spiders.douban_spider import Douban_spider

#打包需要的import
import urllib.robotparser
import scrapy.spiderloader
import scrapy.statscollectors
import scrapy.logformatter
import scrapy.dupefilters
import scrapy.squeues
import scrapy.extensions.spiderstate
import scrapy.extensions.corestats
import scrapy.extensions.telnet
import scrapy.extensions.logstats
import scrapy.extensions.memusage
import scrapy.extensions.memdebug
import scrapy.extensions.feedexport
import scrapy.extensions.closespider
import scrapy.extensions.debug
import scrapy.extensions.httpcache
import scrapy.extensions.statsmailer
import scrapy.extensions.throttle
import scrapy.core.scheduler
import scrapy.core.engine
import scrapy.core.scraper
import scrapy.core.spidermw
import scrapy.core.downloader
import scrapy.downloadermiddlewares.stats
import scrapy.downloadermiddlewares.httpcache
import scrapy.downloadermiddlewares.COOKIEs
import scrapy.downloadermiddlewares.useragent
import scrapy.downloadermiddlewares.httpproxy
import scrapy.downloadermiddlewares.ajaxcrawl
import scrapy.downloadermiddlewares.chunked
import scrapy.downloadermiddlewares.decompression
import scrapy.downloadermiddlewares.defaultheaders
import scrapy.downloadermiddlewares.downloadtimeout
import scrapy.downloadermiddlewares.httpauth
import scrapy.downloadermiddlewares.httpcompression
import scrapy.downloadermiddlewares.redirect
import scrapy.downloadermiddlewares.retry
import scrapy.downloadermiddlewares.robotstxt
import scrapy.spidermiddlewares.depth
import scrapy.spidermiddlewares.httperror
import scrapy.spidermiddlewares.offsite
import scrapy.spidermiddlewares.referer
import scrapy.spidermiddlewares.urllength
import scrapy.pipelines
import scrapy.core.downloader.handlers.http
import scrapy.core.downloader.contextfactory

from douban.pipelines import DoubanPipeline
from douban.items import DoubanItem
import douban.settings

if __name__ == '__main__':
  setting = get_project_settings()
  process = CrawlerProcess(settings=setting)
  process.crawl(Douban_spider)
  process.start()

2、在crawl.py目录下pyinstaller crawl.py 生成dist，build（可删）和crawl.spec（可删）。

3、在crawl.exe目录下创建文件夹scrapy，然后到自己安装的scrapy文件夹中把VERSION和mime.types两个文件复制到刚才创建的scrapy文件夹中。

4、发布程序包括douban/dist 和douban/scrapy.cfg

如果没有scrapy.cfg无法读取settings.py和pipelines.py的配置

5、在另外一台机器上测试成功

6、对于自定义的pipelines和settings，貌似用pyinstaller打包后的 exe无法读取到settings和pipelines，哪位高手看看能解决这个问题？？？

到此这篇关于Pyinstaller打包Scrapy项目的实现步骤的文章就介绍到这了,更多相关Pyinstaller打包Scrapy内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

https
ajax

推荐阅读

dom
理解文档对象模型（DOM）

本文介绍了文档对象模型（DOM）的基本概念，包括其作为HTML文档的节点树结构，以及如何通过JavaScript操作DOM来实现网页的动态交互。 ... [详细]

蜡笔小新 2024-12-19 06:28:15
build
Spring Boot 解决 AJAX 跨域请求及自定义 Headers 方法

本文探讨了浏览器的同源策略限制及其对 AJAX 请求的影响，并详细介绍了如何在 Spring Boot 应用中优雅地处理跨域请求，特别是当请求包含自定义 Headers 时的解决方案。 ... [详细]

蜡笔小新 2024-12-17 13:57:01
css
理解ServletContext的作用与应用

ServletContext接口在Java Web开发中扮演着重要角色，它提供了一种方式来获取关于整个Web应用程序的信息。通过ServletContext，开发者可以访问初始化参数、共享数据以及应用资源。 ... [详细]

蜡笔小新 2024-12-15 19:48:20
html
使用AJAX动态加载列表数据并展示

AJAX技术允许网页在不重新加载整个页面的情况下进行异步更新，通过向服务器发送请求并接收JSON格式的数据，实现局部内容的动态刷新。 ... [详细]

蜡笔小新 2024-12-14 17:11:55
view
C# 对象转 JSON 字符串的方法与应用

本文介绍如何在 C# 中使用一般处理程序（ASHX）将对象转换为 JSON 字符串，并通过设置响应类型为 application/json 来确保客户端能够正确解析返回的数据。同时，文章还提供了 HTML 页面中不依赖 jQuery 的 AJAX 方法来接收和处理这些 JSON 数据的具体实现。 ... [详细]

蜡笔小新 2024-12-12 11:43:02
dom
JavaScript前端开发中常用的四种继承方法详解

本文深入探讨了JavaScript中实现继承的四种常见方法，包括原型链继承、构造函数继承、组合继承和寄生组合继承。对于正在学习或从事Web前端开发的技术人员来说，理解这些继承模式对于提高代码质量和维护性至关重要。 ... [详细]

蜡笔小新 2024-12-18 11:08:28
firefox
使用WebBrowser控件实现点击输入框显示图片验证码的方法

本文探讨了如何通过WebBrowser控件在用户点击输入框时自动显示图片验证码。该过程可能涉及JavaScript事件的触发与响应。 ... [详细]

蜡笔小新 2024-12-17 18:28:07
dom
深入解析ES6至ES8的新特性与应用

本文详细介绍了自2015年发布的ECMAScript 6.0（简称ES6）以来，JavaScript语言的多项重要更新，旨在帮助开发者更好地理解和利用这些新特性进行复杂应用的开发。 ... [详细]

蜡笔小新 2024-12-17 12:11:23
html
Python爬虫实战：51CTO学院IT课程数据抓取

本文将介绍如何利用Python爬虫技术抓取国内主流在线学习平台的数据，并以51CTO学院为例，进行详细的技术解析和实践操作。 ... [详细]

蜡笔小新 2024-12-17 11:53:33
view
深入分析十大PHP开发框架

随着PHP技术的发展，各类开发框架层出不穷，成为了开发者们热议的话题。本文将详细介绍并对比十款主流的PHP开发框架，旨在帮助开发者根据自身需求选择最合适的工具。 ... [详细]

蜡笔小新 2024-12-17 11:15:55
build
WPF/E CTP与SDK即将发布，引领RIA新时代？

Microsoft即将发布WPF/E的CTP（Community Technology Preview）和SDK，标志着RIA（Rich Internet Application）技术的新里程碑。更多详情及下载链接请参见MSDN官方页面。 ... [详细]

蜡笔小新 2024-12-16 16:06:18
build
网页游戏开发流程详解

本文深入探讨网页游戏的开发流程，涵盖从程序框架设计到具体实现的技术细节，旨在为开发者提供全面的指导。 ... [详细]

蜡笔小新 2024-12-15 19:38:30
js
在JavaScript中动态引用PHP变量的方法

本文探讨了如何在JavaScript中动态地引用由PHP生成的变量，特别是在循环中变量名随迭代变化的情况。通过示例代码展示了实现这一功能的具体步骤。 ... [详细]

蜡笔小新 2024-12-15 17:55:31
html
深入理解JavaScript中的闭包与柯里化

本文详细探讨了JavaScript中的闭包与柯里化技术，这两者是函数式编程的重要组成部分，对提升代码的灵活性和可维护性具有重要作用。 ... [详细]

蜡笔小新 2024-12-14 15:56:15
html
Vue 中的数据更新问题解析

探讨在 Vue 框架中遇到的数据更新延迟或失败的问题，并提供解决方案。 ... [详细]

蜡笔小新 2024-12-14 10:21:49

无为南子_274

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章