热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【爬虫训练场】:分页爬虫案例设计Demo,PythonFlask与MySQL的完美连接

网站类应用,一定离不开MySQL,所以本案例将带着大家学习一下,通过Flask调用MySQL数据,并实现分页呈现。类被称作蓝图,它是一个存储操作方法的容器,Flask可以通过Blu


文章目录



  • Python Flask 调用 MySQL 数据

  • 建立新的控制器目录

  • 爬虫训练场引入 MySQL 之间的逻辑关系

  • 搭建案例前端页面

  • 本篇博客为大家继续补充一款简易爬虫,主要涉及如下知识点。



    1. Python Flask 调用 MySQL 数据

    2. 分页数据呈现


    Python Flask 调用 MySQL 数据

    网站类应用,一定离不开 MySQL ,所以本案例将带着大家学习一下,通过 Flask 调用 MySQL 数据,并实现分页呈现。

    正式开始前,我们需要提前在 MySQL 中准备一张表,命名为 school_list,其数据通过采集获取,具体可参考博客《【Python 实战】高校数据采集,爬虫训练场项目数据储备》。

    安装 MySQL 操作相关模块。

    pip install flask-sqlalchemy

    使用 Pycharm 安装,可直接在包管理中进行检索。

    9. 爬虫训练场,分页爬虫案例设计Demo,打通 Python Flask 和 MySQL

    新建 config.py 文件,并输入如下代码

    class BaseConfig(object):
    DIALECT = 'mysql'
    DRIVER = 'pymysql'
    USERNAME = 'root'
    PASSWORD = 'root' # 注意不要泄露服务器密码,这里仅供测试使用
    HOST = '127.0.0.1'
    PORT = '3306'
    DATABASE = 'playground'
    SQLALCHEMY_DATABASE_URI = "{}+{}://{}:{}@{}:{}/{}?charset=utf8".format(DIALECT, DRIVER, USERNAME, PASSWORD, HOST,
    PORT, DATABASE)
    SQLALCHEMY_TRACK_MODIFICATIONS = False
    SQLALCHEMY_ECHO = True

    可以看到用户名和密码都在该文件中进行配置,接下来在 app/__init__.py 文件中导入对应模块。

    from flask_sqlalchemy import SQLAlchemy
    db = SQLAlchemy()

    接下来我们先补充一些小知识点,罗列如下所示。

    app.config.from_object() 方法,它用来加载配置文件,稍后将用该方法导入数据库相关配置。

    下面继续看一段代码。

    db = SQLAlchemy()
    db.init_app(app) # 初始化数据库

    db = SQLAlchemy() 用于创建 SQLAlchemy 对象,db.init_app() 初始化链接对象。


    建立新的控制器目录

    app 目录下建立 school 文件夹,然后内部新增两个文件,分别是 __init__.pyindex.py,然后在 index.py 文件中,输入如下代码。

    import sys
    from flask import Blueprint, jsonify
    from ..model import School # 导入上级模块
    ss = Blueprint('school', __name__)
    @school.route('/list')
    def list_school():
    schools = School.query.all()
    print(schools)

    先不要运行项目,我们先说明一下其中涉及的知识点,第一个是 Blueprint 类。

    Blueprint 类被称作蓝图,它是一个存储操作方法的容器,Flask 可以通过 Blueprint 来组织 URL 及处理请求。

    蓝图对象和 Flask 对象使用类似,但需要将其注册到应用对象上才可以生效。

    使用蓝图的三个步骤。

    创建一个蓝图对象

    s = Blueprint('school', __name__,url_prifix='/ss')

    在蓝图对象上进行操作,例如注册路由,指定静态文件,指定过滤器

    @ss.route('/list')
    def list_school():
    schools = School.query.all()
    print(schools)
    return "学校数据"

    在应用对象注册蓝图对象
    返回到 app/__init__.py 文件中,注册蓝图对象。

    from .school.index import *
    app.register_blueprint(s)

    在应用对象上注册一个蓝图时,可以指定 url_prefix 关键字参数(该参数默认是 /),此时启动项目,就可以通过 /ss/ 配合路由,访问指定方法。

    在前文代码中,我们还导入了一个 model 模型模块,在 app 目录中建立 model.py 文件,然后输入如下代码。

    from app import db
    class EntityBase(object):
    def to_json(self):
    fields = self.__dict__
    if "_sa_instance_state" in fields:
    del fields["_sa_instance_state"]
    return fields
    class School(db.Model, EntityBase):
    """
    表名,字段名
    """
    __tablename__ = "school_list"
    id = db.Column(db.Integer, primary_key=True)
    name = db.Column(db.String(255))
    province = db.Column(db.String(255))
    city = db.Column(db.String(255))
    feature = db.Column(db.String(255))
    hotValue = db.Column(db.String(255))
    pic = db.Column(db.String(255))
    category = db.Column(db.String(255))
    batchTimes = db.Column(db.String(255))

    其中 School 类继承自 db.ModelEntityBase,其中的字段与数据库表字段一致。

    接下来再总结一下目前的项目结构,然后橡皮擦会带着大家再次梳理一下各文件之间的引用关系。

    9. 爬虫训练场,分页爬虫案例设计Demo,打通 Python Flask 和 MySQL


    爬虫训练场引入 MySQL 之间的逻辑关系

    playground.py 文件为程序主入口,其内部导入 app 模块,由于 Python 模块导入关系,app 目录中的 __init__.py 文件默认执行。

    __init__.py 文件中包含如下内容:


  • flask 主类初始化;

  • app 配置文件初始化;

  • SQLAlchemy 类初始化;

  • 各路由导入+蓝图注册。
  • 由于需要导入 app 配置,所以这里需要导入 config.py 文件,由于需要导入路由控制器和注册蓝图,所以需要编写下述代码。

    from app import routes
    from app import general
    from .school.index import *
    app.register_blueprint(s)

    为了便于项目管理,在 app 目录中新建立了一个 school 文件夹,并且创建了一个 index.py 文件,用于实现路由函数逻辑,由于该文件需要使用模型 model 相关配置,所以在 app 目录新增一个 model.py 文件,并且实现了第一个模型类 School


    搭建案例前端页面

    本篇博客的最后一个步骤,用来实现前端页面渲染,在 templates 目录建立一个 school 文件夹,并新建 index.html 文件,其中先输入一个 Bootstrap 基本内容即可。

    打开 app/school/index.py 文件,修改 list_school() 函数。

    @s.route('/list')
    def list_school():
    schools = School.query.all()
    school_output = []
    for s_item in schools:
    school_output.append(s_item.to_json())
    return render_template('school/index.html')

    运行代码,页面成功渲染。

    9. 爬虫训练场,分页爬虫案例设计Demo,打通 Python Flask 和 MySQL

    下面选择数据库中的一条数据,传递到前台。

    @s.route('/list')
    def list_school():
    schools = School.query.all()
    school_output = []
    for s_item in schools:
    school_output.append(s_item.to_json())
    one_school = school_output[0]
    return render_template('school/index.html',item = one_school)

    前台 HTML 页面增加数据输出代码。


    {{item.name}}



    本案例完成。


    📢📢📢📢📢📢
    💗 你正在阅读 【梦想橡皮擦】 的博客
    👍 阅读完毕,可以点点小手赞一下
    🌻 发现错误,直接评论区中指正吧
    📆 橡皮擦的第 805 篇原创博客



    从订购之日起,案例 5 年内保证更新



  • ⭐️ Python 爬虫 120,点击订购 ⭐️

  • ⭐️ 爬虫 100 例教程,点击订购 ⭐️


  • 推荐阅读
    • voc生成xml 代码
      目录 lxmlwindows安装 读取示例 可视化 生成示例 上面是代码,下面有调用示例 api调用代码,其实只有几行:这个生成代码也很简 ... [详细]
    • 使用 XlsxWriter 模块在 Python 中实现 Excel 单元格内多种格式文本的高效写入
      XlsxWriter 是一个强大的 Python 库,专门用于生成 `.xlsx` 格式的 Excel 文件。该模块不仅支持基本的数据写入,还提供了丰富的格式化选项,能够实现单元格内多种文本样式的高效处理。无论是字体、颜色、对齐方式还是边框,XlsxWriter 都能轻松应对,满足用户在 Excel 视图中的各种需求。 ... [详细]
    • 本文深入探讨了NDK与JNI技术在实际项目中的应用及其学习路径。通过分析工程目录结构和关键代码示例,详细介绍了如何在Android开发中高效利用NDK和JNI,实现高性能计算和跨平台功能。同时,文章还提供了从基础概念到高级实践的系统学习指南,帮助开发者快速掌握这些关键技术。 ... [详细]
    • 本文首先回顾了MySQL在数据字典方面的发展历程,从MySQL 4.1引入的information_schema数据字典开始,使得用户能够通过标准SQL查询轻松获取系统元数据。在此基础上,深入探讨了MySQL 5.7中SYS模式的架构与应用场景,详细解析了其在性能监控、查询优化等方面的优势与实际应用。 ... [详细]
    • 【Python爬虫实操】 不创作小说,专精网站内容迁移,超高效!(含源代码)
      本文详细介绍了如何利用Python爬虫技术实现高效网站内容迁移,涵盖前端、后端及Android相关知识点。通过具体实例和源代码,展示了如何精准抓取并迁移网站内容,适合对Python爬虫实战感兴趣的开发者参考。 ... [详细]
    • Python正则表达式详解:掌握数量词用法轻松上手
      Python正则表达式详解:掌握数量词用法轻松上手 ... [详细]
    • MySQL性能优化与调参指南【数据库管理】
      本文详细探讨了MySQL数据库的性能优化与参数调整技巧,旨在帮助数据库管理员和开发人员提升系统的运行效率。内容涵盖索引优化、查询优化、配置参数调整等方面,结合实际案例进行深入分析,提供实用的操作建议。此外,还介绍了常见的性能监控工具和方法,助力读者全面掌握MySQL性能优化的核心技能。 ... [详细]
    • MongoDB Aggregates.group() 方法详解与编程实例 ... [详细]
    • MySQL:不仅仅是数据库那么简单
      MySQL不仅是一款高效、可靠的数据库管理系统,它还具备丰富的功能和扩展性,支持多种存储引擎,适用于各种应用场景。从简单的网站开发到复杂的企业级应用,MySQL都能提供强大的数据管理和优化能力,满足不同用户的需求。其开源特性也促进了社区的活跃发展,为技术进步提供了持续动力。 ... [详细]
    • Android目录遍历工具 | AppCrawler自动化测试进阶(第二部分):个性化配置详解
      终于迎来了“足不出户也能为社会贡献力量”的时刻,但有追求的测试工程师绝不会让自己的生活变得乏味。与其在家消磨时光,不如利用这段时间深入研究和提升自己的技术能力,特别是对AppCrawler自动化测试工具的个性化配置进行详细探索。这不仅能够提高测试效率,还能为项目带来更多的价值。 ... [详细]
    • 在2020年8月19日的深度分析中,我们探讨了HTML标签中同时存在`a`标签的`href`和`onclick`属性时的触发顺序问题。此外,还讨论了如何在一个自适应高度的父级`div`中,使两个子`div`中的一个固定高度为300px,另一个自动填充剩余空间的方法。最后,文章详细介绍了JavaScript异步加载的多种实现方式,包括但不限于`async`、`defer`属性以及动态脚本插入技术,为开发者提供了丰富的技术参考。 ... [详细]
    • APKAnalyzer(1):命令行操作体验与功能解析
      在对apkChecker进行深入研究后,自然而然地关注到了Android Studio中的APK分析功能。将APK文件导入IDE中,系统会自动解析并展示其中各类文件的详细信息。官方文档提供了详细的命令行工具使用指南,帮助开发者快速上手。本文以一个RecyclerView的Adapter代理开源库为例,探讨了如何利用这些工具进行高效的APK分析。 ... [详细]
    • 本文探讨了将PEBuilder转换为DIBooter.sh的方法,重点介绍了如何将DI工具集成到启动层,实现离线镜像引导安装。通过使用DD命令替代传统的grub-install工具,实现了GRUB的离线安装。此外,还详细解析了bootice工具的工作原理及其在该过程中的应用,确保系统在无网络环境下也能顺利引导和安装。 ... [详细]
    • Typora快捷键使用指南:提升写作效率的必备技巧 ... [详细]
    • 在第七天的深度学习课程中,我们将重点探讨DGL框架的高级应用,特别是在官方文档指导下进行数据集的下载与预处理。通过详细的步骤说明和实用技巧,帮助读者高效地构建和优化图神经网络的数据管道。此外,我们还将介绍如何利用DGL提供的模块化工具,实现数据的快速加载和预处理,以提升模型训练的效率和准确性。 ... [详细]
    author-avatar
    100斤的重口味_866
    这个家伙很懒,什么也没留下!
    PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
    Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有