当前位置: 开发笔记 > 编程语言 > 正文

【爬虫训练场】：分页爬虫案例设计Demo，PythonFlask与MySQL的完美连接

作者：100斤的重口味_866 | 来源：互联网 | 2023-10-17 16:00

网站类应用，一定离不开MySQL，所以本案例将带着大家学习一下，通过Flask调用MySQL数据，并实现分页呈现。类被称作蓝图，它是一个存储操作方法的容器，Flask可以通过Blu

文章目录

Python Flask 调用 MySQL 数据

建立新的控制器目录

爬虫训练场引入 MySQL 之间的逻辑关系

搭建案例前端页面

本篇博客为大家继续补充一款简易爬虫&＃xff0c;主要涉及如下知识点。

Python Flask 调用 MySQL 数据

分页数据呈现

Python Flask 调用 MySQL 数据

网站类应用&＃xff0c;一定离不开 MySQL &＃xff0c;所以本案例将带着大家学习一下&＃xff0c;通过 Flask 调用 MySQL 数据&＃xff0c;并实现分页呈现。

正式开始前&＃xff0c;我们需要提前在 MySQL 中准备一张表&＃xff0c;命名为 school_list&＃xff0c;其数据通过采集获取&＃xff0c;具体可参考博客《【Python 实战】高校数据采集&＃xff0c;爬虫训练场项目数据储备》。

安装 MySQL 操作相关模块。

pip install flask-sqlalchemy

使用 Pycharm 安装&＃xff0c;可直接在包管理中进行检索。

9. 爬虫训练场&＃xff0c;分页爬虫案例设计Demo&＃xff0c;打通 Python Flask 和 MySQL

新建 config.py 文件&＃xff0c;并输入如下代码

class BaseConfig(object): DIALECT &＃061; &＃039;mysql&＃039; DRIVER &＃061; &＃039;pymysql&＃039; USERNAME &＃061; &＃039;root&＃039; PASSWORD &＃061; &＃039;root&＃039; # 注意不要泄露服务器密码&＃xff0c;这里仅供测试使用 HOST &＃061; &＃039;127.0.0.1&＃039; PORT &＃061; &＃039;3306&＃039; DATABASE &＃061; &＃039;playground&＃039; SQLALCHEMY_DATABASE_URI &＃061; "{}&＃043;{}://{}:{}&＃064;{}:{}/{}?charset&＃061;utf8".format(DIALECT, DRIVER, USERNAME, PASSWORD, HOST, PORT, DATABASE) SQLALCHEMY_TRACK_MODIFICATIONS &＃061; False SQLALCHEMY_ECHO &＃061; True

可以看到用户名和密码都在该文件中进行配置&＃xff0c;接下来在 app/__init__.py 文件中导入对应模块。

from flask_sqlalchemy import SQLAlchemy db &＃061; SQLAlchemy()

接下来我们先补充一些小知识点&＃xff0c;罗列如下所示。

app.config.from_object() 方法&＃xff0c;它用来加载配置文件&＃xff0c;稍后将用该方法导入数据库相关配置。

下面继续看一段代码。

db &＃061; SQLAlchemy() db.init_app(app) # 初始化数据库

db &＃061; SQLAlchemy() 用于创建 SQLAlchemy 对象&＃xff0c;db.init_app() 初始化链接对象。

建立新的控制器目录

在 app 目录下建立 school 文件夹&＃xff0c;然后内部新增两个文件&＃xff0c;分别是 __init__.py 和 index.py&＃xff0c;然后在 index.py 文件中&＃xff0c;输入如下代码。

import sys from flask import Blueprint, jsonify from ..model import School # 导入上级模块 ss &＃061; Blueprint(&＃039;school&＃039;, __name__) &＃064;school.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() print(schools)

先不要运行项目&＃xff0c;我们先说明一下其中涉及的知识点&＃xff0c;第一个是 Blueprint 类。

Blueprint 类被称作蓝图&＃xff0c;它是一个存储操作方法的容器&＃xff0c;Flask 可以通过 Blueprint 来组织 URL 及处理请求。

蓝图对象和 Flask 对象使用类似&＃xff0c;但需要将其注册到应用对象上才可以生效。

使用蓝图的三个步骤。

创建一个蓝图对象

s &＃061; Blueprint(&＃039;school&＃039;, __name__,url_prifix&＃061;&＃039;/ss&＃039;)

在蓝图对象上进行操作&＃xff0c;例如注册路由&＃xff0c;指定静态文件&＃xff0c;指定过滤器

&＃064;ss.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() print(schools) return "学校数据"

在应用对象注册蓝图对象
返回到 app/__init__.py 文件中&＃xff0c;注册蓝图对象。

from .school.index import * app.register_blueprint(s)

在应用对象上注册一个蓝图时&＃xff0c;可以指定 url_prefix 关键字参数&＃xff08;该参数默认是 /&＃xff09;&＃xff0c;此时启动项目&＃xff0c;就可以通过 /ss/ 配合路由&＃xff0c;访问指定方法。

在前文代码中&＃xff0c;我们还导入了一个 model 模型模块&＃xff0c;在 app 目录中建立 model.py 文件&＃xff0c;然后输入如下代码。

from app import db class EntityBase(object): def to_json(self): fields &＃061; self.__dict__ if "_sa_instance_state" in fields: del fields["_sa_instance_state"] return fields class School(db.Model, EntityBase): """ 表名&＃xff0c;字段名 """ __tablename__ &＃061; "school_list" id &＃061; db.Column(db.Integer, primary_key&＃061;True) name &＃061; db.Column(db.String(255)) province &＃061; db.Column(db.String(255)) city &＃061; db.Column(db.String(255)) feature &＃061; db.Column(db.String(255)) hotValue &＃061; db.Column(db.String(255)) pic &＃061; db.Column(db.String(255)) category &＃061; db.Column(db.String(255)) batchTimes &＃061; db.Column(db.String(255))

其中 School 类继承自 db.Model 和 EntityBase&＃xff0c;其中的字段与数据库表字段一致。

接下来再总结一下目前的项目结构&＃xff0c;然后橡皮擦会带着大家再次梳理一下各文件之间的引用关系。

9. 爬虫训练场&＃xff0c;分页爬虫案例设计Demo&＃xff0c;打通 Python Flask 和 MySQL

爬虫训练场引入 MySQL 之间的逻辑关系

playground.py 文件为程序主入口&＃xff0c;其内部导入 app 模块&＃xff0c;由于 Python 模块导入关系&＃xff0c;app 目录中的 __init__.py 文件默认执行。

__init__.py 文件中包含如下内容&＃xff1a;

flask 主类初始化&＃xff1b;

app 配置文件初始化&＃xff1b;

SQLAlchemy 类初始化&＃xff1b;

各路由导入&＃043;蓝图注册。

由于需要导入 app 配置&＃xff0c;所以这里需要导入 config.py 文件&＃xff0c;由于需要导入路由控制器和注册蓝图&＃xff0c;所以需要编写下述代码。

from app import routes from app import general from .school.index import * app.register_blueprint(s)

为了便于项目管理&＃xff0c;在 app 目录中新建立了一个 school 文件夹&＃xff0c;并且创建了一个 index.py 文件&＃xff0c;用于实现路由函数逻辑&＃xff0c;由于该文件需要使用模型 model 相关配置&＃xff0c;所以在 app 目录新增一个 model.py 文件&＃xff0c;并且实现了第一个模型类 School。

搭建案例前端页面

本篇博客的最后一个步骤&＃xff0c;用来实现前端页面渲染&＃xff0c;在 templates 目录建立一个 school 文件夹&＃xff0c;并新建 index.html 文件&＃xff0c;其中先输入一个 Bootstrap 基本内容即可。

打开 app/school/index.py 文件&＃xff0c;修改 list_school() 函数。

&＃064;s.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() school_output &＃061; [] for s_item in schools: school_output.append(s_item.to_json()) return render_template(&＃039;school/index.html&＃039;)

运行代码&＃xff0c;页面成功渲染。

9. 爬虫训练场&＃xff0c;分页爬虫案例设计Demo&＃xff0c;打通 Python Flask 和 MySQL

下面选择数据库中的一条数据&＃xff0c;传递到前台。

&＃064;s.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() school_output &＃061; [] for s_item in schools: school_output.append(s_item.to_json()) one_school &＃061; school_output[0] return render_template(&＃039;school/index.html&＃039;,item &＃061; one_school)

前台 HTML 页面增加数据输出代码。


  {{item.name}}

本案例完成。

&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;
&＃x1f497; 你正在阅读 【梦想橡皮擦】 的博客
&＃x1f44d; 阅读完毕&＃xff0c;可以点点小手赞一下
&＃x1f33b; 发现错误&＃xff0c;直接评论区中指正吧
&＃x1f4c6; 橡皮擦的第 805 篇原创博客

从订购之日起&＃xff0c;案例 5 年内保证更新

⭐️ Python 爬虫 120&＃xff0c;点击订购 ⭐️

⭐️ 爬虫 100 例教程&＃xff0c;点击订购 ⭐️

推荐阅读

instance
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
instance
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
callback
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
instance
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
join
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
list
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
list
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
list
FastJSON解析与数据提取技巧

探讨如何高效使用FastJSON进行JSON数据解析，特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]

蜡笔小新 2024-12-27 19:49:07
list
导航栏样式练习：项目实例解析

本文详细介绍了如何创建一个具有动态效果的导航栏，包括HTML、CSS和JavaScript代码的实现，并附有详细的说明和效果图。 ... [详细]

蜡笔小新 2024-12-27 19:42:28
string
java编写的简易计算器

主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]

蜡笔小新 2024-12-27 18:18:10
string
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
string
如何通过按钮聚焦ListView的TextCell？ - How to focus ListView's TextCell by button?

IneedtofocusTextCellsonebyoneviaabuttonclick.ItriedlistView.ScrollTo.我需要通过点击按钮逐个关注Tex ... [详细]

蜡笔小新 2024-12-27 17:02:23
list
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
string
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
string
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12

100斤的重口味_866

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章