当前位置: 开发笔记 > 编程语言 > 正文

Python的JupyterNotebook举例分析

作者：yuan00911 | 来源：互联网 | 2023-05-30 11:43

本篇内容主要讲解“Python的JupyterNotebook举例分析”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“

本篇内容主要讲解“Python的Jupyter Notebook举例分析”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Python的Jupyter Notebook举例分析”吧!

1.Jupyter Notebook基本介绍

Jupyter Notebook（此前被称为IPython notebook）是一个交互式笔记本，支持运行40多种编程语言。

在开始使用notebook之前，需要先安装该库：（1）在命令行中执行pip install jupyter来安装；（2）安装Anaconda后自带Jupyter Notebook。

在命令行中执行jupyter notebook，就会在当前目录下启动Jupyter服务并使用默认浏览器打开页面，还可以复制链接在其他浏览器中打开。

notebook界面由以下部分组成：（1）notebook名称；（2）主工具栏，提供了保存、导出、重载notebook，以及重启内核等选项；（3）notebook主要区域，包含了notebook的内容编辑区。

2.Jupyter Notebook的使用

在Jupyter页面下方的主要区域，由被称为单元格的部分组成。每个notebook由多个单元格构成，而每个单元格又可以有不同的用途。上图中看到的是一个代码单元格（code cell），以[ ]开头，在这种类型的单元格中，可以输入任意代码并执行。例如，输入1 + 2并按下Shift + Enter，单元格中的代码就会被计算，光标也会被移动到一个新的单元格中。

如果想新建一个notebook，只需要点击New，选择希望启动的notebook类型即可。

notebook可以修改之前的单元格，对其重新计算，这样就可以更新整个文档了。如果你不想重新运行整个脚本，只想用不同的参数测试某个程式的话，这个特性显得尤其强大。不过，也可以重新计算整个notebook，只要点击Cell -> Run all即可。

再测试标题和其他代码如下：

Python的Jupyter Notebook举例分析

可以看到，在顶部添加了一个notebook的标题，还可以执行for循环等语句。

3.Jupyter中使用Python

Jupyter测试Python变量和数据类型如下：

Python的Jupyter Notebook举例分析

测试Python模块如下：

Python的Jupyter Notebook举例分析

数据读写很重要，因为进行数据分析时必须先读取数据，进行数据处理后也要进行保存。

4.数据交互案例

加载csv数据，处理数据，保存到MongoDB数据库

有csv文件shopproducts.csv和userratings.csv，分别是商品数据和用户评分数据，如下：

Python的Jupyter Notebook举例分析

现在需要通过Python将其读取出来，并将指定的字段保存到MongoDB中，需要在Anaconda中执行命令conda install pymongo安装pymongo。

Python代码如下：

import pymongo


class Product:
    def __init__(self,productId:int ,name, imageUrl, categories, tags):
        self.productId = productId
        self.name = name
        self.imageUrl = imageUrl
        self.categories = categories
        self.tags = tags

    def __str__(self) -> str:
        return self.productId +&＃39;^&＃39; + self.name +&＃39;^&＃39; + self.imageUrl +&＃39;^&＃39; + self.categories +&＃39;^&＃39; + self.tags


class Rating:
    def __init__(self, userId:int, productId:int, score:float, timestamp:int):
        self.userId = userId
        self.productId = productId
        self.score = score
        self.timestamp = timestamp

    def __str__(self) -> str:
        return self.userId +&＃39;^&＃39; + self.productId +&＃39;^&＃39; + self.score +&＃39;^&＃39; + self.timestamp


if __name__ == &＃39;__main__&＃39;:
    myclient = pymongo.MongoClient("mongodb://127.0.0.1:27017/")
    mydb = myclient["goods-users"]
    ## val attr = item.split("\\^")
    ## // 转换成Product
    ## Product(attr(0).toInt, attr(1).trim, attr(4).trim, attr(5).trim, attr(6).trim)

    shopproducts = mydb[&＃39;shopproducts&＃39;]
    with open(&＃39;shopproducts.csv&＃39;, &＃39;r&＃39;,encoding=&＃39;UTF-8&＃39;) as f:
        item = f.readline()
        while item:
            attr = item.split(&＃39;^&＃39;)
            product = Product(int(attr[0]), attr[1].strip(), attr[4].strip(), attr[5].strip(), attr[6].strip())
            shopproducts.insert_one(product.__dict__)
            ## print(product)
            ## print(json.dumps(obj=product.__dict__,ensure_ascii=False))
            item = f.readline()

    ## val attr = item.split(",")
    ## Rating(attr(0).toInt, attr(1).toInt, attr(2).toDouble, attr(3).toInt)
    userratings = mydb[&＃39;userratings&＃39;]
    with open(&＃39;userratings.csv&＃39;, &＃39;r&＃39;,encoding=&＃39;UTF-8&＃39;) as f:
        item = f.readline()
        while item:
            attr = item.split(&＃39;,&＃39;)
            rating = Rating(int(attr[0]), int(attr[1].strip()), float(attr[2].strip()), int(attr[3].strip()))
            userratings.insert_one(rating.__dict__)
            ## print(rating)
            item = f.readline()

在启动MongoDB服务后，运行Python代码，运行完成后，再通过Robo 3T查看数据库如下：

Python的Jupyter Notebook举例分析

包括名称、评论数、价格、地址、评分列表等，其中评论数、价格和评分均不规则、需要进行数据清洗。

Jupyter中处理如下：

可以看到，最后得到了经过清洗后的规则数据。

完整Python代码如下：

## 数据读取
f = open(&＃39;商铺数据.csv&＃39;, &＃39;r&＃39;, encoding=&＃39;utf8&＃39;)
for i in f.readlines()[1:15]:
    print(i.split(&＃39;,&＃39;))


## 创建comment、price、commentlist清洗函数
def fcomment(s):
    &＃39;&＃39;&＃39;comment清洗函数：用空格分段，选取结果list的第一个为点评数，并且转化为整型&＃39;&＃39;&＃39;
    if &＃39;条&＃39; in s:
        return int(s.split(&＃39; &＃39;)[0])
    else:
        return &＃39;缺失数据&＃39;


def fprice(s):
    &＃39;&＃39;&＃39;price清洗函数：用￥分段，选取结果list的最后一个为人均价格，并且转化为浮点型&＃39;&＃39;&＃39;
    if &＃39;￥&＃39; in s:
        return float(s.split(&＃39;￥&＃39;)[-1])
    else:
        return &＃39;缺失数据&＃39;


def fcommentl(s):
    &＃39;&＃39;&＃39;commentlist清洗函数：用空格分段，分别清洗出质量、环境及服务数据，并转化为浮点型&＃39;&＃39;&＃39;
    if &＃39; &＃39; in s:
        quality = float(s.split(&＃39;                                &＃39;)[0][2:])
        environment = float(s.split(&＃39;                                &＃39;)[1][2:])
        service = float(s.split(&＃39;                                &＃39;)[2][2:-1])
        return [quality, environment, service]
    else:
        return &＃39;缺失数据&＃39;


## 数据处理清洗
datalist = []  ## 创建空列表

f.seek(0)
n = 0  ## 创建计数变量
for i in f.readlines():
    data = i.split(&＃39;,&＃39;)
    ## print(data)
    classify = data[0]  ## 提取分类
    name = data[1]  ## 提取店铺名称
    comment_count = fcomment(data[2])  ## 提取评论数量
    star = data[3]  ## 提取星级
    price = fprice(data[4])  ## 提取人均
    address = data[5]  ## 提取地址
    quality = fcommentl(data[6])[0]  ## 提取质量评分
    env = fcommentl(data[6])[1]  ## 提取环境评分
    service = fcommentl(data[6])[2]  ## 提取服务评分
    if &＃39;缺失数据&＃39; not in [comment_count, price, quality]:  ## 用于判断是否有数据缺失
        n += 1
        data_re = [[&＃39;classify&＃39;, classify],
                   [&＃39;name&＃39;, name],
                   [&＃39;comment_count&＃39;, comment_count],
                   [&＃39;star&＃39;, star],
                   [&＃39;price&＃39;, price],
                   [&＃39;address&＃39;, address],
                   [&＃39;quality&＃39;, quality],
                   [&＃39;environment&＃39;, env],
                   [&＃39;service&＃39;, service]]
        datalist.append(dict(data_re))  ## 字典生成，并存入列表datalist
        print(&＃39;成功加载%i条数据&＃39; % n)
    else:
        continue

print(datalist)
print(&＃39;总共加载%i条数据&＃39; % n)

f.close()

到此，相信大家对“Python的Jupyter Notebook举例分析”有了更深的了解，不妨来实际操作一番吧！这里是编程笔记网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

推荐阅读

io
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
main
使用Python批量处理图片尺寸调整

本文介绍了如何利用Python进行批量图片尺寸调整，包括放大和等比例缩放。文中提供了详细的代码示例，并解释了每个步骤的具体实现方法。 ... [详细]

蜡笔小新 2024-12-22 17:13:05
io
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
search
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
main
Python文本处理与可视化：分词及词云生成

本文介绍如何使用Python进行文本处理，包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图，展示文本数据的可视化分析方法。 ... [详细]

蜡笔小新 2024-12-26 08:37:18
main
Python 文件操作与数据转换

本文详细介绍了Python中文件的基本操作，包括打开、读取、写入和关闭文件的方法，并通过实例展示了如何将Excel文件转换为CSV文件以及进一步转换为HTML文件。此外，还涉及了成绩等级替换的具体实现。 ... [详细]

蜡笔小新 2024-12-25 21:45:13
io
使用Pandas高效读取SQL脚本中的数据

本文详细介绍了如何利用Pandas直接读取和解析SQL脚本，提供了一种高效的数据处理方法。该方法适用于各种数据库导出的SQL脚本，并且能够显著提升数据导入的速度和效率。 ... [详细]

蜡笔小新 2024-12-24 21:56:10
int
Python Pandas 库中的 Series.round() 方法详解

本文介绍如何使用 Python 的 Pandas 库中 Series 对象的 round() 方法，对数值进行四舍五入处理。该方法在数据预处理和分析中非常有用。 ... [详细]

蜡笔小新 2024-12-23 12:13:19
io
Python处理Word文档的高效技巧

本文详细介绍了如何使用Python处理Word文档，涵盖从基础操作到高级功能的各种技巧。我们将探讨如何生成文档、定义样式、提取表格数据以及处理超链接和图片等内容。 ... [详细]

蜡笔小新 2024-12-23 10:40:32
io
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
search
Python 工具推荐 | PyHubWeekly 第二十一期：提升命令行体验的五大工具

本期 PyHubWeekly 为大家精选了 GitHub 上五个优秀的 Python 工具，涵盖金融数据可视化、终端美化、国际化支持、图像增强和远程 Shell 环境配置。欢迎关注并参与项目。 ... [详细]

蜡笔小新 2024-12-21 14:45:11
web
Python入门指南：从零开始的全面学习路线

本文详细介绍了Python编程语言的学习路径，涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划，帮助初学者快速掌握Python的核心技能。 ... [详细]

蜡笔小新 2024-12-25 12:54:33
int
Python 使用 xlrd 库读取 Excel 文件

本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件，并将其数据处理后存储到数据库中。通过实际案例，详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]

蜡笔小新 2024-12-24 17:29:27
io
华为USG基于源地址的多出口策略路由配置

网络拓扑如下：组网情况：企业用户主要有技术部（VLAN10）和行政部(VLAN20)，通过汇聚交换机连接到USG。企业分别通过两个不同运营商（ISP1和ISP2）连接到 ... [详细]

蜡笔小新 2024-12-24 14:57:16
io
深入解析TCP/IP五层协议

本文详细介绍了TCP/IP五层协议模型，包括物理层、数据链路层、网络层、传输层和应用层。每层的功能及其相互关系将被逐一解释，帮助读者理解互联网通信的原理。此外，还特别讨论了UDP和TCP协议的特点以及三次握手、四次挥手的过程。 ... [详细]

蜡笔小新 2024-12-24 14:02:48

yuan00911

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章