热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

pandas_18.Pandas实战,对电影数据进行分析

本文由编程笔记#小编为大家整理,主要介绍了18.Pandas实战,对电影数据进行分析相关的知识,希望对你有一定的参考价值。
本文由编程笔记#小编为大家整理,主要介绍了18.Pandas实战,对电影数据进行分析相关的知识,希望对你有一定的参考价值。

第一步:读取三个表数据(用户表、评分表、电影表)
mnames=[‘MovieID‘,‘Title‘,‘Genres‘]
user_data = pd.read_table(r".datasmovielens-1musers.dat", sep=‘::‘, header=None, names=unames)


movie_data = pd.read_table(r".datasmovielens-1mmovies.dat", sep=‘::‘, header=None, names=mnames)

Rnames=[‘UserID‘,‘MovieID‘,‘Rating‘,‘Timestamp‘]
rating_data = pd.read_table(r".datasmovielens-1m
atings.dat", sep=‘::‘, header=None, names=Rnames)

第二步:将三张表合并

根据共同的UserID进行合并,合并类型为outer,完成三张表的合并

user_rating=pd.merge(user_data,rating_data,left_on=‘UserID‘,right_on=‘UserID‘,how=‘outer‘)

根据共同的MovieID进行合并,合并类型为outer,完成第三张表合并

data=pd.merge(user_rating,movie_data,left_on=‘MovieID‘,right_on=‘MovieID‘,how=‘outer‘)

第三步:完成各项需求
技术图片

技术图片

技术图片
找到因性别,导致评价差异最大的电影。







推荐阅读
  • MySQL中关于datetime、date、time、str之间的转化与比较【mysql入门】
    这篇文章主要介绍了MySQL中关于datetime、date、time、str之间的转化与比较,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完 ... [详细]
  • 本文是《开发你的WordPress主题框架》专题的第10篇,共10篇:为你的WordPress主题框架添加动作挂钩WordPress主题框架是如何工作的决定如何开发你的WordPress主题框架为你的WordPress主题框架建立起始文件为你的Wo ... [详细]
  • 缓存的重要性就不用再强调了,@OutputCache给我们提供了一种声明的方式(对应的还有编程的方式)来控制页面和用户控件的缓存策略,这是一种最简单直接的网站优化方式。还是先来过一遍@ ... [详细]
  • 首先在datagrid中添加DataGridTemplateColumn,如下:<DataGridTemplateColumnWidth&am ... [详细]
  • x86x64体系探索及编程(对x86处理器介绍得最详尽又最具实践指导意义的一本书)邓志著ISBN978-7-121-18176-42012年10月出版定价:119.00元16开840页对x86处理 ... [详细]
  • 【小Y学算法】⚡️每日LeetCode打卡⚡️——27.对称二叉树
    📢前言🌲原题样例🌻C#方法:递归🌻Java方法一:递归🌻Java方法二& ... [详细]
  • 历史指对人类社会过来的事件和流动,以及对这些事件行为有零碎的记录、钻研和诠释。历史是文化的传承,积攒和扩大,是人类文明的轨迹。APISpace的历史上的 ... [详细]
  • R语言基础_数据导入&保存
    数据分析文件常用的储存格式为CSV(.csv)和EXCEL(.xlsx),其余文 ... [详细]
  • POI编程
    POI编程1简介在我们实际的开发中,表现层的解决方案虽然有多样,但是IE浏览器已成为最多人使用的浏览器,因为大家都用Windows。在企业办公系统中 ... [详细]
  • iOS网络开发(7)大牛们的杰作AFNetworking
    本篇文章介绍传说中的 AFN框架的使用AFNetworking是iOS开发中最广泛使用的开源项目之一,是最活跃最有影响力的开源项目之一。    ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • 本文介绍了如何使用PHP代码将表格导出为UTF8格式的Excel文件。首先,需要连接到数据库并获取表格的列名。然后,设置文件名和文件指针,并将内容写入文件。最后,设置响应头部,将文件作为附件下载。 ... [详细]
  • 本文讨论了如何使用GStreamer来删除H264格式视频文件中的中间部分,而不需要进行重编码。作者提出了使用gst_element_seek(...)函数来实现这个目标的思路,并提到遇到了一个解决不了的BUG。文章还列举了8个解决方案,希望能够得到更好的思路。 ... [详细]
  • 本文讨论了在使用Git进行版本控制时,如何提供类似CVS中自动增加版本号的功能。作者介绍了Git中的其他版本表示方式,如git describe命令,并提供了使用这些表示方式来确定文件更新情况的示例。此外,文章还介绍了启用$Id:$功能的方法,并讨论了一些开发者在使用Git时的需求和使用场景。 ... [详细]
  • 事务是通过MULTI命令开始的,在非事务状态下客户端发送的命令会被立刻执行,而在事务状态下,除了EXECWATCHDISCARD这几个命令外,redis会将命令保留在事务队列里。 ... [详细]
author-avatar
江游弈一个
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有