作者:江游弈一个 | 来源:互联网 | 2023-09-13 13:39
本文由编程笔记#小编为大家整理,主要介绍了18.Pandas实战,对电影数据进行分析相关的知识,希望对你有一定的参考价值。
Rnames=[‘UserID‘,‘MovieID‘,‘Rating‘,‘Timestamp‘]
rating_data = pd.read_table(r".datasmovielens-1m
atings.dat", sep=‘::‘, header=None, names=Rnames)
第二步:将三张表合并
根据共同的UserID进行合并,合并类型为outer,完成三张表的合并
user_rating=pd.merge(user_data,rating_data,left_on=‘UserID‘,right_on=‘UserID‘,how=‘outer‘)
根据共同的MovieID进行合并,合并类型为outer,完成第三张表合并
data=pd.merge(user_rating,movie_data,left_on=‘MovieID‘,right_on=‘MovieID‘,how=‘outer‘)
第三步:完成各项需求
找到因性别,导致评价差异最大的电影。