作者:津pig | 来源:互联网 | 2023-10-12 20:29
import pandas as pd
#读取数据,更换列表名
data = pd.read_table( 'u.data' )
datafeilds = ['user id', 'item id', 'rating', 'timestamp']
data.columns = datafeilds
#将文件中需要的数据分别存入两个列表
user_id = []
gender = []
userfile = open('u.user')
contents = userfile.readlines()
userfile.close()
for i in range(0,len(contents)):
line = contents[i].split('|')
user_id.append( line[0] )
gender.append( line[2] )
#存入数据,为dataframe类型
dictuser = {'user id':user_id, 'gender':gender}
user = pd.DataFrame(dictuser)
rating = pd.merge( data, user, on = 'user id')
print rating
data和user的类型都是dataframe,用user id做为主键连接两张表,data和user中都有数据,
输出如下:
Empty DataFrame
Columns: [user id, item id, rating, timestamp, gender]
Index: []
怎么会是空的呢?
6 个解决方案
因为两个表的user id没有一样的,注意它们的类型
因为看不到你的表格数据,我估计可能是你user id 中的数据没有相同的,这样就会导致merge以后为空表。