作者:瑞铭与我_109 | 来源:互联网 | 2023-07-02 18:05
import pandas as pd数据导入pd.read_csv(filename):从CSV文件导入数据pd.read_excel(filename):从Excel文件导入数据pd.read_t
import pandas as pd
数据导入
pd.read_csv(filename):从CSV文件导入数据
pd.read_excel(filename):从Excel文件导入数据
pd.read_table(filename):从限定分隔符的文本文件导入数据
pd.read_sql(query, connection_object):从SQL表/库导入数据
pd.read_json(json_string):从JSON格式的字符串导入数据
pd.read_html(url):解析URL、字符串或者HTML文件,抽取其中的tables表格
pd.read_clipboard():从你的粘贴板获取内容,并传给read_table()
pd.read_pickle():读取pickle文件
pd.read_fwf():从固定宽度格式行的表格中导入数据
pd.DataFrame(dict):从字典对象导入数据,Key是列名,Value是数据
数据导出
DataFrame.to_csv(filename):导出数据到CSV文件
DataFrame.to_excel(filename):导出数据到Excel文件
DataFrame.to_sql(table_name, connection_object):导出数据到SQL表
DataFrame.to_json(filename):以Json格式导出数据到文本文件
DataFrame.to_pickle(filename):以pickle格式保存文件
DataFrame.to_clipboard();将对象复制到粘贴板上
DataFrame.to_html():将对象保存为html格式的文件
DataFrame.to_xml():将对象保存为xml格式的文件
查看、检查数据
DataFrame.head(n):查看DataFrame对象的前n行
DataFrame.tail(n):查看DataFrame对象的最后n行
DataFrame.shape():查看行数和列数
DataFrame.info():查看索引、数据类型和内存信息
DataFrame.describe():查看数值型列的汇总统计
Series.value_counts(dropna=False):查看Series对象的唯一值和计数
DataFrame.apply(pd.Series.value_counts):查看DataFrame对象中每一列的唯一值和计数
查看、检查数据
DataFrame[col]:根据列名,并以Series的形式返回列
DataFrame[[col1, col2]]:以DataFrame形式返回多列
Series.iloc[0]:按位置选取数据
Series.loc['index_one']:按索引选取数据
DataFrame.iloc[0,:]:返回第一行
DataFrame.iloc[0,0]:返回第一列的第一个元素
数据合并
DataFrame.append(df2):将df2中的行添加到df1的尾部
pd.concat([df1, df2],axis=1):将df2中的列添加到df1的尾部
DataFrame.join(df2,on=col1,how='inner'):对df1的列和df2的列执行SQL形式的join
数据统计
DataFrame.describe():查看数据值列的汇总统计
DataFrame.mean():返回所有列的均值
DataFrame.corr():返回列与列之间的相关系数
DataFrame.count():返回每一列中的非空值的个数
DataFrame.max():返回每一列的最大值
DataFrame.min():返回每一列的最小值
DataFrame.median():返回每一列的中位数
DataFrame.std():返回每一列的标准差