热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

[pandas]高级使用

目录读写文本格式序列化使用数据库合并数据集重塑和轴向旋转数据转换读写文本格式CSV(Comma-SeparatedValues)格式的文件是指以纯文本形式存储的表格数据,这意味着不


目录





      • 读写文本格式

      • 序列化

      • 使用数据库

      • 合并数据集

      • 重塑和轴向旋转

      • 数据转换







读写文本格式

CSV(Comma-SeparatedValues)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。



  • 如何读取csv数据read_csv()

importpandasaspd
deftest():
data=pd.read_csv('../one.csv',encoding='GBK')
#printdata.head()
#printdata.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值



  • 详细read_csv参数连接

  • header=0

    表示文件第0行(即第一行,索引从0开始)为列索引,这样加names会替换原来的列索引。

importpandasaspd
deftest():
data=pd.read_csv('../one.csv',encoding='GBK',header=0)
print(data)



  • header=None

    即指明原始文件数据没有列索引,这样read_csv为自动加上列索引,除非你给定列索引的名字。

importpandasaspd
deftest():
data=pd.read_csv('../one.csv',encoding='GBK',header=None)
print(data)



  • names

    指定列名

importpandasaspd
deftest():
data=pd.read_csv('../one.csv',encoding='GBK',names=['name','age','sex'])
print(data)



  • index_col:

    int类型值,序列,FALSE(默认None)

    将真实的某列当做index(列的数目,甚至列名)

importpandasaspd
deftest():
data=pd.read_csv('../one.csv',encoding='GBK',index_col=0)
print(data)



  • nrows

    需要读取的行数(从文件头开始算起)


  • 如何存储csvto_csv()

    详细to_csv参数连接



序列化

pickle主要用于将python对象和文件之间的转换。

importpandasaspd
deftest():
data=pd.read_csv('../one.csv',encoding='GBK',nrows=2)
#data=pd.read_table('../one.csv',encoding='GBK',sep=',',header=None)
data.to_pickle('csv_data')
result=pd.read_pickle('csv_data')
print(result)
使用数据库

importpymysql
importpandasaspd
deftest():
cOnn=pymysql.connect("localhost","root","admin","data_output")
sql='SELECT*fromold_user'
df=pd.read_sql(sql,conn)
print(df)


合并数据集

博客连接


重塑和轴向旋转
数据转换

推荐阅读
author-avatar
风去无痕吧
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有