热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

结合实例总结pandas的部分常用函数

1.df.head(n):显示数据前n行,不指定n,df.head则会显示所有的行2.df.columns.values获取

1. df.head(n): 显示数据前n行,不指定n,df.head则会显示所有的行


2. df.columns.values获取所有列索引的名称


3. df.column_name: 直接获取列column_name的数据


4. pd.unique(Series)获取Series中元素的唯一值(即去掉重复的)


注意和nunique的区别,nunique只作用于Series,用法是Series.nunique(),返回Series中只出现过一次的元素,

5. max,min可直接作用于Series取最大和最小值


6. pd.value_counts(Series)统计Series中不同元素出现的次数


7. df.groupby和agg的使用

(1)变量grouped是一个DataFrameGroupBy对象,它实际上还没有进行任何计算,只是将数据进行了分组

(2)可以使用agg对分组好的数据进行处理,传入的参数为函数,返回一个标量结果。使用自定义的函数时应加引号。

下图的例子是对分组好的数据按每列求平均值。

(3)agg的参数可以传入多个函数

(4)还可以指定对不同的列使用不同的函数进行处理


8. df.index获取行索引


9. 使用条件筛选:下列例子中的三个条件criteria1表示fuelType1中的元素满足isin([]),criteria2表示fuelType2中的元素满足isnull(),

criteria3表示atvType中的元素不等于‘Hybrid’,vehicles_non_hybrid = vehicles[criteria1&criteria2&criteria3]表示vehicles_non_hybrid

是vehicles同时满足这三个条件筛选出来的数据。


10. pandas.DataFrame.reset_index(level=Nonedrop=Falseinplace=Falsecol_level=0col_fill='')

参见http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.reset_index.html


pandas.DataFrame.reset_index


推荐阅读
author-avatar
飞轶尘埃_130
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有