作者:书友67997456_296 | 来源:互联网 | 2024-09-24 18:52
文件为csv格式,内容如图可以看到文件中有表头,数据中有数值,有字符串,有空值(图中红色、绿色部分)如果用pandas读取,字符串和空值需要再处理,但列名还健在,如下图如果用num
文件为csv格式,内容如图
可以看到文件中有表头,数据中有数值,有字符串,有空值(图中红色、绿色部分)
如果用pandas读取,字符串和空值需要再处理,但列名还健在,如下图
如果用numpy 读取,字符串和空值就会被识别为nan值,如下图:
在简单的数据文件中,已知所有的数据类型都是数值型,因为懒又不想处理字符串,可以用两相结合的办法:
这样的话就不用处理字符型的数据了
但是这个只是很偏门的方法,适合在小数据上面偷偷懒。
代码如下
import pandas as pd
import numpy as np
data_pd = pd.read_csv('tt.csv',delimiter=';',nrows=0) #只读取表头
data_np = np.genfromtxt('tt.csv',delimiter=';',skip_header=1) #跳过表头读取数据
data=pd.DataFrame(data_np)
data.columns=data_pd.columns
data.head()