作者:玻璃里的鱼鱼 | 来源:互联网 | 2023-07-26 14:46
我正在参加Coursera上的R编程课程的入门课程,我想知道在以下情况下使用read.table()读取大型表时指定列类的目的是什么
initial <- read.table("datatable.txt",nrows=100)
classes <- sapply(initial,class)
tabAll <- read.table("datatable.txt",colClasses=classes)
该代码摘自一个有关读取大型数据表的短片。为了便于说明,我附上了视频中相关幻灯片的图片。讲师说,执行上述操作会使read.table()运行“ MUCH”的速度更快-但我不明白为什么。如果我们已经知道列类,就可以理解这一点,但是在上面的代码中,我们只读取了两次表。为什么会更快?
谢谢。