第一讲 引言
从今天起我打算给大家连载一本关于计算机统计软件R的讲解。
1.1 什么是R?
将R定义为一个计算机统计软件实在有点委屈了R!实际上,R是允许用户编辑算法,并且可以利用可编程工具的一种计算机语言。那么R到底可以做哪些事情呢?R可以做任何你能够想到的事情!包括编写函数、进行计算、生成简单或者复杂的图形,甚至编写你自己的库函数。与其他计算机软件不同,R是完全免费和开源的!
为什么不是每个人都在用R?因为R需要学习一些计算机编程技术!尽管存在一些交互式的工作方式,然而这些工作方式并不能让人满意。你为什么选择R?或者说为啥作者喜欢用R?由于个人比较喜欢通过敲击键盘(而不是通过鼠标点击)的方式使用电脑,所以,R的这种使用方式似乎更加受到本人的青睐。像Excel那种低级的东西,在加入VBA以后可以显得稍微高级一点,但还是离不开鼠标的操作,这种鼠标的操作有时候会因为鼠标不大好用(我的鼠标就经常错把双击当成单击)而造成一些操作的失误。
1.2 如何获得R?
读者可以访问网站www.r-project.org,重要的是下载的那个CRAN连接。
图1.1 R网站主页
点击左侧Dowload下的CRAN连接,找到China的部分。
图1.2 China的部分
可以看到,这个部分有:TUNA Team, Tsinghua University,即清华大学TUNA团队的CRAN镜像连接,打开这个连接就可以下载和安装R软件了!
1.3 最初印象
如果我们已经安装了R软件,我们可以运行这个R了:
图1.3 R的启动窗口
注意,我们使用的版本是3.4.0版本,不同的版本在外观上可能有所差别。
首先注意到有一个光标提示符">",我们在这个光标提示符后面输入2+2:
>2+2
按下回车键,可以看到:
图1.4 计算2+2的结果
界面上出现了一个[1],后面出现了4,这个4就是我们运算的结果,至于这个[1],我们会在后面的部分进行讲解。这个例子可以看到,R可以像计算器一样进行一些运算,方法就是你直接将需要运算的结果。
1.4 脚本代码
1.4.1 编程的艺术
在本章节中,读者并不需要明白下面的代码在做什么。我将它放在这里只是想告诉读者,只需要你稍微努力一下,你就可以用R生成非常漂亮的图形:
> x
> y
> plot(x,y,type="l",xlab="x value",ylab="sin(x)")
图1.5 用R生成一个正弦图形
我们可以看到每一行都有一个>,这个>是R系统自动生成的,我们不用管它。
1.4.2 录入脚本
录入脚本是一件非常麻烦的事情,尽管你可以非常的博闻强识,但是对于比较多的一些代码还是比较难以记忆。给R脚本做注释是一个不错的想法,写在”#“后面的部分将被当作注释而不再执行。
1.5 帮助
大多数的时候,我们是需要帮助的,例如我们希望学习一下盒装图如何生成,在R中你可以输入命令: ?boxplot从而获得boxplot的帮助,可惜这个帮助是英文版本。
图1.6 boxplot的帮助
> setwd("F:\MyR")
> F
> boxplot(Height~Gender,data=F)
图1.7 性别和身高的盒形图
1.6 程序包
R自带一系列默认的程序,这些程序构成一个一个的”程序包“,所谓的程序包就是程序所需要的一些函数的集合。程序包包括两类,即底层的程序包和手工下载的程序包,底层的程序包为R软件所自带,用户可以根据自己实际的需要从R的相关网站上下载一些特殊的程序包。
可以通过点击包、载入包来查看或者载入一个程序包,成百上千的用户通过R网站捐献出自己制作的程序包,对于这些程序包,R软件本身并不提供任何保证。关于下载包和载入包的问题,大家可以通过相关网站进行了解。
图1.8 加载程序包
1.7 设置R的工作目录
设置R的工作目录的方法是通过setwd命令实现,例如,在F盘下创建一个文件夹MyR,然后我们设置R的工作目录为F盘的MyR文件夹:
>setwd("F:\MyR")
注意这里需要用双斜线\,而不是一个斜线。
退出R的方法比较简单,直接点击关闭,每一次退出时会询问我们是否保存工作空间。如果你决定保存,我推荐你不要保存在默认的目录下。如果不希望保存,则可以用命令:
>q(save="no")