R语言编程基础
上QQ阅读APP看书,第一时间看更新

1.1.1 R语言的基本信息

R 语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratories)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具。R 语言是面向对象的一种编程语言,也是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。它具有下列优势。

(1)R语言是完全免费的统计分析软件,可以在不同的平台上运行,包括 Windows、UNIX、Mac OS和Linux。

(2)R 语言可以轻松地从各种类型的数据源读写数据,包括带分隔符的文件、统计软件、数据库管理系统,以及专门的数据仓库。几乎所有类型的数据都可以用R语言进行分析统计。

(3)R语言的优势主要体现在其软件包生态系统具有较高的开放性(即免费开源)。R语言不仅提供功能丰富的内置函数供用户调用,也允许用户编写自定义函数来扩充功能。读者无须申请权限即可直接查看软件包或程序包的源码,并且对其进行拓展。如果某项统计技术已经存在,那么必然存在着一款R软件包与之对应。

(4)R语言具有顶尖水准的制图功能。R语言的拓展包dplyr与ggplot2可分别用于数据处理与绘图,且能够非常直观地提升用户对数据的理解。

图1-1所示是信用卡客户经济情况分布的直方图,展示了R语言的绘图能力。该图用来分析信用卡客户的个人月开销、月刷卡额、个人月收入和家庭月收入等变量。由图1-1可知,信用卡客户的个人月开销主要集中在1万元以下和1万元至2万元之间;多数客户的月刷卡额在2万元至8万元之间;个人月收入中有1/3左右的客户无收入,其余客户个人月收入主要集中在2万元至4万元之间,4万元以上的占少数;家庭月收入为2万元至4万元的客户尤为突出,说明大部分客户的家庭经济水平中等。

图1-1 信用卡客户经济情况分布直方图

第5章及第6章将继续讨论这些图形,介绍更多的R语言在图形展示方面的强大功能,让用户以简单方便的方式创建优雅、信息丰富、高度定制的专业图形。