-
Notifications
You must be signed in to change notification settings - Fork 53
/
msg-pkgs.Rmd
86 lines (57 loc) · 2.68 KB
/
msg-pkgs.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
# 本书 R 包 {#chap:MSG}
```{r include=FALSE}
library(MSG)
library(RColorBrewer)
```
为了配合本书的写作,作者特意编写了一个 R 包名为 **MSG**(Modern Statistical Graphics 的缩写),该包目前已经发布到 CRAN,所以读者可以用以下方式直接安装:
```{r install-MSG,eval=FALSE}
install.packages('MSG')
```
也可以从作者开发页面下载(<https://github.com/yihui/MSG>)并自行编译安装。这里简要介绍一下它包含的函数和数据。
## 函数说明 {#sec:MSG-fun}
`andrews_curve()`
: 根据数据矩阵画调和曲线图,参见 \@ref(sec:andrews-curve) 小节
`char_gen()`
: 给定一个长度为 2 的字符向量,生成一个字符矩阵,其中包含若干个第 2 个字符和一个第 1 个字符,看用户从一大堆第 2 个字符中辨别第 1 个字符的难度,这可以是我们选择点的外观的一种依据,参见 \@ref(subsec:clear-symbols) 小节
```{r}
char_gen(c('6', '9')) # 你能找出 6 吗?
```
`cut_plot()`
: 将一幅散点图的横坐标离散化,并计算每组内点的纵坐标的均值,参见 \@ref(subsec:data-processing) 小节
`heart_curve()`
: 画心形曲线,用作低层作图函数的练习
`vec2col()`
: 将一个向量通过 **RColorBrewer** 包中的调色板转化为颜色向量,如:
```{r}
# factor 类型的向量通常用离散调色板
vec2col(factor(c(1,1,2,3,4,4,4)))
# 数值型数据用连续调色板
vec2col(rnorm(20))
```
## 数据说明
`assists`
: 湖人和骑士比赛中的助攻数据
`BinormCircle`
: 人造数据:两个独立的正态分布随机变量(10000 行实现值),加上半径为 0.5 的圆上的点的坐标(10000 行)
`canabalt`
: 游戏末日狂奔中的得分和游戏设备数据(从 Twitter 消息获得)
`ChinaLifeEdu`
: 2005 年中国各省市的人均预期寿命和受高等教育人数
`cn_vs_us`
: 中美国力对比数据
`eq2010`
: 四川省在 2010 年的地震数据,包括发生地点的经纬度和震级
`Export.USCN`
: 1994 年到 2004 年中美出口额数据
`gov.cn.pct`
: 中国政府网站中出现的各个百分比数据的频数(2009 年 12 月 17 日通过 Google 抓取)
`murcia`
: 西班牙 Murcia 省的土壤成分数据
`music`
: 四类艺术家的音乐频率数据,两类来自古典乐,两类来自摇滚乐
`PlantCounts`
: 植物数目与海拔高度的数据,共两列,每一行数据记录了某一海拔高度上植物数目
`quake6`
: 1973 年到 2010 年全球地震中超过 6 级的地震数据,包括经度、纬度、时间等信息
`tvearn`
: 2011 年 2 月最高收入的美剧演员数据,包括收入、电视剧类型、性别、电视剧评分等信息