Skip to content

Commit 98a2239

Browse files
committed
外国人姓与名之间的点号可以从键盘直接输入,不需要借助数学符号 $\cdot$
1 parent 1377a42 commit 98a2239

10 files changed

+12
-12
lines changed

Modern-Stat-Graphics.bib

+1-1
Original file line numberDiff line numberDiff line change
@@ -259,7 +259,7 @@ @manual{Xie07
259259
title = {Visualization of Data and Statistical Models Using R},
260260
year = {2007},
261261
url = {http://1t.click/ajpa},
262-
publisher = {第 3 届计量模型与中国 $\cdot$ 澳大利亚自由贸易区发展国际研讨会论文集},
262+
publisher = {第 3 届计量模型与中国·澳大利亚自由贸易区发展国际研讨会论文集},
263263
note = {Unpublished manuscript},
264264
}
265265

data.Rmd

+2-2
Original file line numberDiff line numberDiff line change
@@ -8,7 +8,7 @@ library(ggplot2)
88

99
> “哦,你还不知道吧?”他笑了,大声说道。“很惭愧,我写了几篇专论,都是技术方面的。比方说,有一篇叫《论各种烟灰的辨别》。此文列举了一百四十种雪茄烟。卷烟、烟斗烟丝的烟灰,并附有彩色插图,以说明烟灰的区别。这是刑事审判中常常出现的重要证据,有时还是案件的重要线索。举例说,如果你断定某一谋杀案系一个抽印度雪茄的男人所为,显然缩小了侦查范围。在训练有素的人看来,印度雪茄的黑灰与‘鸟眼’牌的白灰的区别,正如白菜和土豆的区别一样大。”
1010
>
11-
> --- 柯南 $\cdot$ 道尔《四签名》
11+
> --- 柯南·道尔《四签名》
1212
1313
本章中我们首先从数据的角度对前文中所叙述的统计图形进行简单的梳理与总结,即:什么样的数据适合用什么样的统计图形展示,以及数据中的信息以怎样的方式表达;然后我们以一些实际数据案例来说明统计图形的应用,这些数据都尽量取自生活,以保证足够的新颖性;最后我们也利用统计模拟生成的数据来说明统计图形的另类价值,即它在解释统计模型中的独特地位。
1414

@@ -294,7 +294,7 @@ gplot(assists, displaylabels = TRUE, label.cex = .7)
294294
assists[1:5, 1:5]
295295
```
296296

297-
West 为 Varejao、Hickson 和 James 各助攻 1 次,James 为 Parker 和 West 各助攻一次。数据中一共有 22 位球员,因此完整数据矩阵维数为 $22\times22$。网络图能让我们很快看出比赛中的助攻关系,图中两个“聚类”显然分别是骑士和湖人的队员。总体来看,骑士队内部助攻次数较多,助攻网比较大,但也有些特立独行的球员如“大鲨鱼”奥尼尔(中锋),他在这场比赛里没有为任何人助攻。湖人队依然是以科比为中心,这一点想必没有读者会觉得惊讶。据说因为莫 $\cdot$ 威廉姆斯在雄鹿队的时候不爱给易建联传球,所以中国球迷给他取名“莫不传”,实际上这场比赛中他也是有助攻的。
297+
West 为 Varejao、Hickson 和 James 各助攻 1 次,James 为 Parker 和 West 各助攻一次。数据中一共有 22 位球员,因此完整数据矩阵维数为 $22\times22$。网络图能让我们很快看出比赛中的助攻关系,图中两个“聚类”显然分别是骑士和湖人的队员。总体来看,骑士队内部助攻次数较多,助攻网比较大,但也有些特立独行的球员如“大鲨鱼”奥尼尔(中锋),他在这场比赛里没有为任何人助攻。湖人队依然是以科比为中心,这一点想必没有读者会觉得惊讶。据说因为莫·威廉姆斯在雄鹿队的时候不爱给易建联传球,所以中国球迷给他取名“莫不传”,实际上这场比赛中他也是有助攻的。
298298

299299

300300
```{r CLEvsLAL09,results='hide',fig.cap="(ref:CLEvsLAL09)",fig.scap=" 投篮坐标与结果的平滑散点图 ",message=FALSE}

elements.Rmd

+2-2
Original file line numberDiff line numberDiff line change
@@ -6,13 +6,13 @@
66
>
77
> 只有“沼地”两个字是用墨水写的。
88
>
9-
> “现在,”亨利 $\cdot$ 巴斯克维尔爵士说,“福尔摩斯先生,也许您可以告诉我,这是什么意思,到底是谁对我的事这么感兴趣呢?”
9+
> “现在,”亨利·巴斯克维尔爵士说,“福尔摩斯先生,也许您可以告诉我,这是什么意思,到底是谁对我的事这么感兴趣呢?”
1010
>
1111
> ……“可是,亲爱的华生,两者之间的联系非常紧密,短信中的每个单字都是从这个长句中抽出来的。例如:‘你’、‘你的’、‘生’、‘命’、‘理性’、‘价值’、‘远离’等,你现在还看不出这些字是从那里面弄来的吗?”
1212
>
1313
> “天啊!太对了!唉呀,您可聪明绝顶!”亨利爵士喊了起来。
1414
>
15-
> --- 柯南 $\cdot$ 道尔《巴斯克维尔的猎犬》
15+
> --- 柯南·道尔《巴斯克维尔的猎犬》
1616
1717
任何一幅统计图形都是由最基础的图形元素构成的,这些元素我们并不陌生,无非就是颜色、点、线(直线、曲线、线段甚至箭头)、矩形、任意多边形、文本以及图例。R 提供了相应的一系列函数,用以向已有的图形中添加图形元素。事实上,R 的所有作图函数分为两类,一类是高层函数(high-level),用以生成新的图形;另一类就是低层函数(low-level),这一类指的正是绘制图形元素的这些基础函数。
1818

gallery.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,7 @@
22

33
> 他解释说:"你要明白,我认为人的大脑原本像一间空空的屋子,必须有选择地用一些家具填满它。只有笨蛋才把他碰到的各种各样的破烂都塞进去。这样的话,那些可能用得上的知识就被挤了出来;或者,充其量也只是把那些破烂同其它东西混杂在一块儿。结果,在需要时却难得找到了。因此,一个善于工作的人,对于将什么东西纳入自己的头脑里是非常仔细的。他只会容纳那些工作时用得着的工具,而且又将这些工具分门别类,安排得井然有序。如果认为这间屋子的墙壁富有弹性,可以随意扩展,那就大错特错了。毫无疑问,总有一天,当你增加点滴知识时,却把从前熟悉的知识给忘记了。因此,不要让无用的信息挤掉那些有用的信息,这一点是至关重要的。"
44
>
5-
> --- 柯南 $\cdot$ 道尔《血字的研究》
5+
> --- 柯南·道尔《血字的研究》
66
77

88
本章中,我们结合 R 语言中的相关函数以及数据实例对各种统计图形依次作出介绍。从第 \@ref(sec:hist) 节到 \@ref(sec:pie) 节的所有图形都是基于 **graphics** 包所作,其后的图形均来自于其它函数包。图形的介绍顺序大致按函数的字母序,但直方图、箱线图和散点图等常见图形放在前面,而饼图被有意安排在最后。

history.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,7 @@
22

33
> “这易如反掌,”他说,“我看到你左脚穿的那只鞋的内侧,也就是炉火刚好照到的地方,皮面上有六道几乎平行的划痕。显然,这些划痕是有人为了去掉沾在鞋跟上的泥疙瘩,极其粗心大意地顺着鞋跟刮泥而造成的。因此,现在你就明白了我得出的这两个推断:其一,你曾经在恶劣的天气外出过;其二,你穿的皮靴上面的特别难看的划痕是伦敦的女佣所为。至于你开业行医,这么说吧,如果一位先生走进我的房间,身上带有碘的气味,右手食指上有硝酸银腐蚀的黑斑,高顶黑色大礼帽的右侧鼓起一块,那里面藏着听诊器,而我不断言他是医务界的一位活跃分子,那我不是太迟钝了吗?
44
>
5-
> --- 柯南 $\cdot$ 道尔《波希米亚丑闻》
5+
> --- 柯南·道尔《波希米亚丑闻》
66
77
统计图形的意义在于引导我们观察到统计数据中的信息。用著名统计学家 John Tukey 的话来讲,就是“图形的最大价值就是使我们注意到我们从来没有料到过的信息”(The greatest value of a picture is when it forces us to notice what we never expected to see)。从这个意义上讲,统计图形的重要性自然不言而喻。
88

model.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@
66
>
77
> “好的,如果一个人不费吹灰之力就能一步跨出四英尺半,他不可能年老体衰,因为花园小径上的泥坑恰好长四英尺半,他显然是一步跨过去的,漆皮靴则是绕过去的,所以这也没有什么神秘之处。我只不过是将我在那篇文章中推崇的一些观察和演绎的规则应用在日常生活中罢了。你还有什么不明白的地方吗?”
88
>
9-
> --- 柯南 $\cdot$ 道尔《血字的研究》
9+
> --- 柯南·道尔《血字的研究》
1010
1111
\@ref(sec:begin) 小节中我们曾经提到三种基本的统计分析方式,其中包括推断统计分析和探索统计分析,表面上看来,统计模型在前者中占主导地位,而统计图形在后者中往往起着非常重要的作用,然而本章要探讨和揭示的则是以探索为目标的统计图形与以推断为目标的统计模型之间的联系。
1212

postscript.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -18,7 +18,7 @@
1818

1919
在 Iowa 州立大学的学习让我更新了不少知识,尤其是在两位专家 Di Cook 和 Heike Hofmann 的影响下。原本这书的目标只是介绍基础图形系统,也就是第 \@ref(cha:elements) 章和第 \@ref(cha:gallery) 章的内容,但随着知识的积累和 R 自身的更新,写着写着我就感觉落后于时代了,书名中有“现代”二字,如果只是基础图形系统,那么实在不敢称“现代”,所以在完成第 \@ref(cha:gallery) 章之后,我加入了第 \@ref(chap:system) 章内容,这样起码在工具上有点现代的感觉,例如 ggplot2 和动画,都是 R 里面的新事物。纯粹的工具介绍对读者来说可能会显得枯燥,尽管大部分图形都有对应的数据,但那些数据往往都是很老旧的数据,人人皆知;Cook 经常对我“怒吼”:No more `iris` data!!她对我使用旧数据有一肚子不满,我想这大概可以代表一部分读者的心情,于是这本书有了第 \@ref(chap:data) 章,我尽力找了新数据,要说它们有多新呢?图 \@ref(fig:pork-price-orig) 是我 2011 年 2 月 22 日收到的邮件,23 日我把它写进了书里。第 \@ref(chap:principle) 章放在最后作为所有技术性内容之后的一个总结,但它实际上也交织着技术性内容;我在导读中引用了“形而上者谓之道,形而下者谓之器”,实际上我觉得道与器无法分家,这道理就像“学而不思则罔,思而不学则怠”一样。
2020

21-
本书每章开头都挑选了一段《福尔摩斯探案集》中的文字,其内容与各章内容有一定关联,这也是由于我个人在上高中时就喜欢看福尔摩斯,并且我认为统计图形也可以看作是一种小小的“探案”。探案集中我最喜欢的一篇是《血字的研究》,尤其欣赏该篇的第二部分中大篇的景色描写,以及对主人公杰弗逊 $\cdot$ 霍普坚韧不拔性格的刻画,这种波澜壮阔的笔法,令我着实艳羡不已,只可惜我没这种文字功夫能把书写得如此吸引人,于是只能寄希望于“一图胜千言”了。
21+
本书每章开头都挑选了一段《福尔摩斯探案集》中的文字,其内容与各章内容有一定关联,这也是由于我个人在上高中时就喜欢看福尔摩斯,并且我认为统计图形也可以看作是一种小小的“探案”。探案集中我最喜欢的一篇是《血字的研究》,尤其欣赏该篇的第二部分中大篇的景色描写,以及对主人公杰弗逊·霍普坚韧不拔性格的刻画,这种波澜壮阔的笔法,令我着实艳羡不已,只可惜我没这种文字功夫能把书写得如此吸引人,于是只能寄希望于“一图胜千言”了。
2222

2323
诗云:人事有代谢,往来成古今。江山留胜迹,我辈复登临。
2424

principle.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@ library(MSG)
66

77
> “情况的确如此,我在这方面有直觉。偶尔也会出现一些较复杂的案子,那我就得忙碌一阵子,亲自去查访一番。要知道,我有许多特殊知识,可以用来解开这些谜团,而且能轻易地解决问题。那篇文章中讨论的推理的原则,让你很鄙视,但对我的实际工作却是无价之宝。敏锐的观察力是我的第二天性。我们俩第一次见面时;我说起你是从阿富汗来的,你那时似乎很惊讶哩。”
88
>
9-
> --- 柯南 $\cdot$ 道尔《血字的研究》
9+
> --- 柯南·道尔《血字的研究》
1010
1111
从技术角度来说,作图是一件很容易的事情,但作一幅好的统计图形则并非易事,它需要一些指导原则。那么图形优劣的评判标准是什么?最直接的标准就是,读者能否通过图形清楚地了解数据中的信息。这涉及到对读者群体的心理学研究和对数据的反复思考,比如,饼图和条形图分别用角度和长度来表达数值大小,那么人眼对角度和长度的感知精度是一样的吗?心理学调查结果显示并非如此:人眼对角度的感知较差。迄今为止,专门做过统计图形方面的心理学研究的统计学家寥寥无几,其中成果最显著的当属 @Cleveland85 ,本章也主要基于他的一些观点进行总结与展开。
1212

system.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@
66
>
77
> “与该案可能有关的任何事实,无论是多么地间接,特别是年轻的巴斯克维尔与邻里的关系或与查尔兹爵士暴卒有关的任何新的问题。”
88
>
9-
> --- 柯南 $\cdot$ 道尔《巴斯克维尔的猎犬》
9+
> --- 柯南·道尔《巴斯克维尔的猎犬》
1010
1111
除了基础图形系统之外,R 还自带另一套图形系统即 **grid**(网格图形),网格图形系统是一套基础设施性质的图形系统,它本身不包含统计图形,只是提供了一些画图形元素的工具。在此基础上诞生了 **lattice** 图形系统和 **ggplot2** 图形系统,其中 **lattice** 包已经随 R 本身发布,**ggplot2** 包目前的地位还只是一个附加包,但由于它的灵活和美观,用户数量与日俱增,所以我们在本章优先介绍它,并且建议读者可以不必学习 **lattice** 系统。除了这些静态图形系统之外,R 还有一些附加包支持动态图形和交互式图形,即:用户可以用鼠标或键盘和图形进行交互,比如用鼠标选取图中的点并高亮,或者拖拉旋转图形;代表性的附加包有 **rggobi** 、 **iplots** 、 **rgl** 和 **playwith** 等。另外我们还可以利用 R 包 **animation** 生成动画。这些附加包极大增强了统计图形的探索功能和趣味性。
1212

tools.Rmd

+1-1
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,7 @@
22

33
> "好了,好了,我的好伙计,就这么办吧。我们在这房子里共同生活了好几年,如果再蹲在同一座牢房里就更有意思了。华生,我跟你说实话。我一直有个想法:我要是当罪犯,一定是超一流的。这是我在这方面难得的一次机会。看这儿!"他从抽屉里拿出一个整洁的皮制小袋,打开来亮出里面几件闪亮的工具。"这是最新最好的盗窃工具,镀镍的撬棒,镶着金刚石的玻璃刀,万能钥匙,以及对付现代文明所需要的各种新玩意儿。我这儿还有在黑暗中使用的灯。一切都准备好了。你有走路不出声的鞋吗?"
44
>
5-
> --- 柯南 $\cdot$ 道尔《查尔斯 $\cdot$ 密尔沃顿》
5+
> --- 柯南·道尔《查尔斯·密尔沃顿》
66
77
那么我们面对这么多工具应该如何选择呢?我们认为主要的准则有三点:一是统计计算功能齐全,二是统计元素易于控制,三是图形类型丰富多样。
88

0 commit comments

Comments
 (0)