是2014年清华大学出版社出版的图书,作者薛毅、陈立萍。
本房热核地否统书的主要内容 :第 1章,R语言入门 .主要介绍 R的基本使用方法 ,如 R的下载与安装;向量、矩阵、数组、列表、数据框等对象的特点 ,以及数据的读写、控制流和相应程序设计.第 2章,数值计算 .主要介绍与数值分析相关的部分内容 ,如非线性方程组求解、函数求极值、数据拟合与来自数值积分等 .第 3360百科章,R语言绘图 .主要介绍 R中的绘图函数 ,如高、低水平绘图函数 ,以及绘图参数的设置 .第 4章,概率、分布与随机模拟 .主要南介绍 R中重要分 布函数的计算 ,以及随机抽样与随机模拟的方法 .第 5章,假设检验 .主要介绍重要的参数检验 ,如 t检验、 F检验和重要的非参数检验 ,如试秩检验、分布检验、列联表检验 .第 6章,回归分析 .伯即房四留浓德它信领充主要介绍各种回归方法 ,如线性回归、稳健回归、非线性回归和广义线性回归 .第 7章,多元统计分析 .介绍各种多元分析方法 ,如方差分析、船杨系求志联棉矛国判别分析、聚类分析、主成分分析、因子分析和典型相关分析 .第 8章南肥概支概升,多元分布 .主要介绍多元正态批板车美请绿分布函数和相应的检验方法 ,如均值向量的检验 ,以及相关程序包的下载 ,这部分内容是需要下载织编节合火扩展程序包才能完成的.《克压统计建模与 R软件》一书出马南模根房指无引江版 (2007年 4月出版 )已有 7个年头 ,当初编写此书的主要目的是希望学生在数学建模竞赛中 ,使用 R软斯资究负群该损需陆却件解决他们可能遇到的统计问题 .随着 R软件在中国的普及与发展 ,令这起依万离核此书有幸成为 R语言初学者的入门教材 1 .因此 ,当有反告速谈证节所错留钟人向我建议,专门编写一本 R语言的入门教材时得,本人欣然同意,并着手这方面的工作.
真正开始编写教材后 ,遇到的困难超出我的想盐行死黄确意布象 .首先 ,R语言涵盖的内容非常济期粮百五广泛 ,而且国内近年来已出版了大量与 R语言有关的书籍 ,哪些内容是初学者必备的知识 ?其次 ,如何处理本书与前一本书的关系 ,哪些内容需要保留 ,哪些知识又需要补充 ?再次 掉万于态贵耐处察若态城,统计知识介绍到什么程度 眼胡差让比济例伟何作格?R语言是进行统计分析的工具 ,如果本书 "只是讲解 R",是不可能做到的 .
R语言是一种自由软件编程语言与操作环境 ,主要用于统计分析、绘图、数据挖掘 .R本来是由新西兰奥克兰大学的 Ross Ihaka和 Robert Gentleman开发(也因此称为 R),现在由 "R开发核心团队 "负责开发 .虽然 R是主要用于统计分析的软件 ,但也有人用作矩阵计算,其分析速度可媲美专用于矩阵计算的自由软件 GNU Octave和商业软件 MATLAB2 .
本书是 R语言的一本入门教材 ,它包括 R软件下载与安装、程序包的载入和基本的 R命令 ,这些都是学习 R所必备的内容 .为了避免同时讲授统计知识和 R语言可能产生的困难,本书假定读者对相关的统计知识有了一定的了解 .书中只是结合最基本的统计知识 ,介绍相关函数的使用方法 ,以及如何使用内置函数去解决统计中的问题 ,相关统计知识的介绍是为了更好地理解函数中相应参数的意义.
虽然 R是一款统计软件 ,但它也涉及数值分析的相关内容 ,而且这些内容是统计计算中不可缺少的内容 .因此 ,本书用一章的篇幅对数值分析的部分内容作了简要的介绍 .介绍它们的另一个目的是学习 R语言的编程 ,R与其他计算机语言一样 ,是可以进行编程的 .学会编程可以扩展 R的使用范围 ,这也是使用 R进行科学研究必备的条件 .R的另一个强大的功能是绘图 ,本书也用一章的篇幅系统地介绍了 R语言的绘图函数 ,以及绘图参数的设置.
本书的每一章 ,基本上是针对一类 (统计 )问题设计的 ,讨论的内容由浅入深、循序渐进.完成一章的学习后 ,基本上能完成相关内容的计算与分析 .虽然是一本入门教材 ,但了解 R的扩展功能还是必不可少的 ,本书以多元分布为例 ,介绍扩展包的下载与安装、扩展函数的使用,为读者学会下载和使用与自己学习和工作相关的扩展函数打下基础.
本书所介绍的 R函数均以 R-2.15.2版本 1为基准 ,所有函数 (包括自编函数 )均通过测试,读者如果需要书中例题的相关程序 ,以及例题和部分习题的数据文件 ,可以发送电子邮件向作者索取。
本书是一本 R语言入门教材 ,适合于理工、经济、管理、生物等专业的本科生、研究生 ,或者相关专业的技术人员学习 R软件使用 ,可以作为 "统计计算 "课程的教材或教学参考书,也可作为数学建模竞赛培训的辅导教材.
由于受编者水平所限 ,书中一定存在不足甚至错误之处 ,欢迎读者不吝指正 。
编者
2014年 3月于北京工业大学
第 1章 R语言入门 .1
1.1 R语言简介1
1.1.1 R软件的下载与安装 . 1
1.1.2初识 R. 2
1.1.3下拉式菜单与快捷方式.4
1.2向量. .15
1.2.1基本运算 15
1.2.2数据对象 17
1.2.3向量赋值 18
1.2.4产生有规律的向量 19
1.2.5逻辑向量 21
1.2.6向量中的缺失数据 21
1.2.7字符型向量 . 22
1.2.8用 vector函数生成向量 . 24
1.2.9复数向量 25
1.2.10向量的下标运算 . 25
1.2.11与数值向量有关的函数 27
1.3因子. .28
1.3.1 factor函数 28
1.3.2 gl函数 29
1.3.3与因子有关的函数 29
1.4矩阵. .30
1.4.1矩阵的生成 . 30
1.4.2与矩阵运算有关的函数 . 31
1.4.3矩阵下标 33
1.5数组. .34
1.5.1数组的生成 . 34
1.5.2数组下标 34
1.5.3 apply函数 36
1.6对象和它的模式与属性.36
1.6.1固有属性:mode和 length 37
1.6.2修改对象的长度.37
1.6.3 attributes和 attr函数 38
1.6.4对象的 class属性 . 39
1.7列表. .39
1.7.1列表的构造 . 39
1.7.2列表的修改 . 40
1.7.3返回值为列表的函数 40
1.8数据框 . 40
1.8.1数据框的生成 . 41
1.8.2数据框的引用 . 42
1.8.3 attach函数. .42
1.8.4 with函数 . 43
1.8.5列表与数据框的编辑 43
1.8.6 lapply函数和 sapply函数.43
1.9读、写数据文件 44
1.9.1读纯文本文件 . 44
1.9.2读取其他软件格式的数据文件 46
1.9.3读取 Excel表格数据 47
1.9.4数据集的读取 . 49
1.9.5写数据文件 . 50
1.10控制流 51
1.10.1分支函数. .51
1.10.2中止语句与空语句 52
1.10.3循环函数. .53
1.11 R程序设计 . 54
1.11.1函数定义. .54
1.11.2定义新的二元运算 56
1.11.3有名参数与默认参数. .56
1.11.4递归函数. .57
1.11.5程序运行. .57
1.11.6程序调试. .59习题 1 . 61
第 2章数值计算 63
2.1向量与矩阵的运算 . 63
2.1.1向量的四则运算.63
2.1.2向量的内积与外积 64
2.1.3矩阵的四则运算.65
2.1.4矩阵的函数运算.66
2.1.5求解线性方程组.67
2.1.6矩阵分解 69
2.2非线性方程 (组)求根 73
2.2.1非线性方程求根.73
2.2.2求解非线性方程组 77
2.3求函数极值 80
2.3.1一元函数极值 . 80
2.3.2多元函数极值 . 81
2.4插值. .87
2.4.1多项式插值 . 87
2.4.2分段线性插值 . 88
2.4.3分段 Hermite插值 90
2.4.4三次样条函数 . 90
2.5数据拟合 . 93
2.5.1最小二乘原理 . 93
2.5.2求解超定线性方程组的 QR分解方法 . 94
2.5.3多项式拟合 . 97
2.6数值积分 . 97
2.6.1梯形求积公式 . 97
2.6.2 Simpson求积公式 .98
2.6.3 integrate函数 . 99习题 2 100
第 3章 R语言绘图 103
3.1高水平绘图函数.103
3.1.1基本绘图函数 -- plot函数 103
3.1.2多组图 -- pairs函数.105
3.1.3协同图 -- coplot函数 . 109
3.1.4点图 -- dotchart函数 . 110
3.1.5饼图 -- pie函数 . 113
3.1.6条形图 -- parplot函数 114
3.1.7直方图 -- hist函数 115
3.1.8箱线图 -- boxplot函数 117
3.1.9 Q-Q图 -- qqnorm函数. .119
3.1.10三维透视图 -- persp函数 120
3.1.11等值线 -- contour函数 . 122
3.2图形参数 . .123
3.2.1高水平绘图函数中的参数 124
3.2.2图形参数的永久设置 . 124
3.2.3图形参数的临时设置 . 125
3.2.4图形元素控制 125
3.3低水平图形函数.127
3.3.1添加点、线、文字、符号或数学表达式 . 127
3.3.2添加直线、线段和图例 . 130
3.3.3添加图题、边与盒子 . 132
3.3.4添加多边形或图形阴影 134
3.3.5交互图形函数 135
3.4图形参数 (续) . 136
3.4.1坐标轴与坐标刻度 . 136
3.4.2图形边空 .137
3.4.3多图环境 .138
3.5图形设备 . .143习题 3 144
第 4章概率、分布与随机模拟 . 146
4.1组合数与概率计算 146
4.1.1生成组合方案 146
4.1.2生成组合数 146
4.1.3概率计算 .146
4.2分布函数 . .147
4.2.1分布函数 .147
4.2.2分位数 . 148
4.3常用的分布函数.148
4.3.1正态分布 .148
4.3.2均匀分布 .150
4.3.3指数分布 .150
4.3.4二项分布 .151
4.3.5 Poisson分布 . 152
4.3.6 χ2分布 154
4.3.7 t分布 154
4.3.8 F分布 . 155
4.3.9 R的内置函数 155
4.4样本统计量 . 157
4.4.1样本均值 .157
4.4.2样本方差 .157
4.4.3顺序统计量 158
4.4.4中位数 . 159
4.4.5分位数 . 159
4.4.6样本的 k阶矩 . 160
4.4.7偏度系数与峰度系数 . 160
4.4.8经验分布函数 161
4.5随机抽样与随机模拟 163
4.5.1随机数的生成 163
4.5.2随机抽样 .164
4.5.3随机模拟 .166习题 4 169
第 5章假设检验 . 172
5.1假设检验的基本思想 172
5.1.1基本概念 .172
5.1.2基本思想 .172
5.1.3两类错误 .173
5.1.4 P值 . 173
5.2重要的参数检验.173
5.2.1 t检验 173
5.2.2 F检验 . 176
5.2.3二项分布的近似检验 . 178
5.2.4二项分布的精确检验 . 182
5.2.5 Poisson检验 . 184
5.2.6功效检验 .185
5.3符号检验与秩检验 189
5.3.1符号检验 .189
5.3.2秩检验与秩和检验 . 191
5.3.3尺度参数检验 196
5.4分布检验 . .197
5.4.1 Pearson拟合优度 χ2检验 . 197
5.4.2 Kolmogorov-Smirnov检验 . .200
5.4.3正态性检验 202
5.5列联表检验 . 203
5.5.1 Pearson χ2独立性检验 203
5.5.2 Fisher精确独立性检验.205
5.5.3 McNemar检验 . 207
5.5.4三维列联表的条件独立性检验 . 208
5.6相关性检验 . 210
5.6.1 Pearson相关检验 211
5.6.2 Spearman相关检验 211
5.6.3 Kendall相关检验 212
5.6.4 cor.test函数 . 213
5.7游程检验 . .215习题 5 216
第 6章回归分析 . 223
6.1线性回归 . .223
6.1.1线性回归模型 223
6.1.2线性回归模型的计算 . 225
6.1.3预测区间与置信区间 . 227
6.1.4其他函数 .230
6.2回归诊断 . .230
6.2.1为什么要作回归诊断 . 231
6.2.2残差检验 .232
6.2.3影响分析 .236
6.3 Box-Cox变换 . 240
6.4多重共线性 . 243
6.4.1多重共线性现象 . 244
6.4.2岭估计 . 245
6.5逐步回归 . .247
6.5.1"最优"回归方程的选择 . 247
6.5.2逐步回归的计算 . 247
6.6稳健回归 . .251
6.6.1稳健回归的基本概念 . 252
6.6.2稳健回归 .253
6.6.3抗干扰回归 255
6.7非线性回归 . 257
6.7.1多项式回归 258
6.7.2局部多项式回归 . 260
6.7.3非线性回归 262
6.8广义线性回归模型 265
6.8.1 glm函数 . 266
6.8.2 Logistic回归模型 267
6.8.3 Poisson分布族 . 271
6.8.4正态分布族 273习题 6 274
第 7章多元统计分析 281
7.1方差分析 . .281
7.1.1方差分析的数学模型 . 281
7.1.2方差分析的计算 . 284
7.1.3多重均值检验 289
7.1.4与方差分析有关的函数 291
7.1.5方差分析的进一步讨论 293
7.1.6秩检验 . 295
7.1.7协方差分析 299
7.2判别分析 . .301
7.2.1判别分析的数学模型 . 302
7.2.2判别分析的计算 . 302
7.3聚类分析 . .306
7.3.1距离和相似系数 . 306
7.3.2系统聚类法 308
7.3.3类个数的确定 314
7.3.4实例 . 315
7.3.5 K均值聚类 319
7.4主成分分析 . 320
7.4.1主成分分析的数学模型 320
7.4.2主成分分析的计算 . 321
7.4.3主成分分析的应用 . 326
7.5因子分析 . .330
7.5.1因子分析的数学模型 . 330
7.5.2因子分析函数 331
7.5.3因子分析的计算 . 332
7.6典型相关分析 . 339
7.6.1典型相关分析的数学模型 340
7.6.2典型相关分析的计算 . 340习题 7 342
第 8章多元分布 . 352
8.1基本概念 . .352
8.1.1多元分布函数与概率密度函数 . 352
8.1.2多元正态分布 352
8.1.3与多元正态分布有关的 R函数 353
8.2样本统计量及抽样分布 . 357
8.2.1样本统计量 357
8.2.2抽样分布 .359
8.3多元正态总体均值向量的检验 360
8.3.1单个总体均值向量的检验 360
8.3.2两个总体均值向量的检验 360
8.3.3 R中的均值检验函数 .361
8.4扩展包中的其他函数 365
8.4.1多元 t分布 365
8.4.2多元非参数检验 . 366
8.4.3多元正态性检验 . 370习题 8 370
索引 373
参考文献 . .384