前言

从研究生开始接触R语言, 加上工作时间, 已经有6年的时间, 从一开始的晦涩难懂到现在的入门进阶, R语言越来越成为数据分析的重要工具. 之前一直有想法去写一些对于R语言的理解, 但是碍于时间和经验的缺乏没能实现. 由于工作的需要, 经常会在python和R语言之间切换, 导致有些相似的语法会经常混乱, 重复查找浪费时间, 因此希望能够把之前的经验编成书籍, 方便查找, 也可以帮助初学者吸取经验.

本书专注于R语言的实际应用, 不是去罗列函数的各种参数, 各种炫酷技巧, 而是去用实际的经验, 去减少对于重复问题的查找, 书籍内容包含绘图, 数据处理, 统计分析, 问题处理等.

本书的侧重点主要在于经验集合, 由于本人水平所限制, 对于统计方法的原理算法并没有很深的探究, 如有错误, 多谢指教.

参考内容:

  1. https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html
  2. https://ggplot2.tidyverse.org/
  3. https://r-graphics.org/

该部分使用的R版本及包版本

## R version 3.6.3 (2020-02-29)
## Platform: x86_64-pc-linux-gnu (64-bit)
## Running under: Ubuntu 20.04.2 LTS
## 
## Matrix products: default
## BLAS:   /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.9.0
## LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.9.0
## 
## locale:
##  [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
##  [3] LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
##  [5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
##  [7] LC_PAPER=en_US.UTF-8       LC_NAME=C                 
##  [9] LC_ADDRESS=C               LC_TELEPHONE=C            
## [11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## loaded via a namespace (and not attached):
##  [1] bookdown_0.30   digest_0.6.29   R6_2.5.1        jsonlite_1.8.0 
##  [5] magrittr_2.0.3  evaluate_0.16   stringi_1.7.8   cachem_1.0.6   
##  [9] rlang_1.1.0     cli_3.4.1       rstudioapi_0.14 jquerylib_0.1.4
## [13] bslib_0.4.0     rmarkdown_2.16  tools_3.6.3     stringr_1.4.1  
## [17] xfun_0.33       yaml_2.3.5      fastmap_1.1.0   compiler_3.6.3 
## [21] htmltools_0.5.3 knitr_1.40      sass_0.4.2