目录

章节概览

01
变量、数值/逻辑/字符/因子、向量与 data.frame、缺失值。
02
脏数据识别与清洗、缺失/异常/重复/不一致处理、数据集成与转换。
03
单变量描述、分组汇总、交叉表与基础图表。
04
假设检验、t 检验、卡方与 Fisher、置信区间。
05
lm()、多重回归、残差与诊断图。
06
glm 二分类、OR、ROC 与混淆矩阵。
07
K-means、层次聚类、PCA。
08
支持度/置信度/提升度,Apriori 与 FP-Growth,在处方/检查数据中的应用。