回归分析都是统计学的核心。它其实是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。通常,回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。
回归是一个令人困惑的词,因为它有许多特殊变种(见下表)。对于回归模型的拟合,R提供的强大而丰富的功能和选项也同样令人困惑。
回归类型 | 用 途 |
简单线性 | 用一个量化的解释变量预测一个量化的响应变量 |
多项式 | 用一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式 |
多元线性 | 用两个或多个量化的解释变量预测一个量化的响应变量 |
多变量 | 用一个或多个解释变量预测多个响应变量 |
Logistic | 用一个或多个解释变量预测一个类别型响应变量 |
泊松 | 用一个或多个解释变量预测一个代表频数的响应变量 |
时间序列 | 对误差项相关的时间序列数据建模 |
非线性 | 用一个或多个量化的解释变量预测一个量化的响应变量,不过模型是非线性的 |
非参数 | 用一个或多个量化的解释变量预测一个量化的响应变量,模型的形式源自数据形式,不事先设定 |
稳健 | 用一个或多个量化的解释变量预测一个量化的响应变量,能抵御强影响点的干扰 |
Cox比例风险 | 用一个或多个解释变量预测一个事件(死亡、失败或旧病复发)发生的时间 |
R Example