降维算法

Created by 银河统计工作室Code BaoRui
July 28





简介

现实世界中数据一般都是复杂和高维的,比如描述一个人,有姓名、年龄、性别、受教育程度、收入、地址、电话等等几十种属性,如此多的属性对于数据分析是一个严重的挑战,除了极大增加建模的成本和模型的复杂度,往往也会导致过拟合问题,因此在实际处理过程中,一些降维的方法是必不可少,其中用的比较多的有主成分分析(PCA)[Principal Component Analysis]、奇异值分解(SVD)[Singular Value Decomposition]、特征选择(Feature Select)等等。






数据描述性统计


              

模型内容简介


                

Python Example