数据分析有哪些方法
现在的走势就是我们进入了一个大数据时代,有了数据我们该分析吗?数据分析的方法是什么?
一、说明统计
描述性统计是统计方法的总结,揭示了数据分布的特性.主要包括数据频率分析、数据集中趋势分析、数据分散程度分析、数据分布和一些基本统计图形.
1、缺失值填充:常用方法有去除法、平均法、决策树法.
2、正态检查:许多统计方法要求数值服从或接近正态分布,因此在进行数据分析前需要正态检查.常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法.
二、回归分析
回归分析是应用极为广泛的数据分析方法之一.根据观测数据建立变量之间的适当依赖关系,分析数据的内在规律.
1.一元线性分析
只有一个自变量x与变量y有关,x和y必须是连续变量,变量y或其差异必须遵循正态分布.
2.多元线性回归分析
使用条件:分析多个自变量x变量y的关系,x和y必须是连续变量,变量y或其差异必须遵循正态分布.
3.Logistic回归分析
线性回归模型要求变量为连续正态分布变量,自变量与变量为线性关系,但Logistic回归模型对变量分布没有要求,一般用于变量离散时的情况.
4.其他回归方法:非线性回归、秩序回归、Probit回归、加权回归等.
三、方差分析
使用条件:各种样品必须是相互独立的随机样品,各种样品来自正态分布的整体各个方差相等.
1.单因素方差分析:一个试验只有一个影响因素,或者有多个影响因素时,只分析一个因素与响应变量的关系.
2.多因素有互动差异分析:一个实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系
3.多因素没有互动差异分析:分析多个影响因素和反应变量的关系,但影响因素之间没有影响关系或忽视影响关系
4.协助者的差距祈祷:传统的差距分析有明显的缺点,无法控制分析中存在的随机因素,降低了分析结果的准确性.协调差分析主要是排除协调变量的影响后,对修正后的主要效果进行方差分析,结合线性回归和方差分析的分析方法.