收藏本站
《知识经济》 2017年18期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

统计缺失数据处理方法的比较研究

魏娜  孙霞  
【摘要】:本文通过比较常见的几种对缺失数据的统计处理方法,提出基于聚类分析的回归插补法。即在插补前先利用多元统计分析中的聚类分析对样本进行聚类,然后在每一类中分别进行回归,用回归值插补缺失值。通过实证分析在不同缺失率下,对插补效果进行比较,结果发现随机插补效果最差,普通回归插补、EM算法次之,聚类回归插补效果最好。
【作者单位】北京中油金达环保技术有限公司西安分公司;洛川县统计局;
【关键词】缺失数据 聚类分析 回归插补
【分类号】:O212.1
【正文快照】:
一、绪论随着经济社会的不断发展,统计的作用越来越重要,而统计数据质量的好坏,直接影响统计分析的效率和分析结果的可靠性。而在数据收集和处理过程中,往往会出现数据缺失的现象,缺失数据主要表现为由于部分信息的缺少而引起数据在某个或某些属性的值在数据集中时不完全。在

【相似文献】
中国期刊全文数据库 前10条
1 金勇进;调查中的数据缺失及处理(Ⅰ)——缺失数据及其影响[J];数理统计与管理;2001年01期
2 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期
3 赵慧秀;马文卿;;带有缺失数据的估计方程[J];曲阜师范大学学报(自然科学版);2009年03期
4 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期
5 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期
6 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期
7 金勇进;缺失数据的偏差校正(系列三)[J];数理统计与管理;2001年04期
8 毕华,李济洪;带有缺失数据的聚类分析方法[J];华北工学院学报;2003年05期
9 李开灿;;有缺失数据的META-MARKOV模型的局部计算[J];应用数学学报;2007年03期
10 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期
中国重要会议论文全文数据库 前2条
1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
中国博士学位论文全文数据库 前9条
1 彭清艳;广义函数型回归模型及缺失数据模型[D];云南大学;2016年
2 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
3 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
4 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
5 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
6 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年
7 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
8 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
9 付志慧;多维项目反应模型的参数估计[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年
2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年
3 母建熊;基于饱和模型的带有缺失的可交换两值数据分析[D];东南大学;2015年
4 雷伟;带有不可忽略缺失数据的混合线性模型的贝叶斯统计推断[D];云南大学;2016年
5 刘星;缺失数据下关于广义线性模型的一些讨论[D];扬州大学;2016年
6 郭似童;缺失数据下半参数模型的序列相关性检验[D];重庆理工大学;2016年
7 崔朝杰;含有缺失数据的两值吸毒数据分析[D];东北师范大学;2009年
8 岳春柳;缺失数据的概率主成分分析[D];东北师范大学;2010年
9 齐丹丹;对含缺失数据的非参可加模型进行成分选取[D];东北师范大学;2010年
10 胡贤利;混合型数据的缺失数据的填补[D];中南大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026