文档下载
网盘链接: https://pan.baidu.com/s/1MmXM65-l9pBOVVF_cGeUtg
提取码: zark
部分内容展示
1.选题的理论意义
在医学、管理、工业等实际领域中存在着很多计数数据,对这些计数数据合理刻画并挖掘出内在信息已经得到了众多研究者的重视。泊松分布和相应的回归模型是处理此类计数数据问题的常用方法。但是,泊松分布要求均值等于方差,这个条件在实际问题中很难得到满足,其原因在于观测到的实际数据中往往存在偏大离差(方差大于均值)现象。为了克服该问题,本文提出双组份混合模型,该模型由线性回归的双分量混合组成,其中一个分量是完全已知的,而另一个分量的比例,斜率,截距和误差分布是未知的。尽管合理大小的数据集具有良好的性能,但该方法在样本量变大时会遇到严重的缺点,因为它基于对比度函数的优化,其对数点计算需要O(n2)个运算。在该工作中导出的方法的适用范围明显更大,因为它依赖于没有调整参数的矩量估计器,其计算需要O(n)运算。从理论的角度来看,欧几里德参数向量的估计量和c.d.f的半参数估计量的渐近正态性。在不涉及零对称假设的弱条件下证明了误差。另外,c.d.f的近似置信带可以使用加权引导程序计算误差,其中证明了渐近有效性。为此,本文提出双组份混合模型的参数估计方法。
近几十年来,双组份混合模型一直被统计学界和其他相关学科学者所重视研究,被广泛应用于模式识别、机器学习、生物医疗信息学、数据挖掘等不同领域,有着深入的发展和广阔的应用前景。目前,双组份混合模型在语言识别模式、图像分类与去噪、目标辨认与跟踪、聚类分析等方面取得较好的应用效果,这也使得该模型得到广泛关注和认可。本文将着重探讨双组份混合模型的参数估计方法。另外,由于随机效应除服从正态分布外还有可能服从其他分布,为此考虑不同的参数估计方法也是很有必要的。在本文中,我们还将利用Monte Carlo随机模拟方法,产生不同均值的样本,探讨
论文中提出的参数估计方法,并对参数估计的结果进行比较分析,最后通过实例来进一步说明这些方法的有效性及实际意义。将实际问题抽象成双组份混合模型,其参数空间受限,精确估计参数是我们要研究的核心问题。倘若能有较好的方法快速精确的估计参数,这一方面能为求解更为复杂的双组份混合模型提供理论参考,另外还能提升双组份混合模型在已有应用中的性能并且推动它得到更为广泛的应用。