超高维缺失响应数据的特征筛选 |
| |
引用本文: | 邹丽英,刘祎.超高维缺失响应数据的特征筛选[J].中国海洋大学学报(自然科学版),2023(1):147-156. |
| |
作者姓名: | 邹丽英 刘祎 |
| |
作者单位: | 中国海洋大学数学科学学院 |
| |
基金项目: | 国家自然科学基金项目(11801567)资助~~; |
| |
摘 要: | 本文提出了一种解决超高维缺失响应数据的特征筛选的新方法。首先,通过插补技术,补全缺失响应变量值,构造插补响应变量与协变量分布函数之间的距离相关系数,以此作为筛选指标进行特征筛选。所提出的筛选方法具有以下优势:第一,它是一个非参数无模型假设的方法,可以处理变量间的非线性关系;第二,对协变量异常值稳健;第三,可以直接处理多维响应变量情形。然后,通过数值模拟展示了所提方法的性能与表现,并与现有的筛选方法进行了比较。最后,将所提方法应用于弥漫性大B细胞淋巴瘤的数据分析,分析结果表明基于该方法拟合后的模型具有更好的风险分离效果。
|
关 键 词: | 超高维数据 随机缺失 特征筛选 稳健距离相关 无模型假设 |
|
|