测序错误和重复序列对无参照基因组单核苷酸多态性分型的影响 |
| |
引用本文: | 窦锦壮,赵熙强,付晓腾,焦文倩,王南南,张玲玲,胡晓丽,王师,包振民.测序错误和重复序列对无参照基因组单核苷酸多态性分型的影响[J].中国海洋大学学报(自然科学版),2013(5):120-124. |
| |
作者姓名: | 窦锦壮 赵熙强 付晓腾 焦文倩 王南南 张玲玲 胡晓丽 王师 包振民 |
| |
作者单位: | 中国海洋大学海洋生命学院海洋生物遗传育种教育部重点实验室;中国海洋大学数学科学学院 |
| |
基金项目: | 国家自然科学基金重点项目(31130054);国家基础研究发展计划项目(2010CB126402);国家高技术研究发展计划项目(2012AA10A405);教育部新世优秀人才支持计划项目(NCET-10-0761)资助 |
| |
摘 要: | 单核苷酸多态性(Single nucleotide polymorphism—SNP)被认为是揭示遗传变异理想的分子标记,近几年来一系列针对高通量测序平台的技术如RAD,GBS,RRLs,2b-RAD等成为非模式生物尤其是水生动物的de novo SNP标记规模开发和大样本群体遗传研究的有利途径。本文从理论上讨论了测序错误和重复序列因素对de novo SNP分型的影响,并利用模式生物拟南芥RAD模拟数据对理论分析进行了验证。通过理论推导和模拟验证发现测序数据量在15~20X左右时单拷贝区域内SNP被检测的概率大于95%,等位基因的支持度不小于2时能够有效屏蔽掉测序错误对SNP分型的影响(假阳性低于2%),这些为实际数据的de novo SNP分型提供了理论上的指导。
|
关 键 词: | de novo SNP分型 测序错误 重复序列 |
本文献已被 CNKI 等数据库收录! |
|