期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

保留非全长读段的ISO-seq数据转录组表达分析

刘学军; 瞿锡垚; 张礼 南京航空航天大学计算机科学与技术学院; 南京211106; 南京林业大学信息科学技术学院; 南京210037

关键词:pacbio 转录组表达 第三代测序技术 新型异构体检测 多源映射 

摘要:近年来,基于单分子测序技术的ISO-seq数据以其超长读段长度被越来越多地应用于转录组新型异构体预测研究,但目前大多数研究工作只用到全长读段数据,丢失了非全长读段数据中较多有用信息,因而数据没有得到充分利用。针对这一问题,本文在保留非全长读段的基础上提出了两个能同时预测异构体结构和计算其表达比例的模型基于狄利克雷采样的异构体探测与预测(Dirichletsampling for isoform detection and prediction,DSIDP)和基于马尔科夫链的异构体探测与预测(Markovchain for isoform detection and predition,MCIDP)。两个模型均从全长读段中建立异构体预测集,并采用全长读段和非全长读段计算异构体表达比例。DSIDP将所有读段比对至异构体预测集,并使用Dirichlet采样解决多源映射问题,MCIDP使用马尔科夫链模拟基因外显子之间的选择性剪切,该模型还能预测出数据中没有全长读段的异构体。本文采用模拟数据和真实数据验证了两个模型的有效性。

数据采集与处理杂志要求:

{1}基金项目:如果论文是项目成果,请按“项目名称(项目号)”的形式写出。项目名称与项目号两者都要有。

{2}稿件应具有科学性、创新性和实用性,论点明确、论据可靠、数据准确、逻辑严谨、文字通顺。

{3}文中图表或插图请附清晰的原图文件(tif. 或eps.格式,不低于600 像素)。

{4}注释是对论文中某一特定内容的解释或补充说明,用带圈数字注于当页页脚。

{5}稿件文字、标点、年代、数字等书写方式均以国家有关规定为准。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据采集与处理

北大期刊
1-3个月下单

关注 30人评论|0人关注
相关期刊
服务与支付