时政要闻
时政要闻
AI新工具探索“被忽视的DNA区域”

更新时间:2025-08-01     阅读:427 次

科技日报记者 张梦然

美国索尔克研究所开发出一种名为ShortStop的机器学习框架,用于探索以往“被忽视的DNA区域”,寻找在疾病中发挥关键作用的微蛋白。相关研究发表在最新一期《BMC方法学》上。

这些微蛋白是蛋白质家族中的小型成员,其组成氨基酸通常少于150个,因此难以通过传统蛋白质分析方法检测。长期以来,它们隐藏在基因组中被视为“非编码”或“垃圾DNA”的99%区域中,从未被充分研究。然而,越来越多证据表明,这些区域并非无用,其所编码的微蛋白在调节健康与疾病过程中扮演重要角色。

传统研究方法主要关注编码大型蛋白质的DNA区域,而忽略了可能包含微蛋白编码指令的小开放阅读框(smORF)。尽管已有实验方法识别出了数千个smORF,但这些方法成本高、耗时长,且无法有效区分具有生物学功能的微蛋白与无功能的序列,严重限制了相关研究的进展。

ShortStop的出现改变了这一局面。该AI工具通过机器学习训练,不仅能够从大型基因数据库中识别出潜在的smORF,还能预测哪些微蛋白最有可能具备生物学相关性,从而显著提高研究效率。其核心创新在于采用双类别排序系统:通过将真实发现的smORF与计算机生成的随机“诱饵”序列进行比较,ShortStop能够快速评估新发现的smORF是否可能具有功能性,从而优先筛选出值得深入研究的候选者。

团队将ShortStop应用于已发布的smORF数据集后,发现约8%的序列可能编码功能性微蛋白,并已将其列为优先验证目标。该工具还能识别出以往方法遗漏的微蛋白,包括在人体细胞和组织中实际表达的种类。尤为重要的是,它可直接利用广泛存在的RNA测序数据,这意味着许多实验室无需额外实验即可开展微蛋白研究。

在一项应用实例中,团队使用ShortStop分析了肺癌相关的遗传数据,从肿瘤与正常肺组织的对比中识别出210种全新的微蛋白候选者。其中一种微蛋白在肿瘤组织中显著升高,显示出作为肺癌生物标志物或治疗靶点的巨大潜力,验证了该工具在疾病研究中的实用性。

热门新闻
聚焦落实绿色低碳行动 2025天府碳中和论坛在蓉举办
2025-11-30
2025天府碳中和论坛30日在成都开幕。此次论坛以“加快落实绿色低碳行动,开启应对气候变化新征程”为主题,共商绿色低碳发展路径,共绘双碳目标实现蓝图。图为2025天府碳中和论坛开幕式现场。本届论坛采用“主论坛+平行分论坛”相结合的形式,设1个主论坛、8场专题分论坛,聚焦碳中和科技前沿、政策机制与产业实践。包括中国工程院院士王金南、贺克斌、江亿、王琪、汪华林、张久俊,德国国家工程院院士雷宪章等在内的
行业翘楚齐聚“中国光谷” 共话人工智能产业发展
2025-11-27
2026光谷人工智能创新大会暨第三届福布斯中国人工智能科技企业TOP50评选启动活动27日下午在武汉东湖高新区(又称“中国光谷”)举行,200余位人工智能行业翘楚和创新先锋齐聚,为光谷人工智能产业发展建言献策。图为活动现场。 主办方供图福布斯中国集团首席战略官晏格文在致辞中表示,光谷作为中国科技创新的重要基地,凭借开放的生态、领先的产业基础和强大的创新资源,正成为中国人工智能产业的新高地。除主评选
2025世界绿色发展投资贸易博览会开幕 新加坡等三国为主宾国
2025-11-27
2025世界绿色发展投资贸易博览会暨中国绿色食品博览会(简称“博览会”)27日在江西南昌开幕,新加坡、爱尔兰、马来西亚担任主宾国,韩国、德国等16个国家经贸代表团参加。11月27日,2025世界绿色发展投资贸易博览会暨中国绿色食品博览会在江西南昌开幕。本届博览会由江西省人民政府主办,以“数智赋能绿色发展,开放江西链接全球”为主题,设置了开幕式、展览展示、专题招商和经贸交流等多项活动。本届博览会展览