了解复杂的生物学途径,如基因相互作用和基因调控网络,对于探索疾病机制和推进药物开发至关重要。然而,手工文献管理这些途径不能跟上指数增长的发现。大规模语言模型(llm)在广泛的文本语料库上训练,包含丰富的生物信息,可以作为生物知识图用于路径管理。
最近,《定量生物学》发表了一篇题为《大语言模型在挖掘基因关系和通路知识中的综合评价》的研究。本研究评估了21种大型语言模型(llm)检索生物学知识的能力,包括基于api和开源模型。评估的重点是预测基因调控关系(激活、抑制和磷酸化)和识别途径中的基因成分,使用京都基因和基因组百科全书(KEGG)途径作为基本事实,如图1所示。
结果显示了模型性能的显著差异,基于api的模型优于开源模型。研究结果表明,虽然llm在基因网络分析和通路定位方面提供了信息,但它们的有效性各不相同,因此需要仔细选择模型。GPT-4和Claude-Pro在预测基因调控关系方面表现最好,比其他模型具有更高的精度和召回率。这项研究强调了在生物学研究中为特定任务选择合适的计算工具的重要性。它还提供了一个案例研究,说明了llm作为数据挖掘的知识图的一般使用。
本文来自作者[一吃就胖小小翠]投稿,不代表立金云立场,如若转载,请注明出处:https://wak.lijinyun.cn/cskp/202505-2558.html
评论列表(4条)
我是立金云的签约作者“一吃就胖小小翠”!
希望本篇文章《大型语言模型在基因关联与通路知识发现中的综合分析》能对你有所帮助!
本站[立金云]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:了解复杂的生物学途径,如基因相互作用和基因调控网络,对于探索疾病机制和推进药物开发至关重要。然而,手工文献管理这些途径不能跟上指数增长的发现。大规模语言模型(...