Google Tx-LLM：用大型语言模型助力治疗药物开发

🕗 发布于 2024-10-18 09:56 人工智能 大数据 prompt 语言模型自然语言处理

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

Tx-LLM是一款专门优化，用于预测生物实体属性的大型语言模型（LLM），它覆盖了整个治疗药物开发管道，从早期靶点发现到晚期临床试验批准。

治疗药物的临床试验失败率高，即便成功，通常也需要10到15年、耗资10到20亿美元才能开发完成。原因在于开发过程繁琐，且治疗药物需要满足多种独立标准。比如，药物必须与特定靶点结合，避免与其他实体产生作用，从而实现所需功能而不引发副作用。此外，药物还需要有效抵达目标部位、在体内适时清除，并能够规模化生产。实验测量这些特性费时费钱，因而使用机器学习（ML）进行快速预测成为一种替代方案。

因此，Tx-LLM应运而生。该模型基于PaLM-2进行了微调，能够预测与药物开发相关的多个实体属性，如小分子、蛋白质、核酸、细胞系及疾病等。Tx-LLM在66个药物发现数据集上进行了训练，覆盖从早期靶基因识别到临床试验批准的多个环节。在43项任务上，Tx-LLM的表现达到了当前最先进模型的水平，并在22项任务上超越了它们。值得注意的是，Tx-LLM不仅可以结合分子信息与文本信息，还能在不同类型的治疗任务之间实现能力迁移，成为贯穿药物开发全流程的单一模型。

Tx-LLM的训练依赖精心整理的"治疗指令调优"（TxT）数据集，它涵盖709个与治疗药物开发相关的数据集。通过将Therapeutic Data Commons（TDC）中的66项任务数据转化为适合LLM训练的指令-回答格式，Tx-LLM得以提升其在多种任务上的表现。TxT数据集的构建不仅依赖TDC，还引入了文献中的额外信息，使得模型能够区分子任务。此外，部分特性直接以文本形式展示（如细胞系），这使得模型能更好地利用其自然语言预训练能力。

在性能测试中，Tx-LLM在许多任务上展现了强大的数值预测能力，这在以往的LLM中并不常见。特别是在处理小分子与文本结合的任务时，Tx-LLM表现尤其出色。例如，在给定药物和疾病名称的情况下预测药物是否会被批准，Tx-LLM的表现优于现有的顶尖模型。

虽然Tx-LLM在多个任务中表现出色，但它仍有改进空间，特别是在解释其预测结果时。未来，随着模型继续发展，它可能会对整个治疗药物开发过程产生深远影响，大幅缩短开发时间、降低成本。

目前，团队正评估如何将Tx-LLM的能力开放给外部研究人员使用。如果有兴趣探索该模型的应用，欢迎与团队联系。了解外部的实际需求将有助于推动模型的进一步优化与发展。

原文地址：https://blog.csdn.net/2301_79342058/article/details/143030851

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：React前端框架高级技巧
下一篇：网关Gateway作用介绍和快速入门

Web前端高级工程师培训：函数式编程
管道、组合取舍：管道及组合最大区别在于执行顺序的不同，数据流向不同，达到目的是类似的。可读性更强，js函数不管是否是纯函数都会有一个语义化的名称，更便于阅读。js是多范式编程语言，
阅读更多2024-10-18
前端如何在生成环境下实现自动检测更新
建立一个WebSocket连接，服务器在发布新版本时通过WebSocket向客户端发送更新通知。优点：实时性强，能够即时通知客户端更新。缺点：需要额外的服务器资源来维护WebSocket连接，且可能受
阅读更多2024-10-18
从零实现数据结构：堆的实现和简单堆排序
同理这里向下调整也是一样，需要注意的是这里的写法，我们先是假设左边的结点是小的，然后再用判断。如果不这样做，则需要将父节点和两个子节点进行比较，这样会造成多余的比较次数。当我们交换完成之后，发现依然不
阅读更多2024-10-18
webAPI中的排他思想、自定义属性操作、节点操作（配大量案例练习）
本文旨在帮助大家学习webAPI中的排他思想、自定义属性操作以及节点操作，里面加入了大量练习帮助掌握相关技术
阅读更多2024-10-18
Linux之实战命令41：lshw应用实例(七十五)
本篇目的：Linux之实战命令41：lshw应用实例lshw是 Linux 系统中的一个强大命令行工具，用于获取系统硬件的详细信息。与其他命令相比，lshw提供了更全面的硬件配置报告，涵盖了处理器、内
阅读更多2024-10-18
Nodemon 深入解析与使用
Nodemon 深入解析与使用指南Nodemon 是一个强大的开发工具，用于监控 Node.js 应用程序中的文件变更，能自动重启应用，极大提高开发效率
阅读更多2024-10-18
【Midjourney 中文版】想象的舞台
只需用中文输入你心中的画面描述，无论是梦幻般的仙境、未来感十足的城市景观，还是充满故事的人物形象，它都能迅速理解你的意图，并在瞬间将其转化为令人震撼的视觉图像。这种从文字到图像的神奇转变，仿佛为你的想
阅读更多2024-10-18
C语言 | Leetcode C语言题解之第492题构造矩形
C语言 | Leetcode C语言题解之第492题构造矩形
阅读更多2024-10-18
Github 2024-10-18Java开源项目日报Top9
根据Github Trendings的统计，今日(2024-10-18统计)共有9个项目上榜。
阅读更多2024-10-18
汽车3D动画外包还是自己动手渲染？
高质量的3D渲染往往需要大量的计算资源和时间，如何在保证效果的同时提高渲染效率，是制作过程中的一大挑战。通过将渲染任务提交到云渲染农场，你可以利用专业的渲染集群来完成工作，而你的本地计算机可以继续进行
阅读更多2024-10-18

Google Tx-LLM：用大型语言模型助力治疗药物开发

相关文章