Meta解散AI蛋白质团队获英伟达加持完成142亿美元融资

Meta解散AI蛋白质团队获英伟达加持完成142亿美元融资

币界网报道:

“行业观察者”是我们专门为人工智能、XR、元宇宙和Web3等前沿科技设立的专栏,旨在分享这些领域中新兴企业和创业者的故事。

生物学前沿人工智能研究实验室EvolutionaryScale近日宣布获得超过1.42亿美元的种子轮融资,并发布了里程碑式的AI模型ESM3。这家成立仅一年的公司在AI生命科学领域有着独特的理念,其全新的蛋白质大模型展示了技术上的重大突破。以下是我们的第17期内容,以下Enjoy。

一周前,在Meta如火如荼地卷文生视频赛道的时候,那个被它解散的蛋白质团队EvolutionaryScale获得了超1.42亿美元的种子轮融资,这个融资额在整个生物技术领域都可以说是高得离谱。

去年八月,Meta宣布其旗下蛋白质折叠团队Meta-FAIR解散。这个纯粹的“科学+AI”项目并不能让Meta快速获得收益,Meta专注于商业化AI的决定看似也是情理之中。

然而,这个未受看好的团队却在短短一年内创下了一些意想不到的成就。他们最新推出的ESM3被认为是生物学领域具有里程碑意义的生成式AI模型,为生物学编程开创了新的可能性。

01.1分钟项目速览

1. 项目名称:EvolutionaryScale
2. 成立时间:2023年7月
3. 产品简介:开发用于创造新型蛋白质和其他生物系统的大型语言模型——ESM,目前已迭代到ESM-3。
4. 创始人团队:首席科学家Alexander Rives(纽约大学计算机科学博士、前Facebook AI科学家)、Tom Sercu、Sal Candido
5. 融资情况:2024年6月25日完成了高达1.42亿美元的种子轮融资。本次融资由Nat Friedman和Daniel Gross以及Lux Capital领投,亚马逊、NVentures(英伟达的风险投资部门)和天使投资人参投。

02.团队协同一致的理念追求

人工智能的进步为生物科学研究创造了前所未有的机会,包括设计功能性生物分子,尤其是蛋白质。将人工智能运用于蛋白质设计,不仅可以提升蛋白质设计的效率及成功率,还通过快速应对传染病爆发等方式,来帮助人类解决一些正在面临的挑战。

Alexander Rives等人正是看到了蛋白质设计方面的缺口,决定开发基于深度学习的大模型,从而推动产业级蛋白质设计进入“全自动智能生成时代”。

于是,EvolutionaryScale应运而生。它是一家专注于生物科学领域的前沿AI研究实验室,致力于推出生物学前沿的语言大模型。

有意思的是,该公司创始团队的八位成员全都来自于Meta的FAIR(基础人工智能研究)部门。尽管在世界级的社交媒体巨头那里吃了瘪,但初始团队的核心人员都没有放弃,反而快速地投入新战地,开始在原有团队成果的基础上开发下一代模型。

EvolutionaryScale的大模型支持健康、环境科学等领域的研究与开发,不停探索生物学的扩展性,为突破性的科学研究提供动力。其中最显著的成果就是蛋白质折叠技术的突破,ESM模型揭示了数亿个宏基因组蛋白质的结构,帮助世界各地的科学家来模拟和理解蛋白质。

EvolutionaryScale旨在通过开放、安全的研究方式,来指导蛋白质设计领域的人工智能技术开发。

在此基础上,该公司作为签署方,引领了超160位来自学术界、政府以及民间的全球利益相关者,共同发展这项技术,确保其安全可靠,从而达成造福人类健康和社会的愿景。

正是由于怀着引领生物学界先进AI技术的责任感,Alexander Rives和他的团队从未停止脚步。

此前,EvolutionaryScale曾发布过大型语言模型ESM1,这被认为是第一个用于蛋白质的transformer语言模型,由EvolutionaryScale的创始团队在Meta的FAIR部门工作期间所构建。作为ESM1升级模型的ESM2拥有1500万个参数,并且相较于旧模型ESM1b(拥有6.5亿个参数)表现更佳。

上周,EvolutionaryScale发布了最新的ESM3 AI模型,这是朝着生物学的未来所迈进的一大步。凭借这种模型的能力,有可能会加速广泛应用的发现,有利于创造有助于捕获碳的蛋白质,从而开发出新的癌症治疗方法。

03.AI在生物学应用的先驱

ESM3是一个生成式的AI模型,主要功能是生成新型蛋白质。该模型通过深度学习技术,使用大量的蛋白质数据进行训练,从而学习蛋白质的序列、结构和功能之间的关系。

ESM3的训练使用了超过1万亿teraflops的计算能力,这是目前已知生物学领域中最大的计算规模。它在地球上自然多样性的27.8亿种蛋白质数据集上进行了训练,使其能够同时对蛋白质的序列、结构和功能进行推理。

ESM3的主要工作流程可简略为以下四个步骤:

数据收集与处理:EvolutionaryScale首先会从各种来源收集大量的生物学数据,包括基因序列、蛋白质结构、功能注释等。这些数据会经过清洗、标准化和格式化处理,以便于后续的分析和应用。

模型训练:使用深度学习算法和大量的计算资源

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注