微软推出Phi-3,一款轻量级语言模型,强大且多才多艺

微软推出Phi-3,一款轻量级语言模型,强大且多才多艺

微软宣布推出了一款小型人工智能语言模型,能够完成编写社交媒体帖子和使用较少的数据创建内容等任务。
这家科技巨头在一份声明中表示,他们的新轻量级模型Phi-3-mini在进行编码、数学和语言能力等一系列基准测试时,能够超越其十倍大小的更大模型。
Phi-3是小型企业的适用解决方案
微软表示,这些小型模型使资源有限的小企业更容易执行简单任务,因为它们是根据这种方法设计的。
微软解释说,Phi-3可以被企业用于从市场研究报告中提取相关信息和业务趋势,并获取和总结长文档的要点。
Phi-3将即时提供在微软的云服务平台Azure的AI模型目录上,Hugging Face是一个机器学习模型测试和部署平台,Ollama是一个提供运行模型框架的平台。
更多Phi-3模型将具备更多功能
Phi-3具有38亿个参数,并且在训练过程中使用的数据相对较少,与Gemini或GPT-4等大型语言模型相比。微软在去年底发布了Phi-2,专家表示它的表现与一些更大型的模型一样出色。预计Phi-3将比其前身表现更好。
微软计划推出该模型的另外两个版本,作为系列中的第一个版本,即Phi-3 Small和Phi-3 Medium,其参数能力不同,分别为70亿到140亿。
这款轻量级模型无法生成像云端大型语言模型一样的结果,但它可以与Mistral和llama-3等其他小型模型竞争,解决编写代码、解决数学方程和学术论文等问题。
Phi-3的另一个附加优势是它可以在没有互联网连接的情况下运行,也可以在像手机这样的小型设备上运行。对于无法承担基于云端的大型语言模型的小型公司来说,Phi-3是一种具有成本效益的解决方案,可以进入人工智能领域。
路透社的原始新闻可以在这里看到,微软的研究论文在这里。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注