Meta推出先进大型语言模型 下一个ChatGPT不远了?

ChatGPT的爆火引爆了AI行业,全球科技巨子争相杀入这一范畴打开混战。周五,Meta也宣告推出大型语言模型LLaMA,加入到由微软、谷歌等科技巨子主导的AI“军备竞赛”中。

当地时间2月24日,Meta宣告将推出针对研讨社区的“Meta人工智能大型语言模型”系统(Large Language Model Meta AI),简称“LLaMA”。

同ChatGPT、New Bing不同,LLaMA并不是一个任何人都能够与之对话的产品,也并未接入任何Meta应用。更为确切地说,该产品将是一个开源的“研讨东西”。

公司CEO扎克伯格在社交媒体上表明,LLaMA旨在协助研讨人员推动研讨工作,LLM(大型语言模型)在文本生成、问题答复、书面材料总结,以及自动证明数学定理、猜测蛋白质结构等更复杂的方面也有很大的发展前景。

Meta推出先进大型语言模型 下一个ChatGPT不远了?

Meta推出先进大型语言模型 下一个ChatGPT不远了?

开源的“研讨东西”

Meta表明,LLaMA能够在非商业许可下供给给政府、社区和学术界的研讨人员和实体工作者,正在接受研讨人员的申请。

此外,LLaMA将供给底层代码供用户运用,因而用户能够自行调整模型,并将其用于与研讨相关的用例。与之截然不同的是,谷歌旗下的DeepMind和OpenAI并不揭露练习代码。

该公司还表明,LLaMA作为一个根底模型被规划成多功能的,能够应用于许多不同的用例,而不是为特定使命规划的微调模型。

Meta推出先进大型语言模型 下一个ChatGPT不远了?

比GPT3.5功能更强

依据Meta官网介绍,LLaMA包含4个根底模型,参数分别为70亿、130亿、330亿和650亿。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 万亿个 tOKens 上练习,而最小的模型 LLaMA 7B 也经过了 1 万亿个 tokens 的练习。

Meta推出先进大型语言模型 下一个ChatGPT不远了?

Meta表明,在大多数基准测验中,参数小的多的LLaMA-13B的功能优于GPT3.5的前身GPT3-175B,而LLaMA-65B更可与业界最佳的Chinchilla-70B和PaLM-540B竞赛。值得一提的是,近期大火的ChatGPT就是由GPT3.5供给支持。

Meta推出先进大型语言模型 下一个ChatGPT不远了?

Meta 还提及,LLaMA-13B对算力的要求“低得多”,能够在单个数据中心级GPU(Nvidia Tesla V100)上运行。

扎克伯格写道:

“Meta 致力于这种开放的研讨形式,咱们将向 AI 研讨社区供给咱们的新模型。”

值得一提的是,上一年5月,Meta 也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研讨人员的,这构成了其谈天机器人 blenterbot 新迭代的根底。后来,该公司还推出了一款名为“卡拉狄加”(Galactica) 的模型,但因经常分享成见和不准确的信息而遭到下架。

据媒体报道,扎克伯格已将人工智能作为公司内部的首要使命,其本人也经常在财报电话会议和采访中谈论它对改善 Meta 产品的重要性。媒体分析称,尽管现在 LLaMA 没有在 Meta 产品中运用,但未来不扫除运用的或许。

本文不构成个人出资主张,不代表平台观点,市场有风险,出资需谨慎,请独立判断和决议计划。

此时快讯

【花花公子即将推出 MetaMansion 虚拟世界】金色财经报道,花花公子MetaMansion即将推出。花花公子的 Web3 负责人 Liz Suman上周在 NFT Paris表示,虚拟世界定于今年推出,即使对于不属于该杂志品牌 Rabbitar 社区的用户,也将有办法进入。 
该项目与 Animoca Brands 的 The Sandbox 合作,于去年夏天宣布。2021 年,该集团推出了第一个 NFT 系列,利用了其跨越数十年的摄影和艺术品档案。
版权声明:本文收集于互联网,如有侵权请联系站长删除。
转载请注明:Meta推出先进大型语言模型 下一个ChatGPT不远了? | 币百度

相关文章