metamod,metamop

编辑:编辑部【新智元导读】外媒爆料,Meta正在加急研发全新开源大模型,对标GPT-4,参数量比Llama 2还要大上数倍。Meta这是又要颠覆AI社区了?根据

编辑部:编辑部

【新智元导读】外媒爆料,Meta正在加急研发全新开源大模型,对标GPT-4,参数量比Llama 2还要大上数倍。Meta这是又要颠覆AI社区了?

据海外媒体《华尔街日报》报道,Meta正在加紧开发新的大规模语言模型,其功能完全兼容GPT-4,将于明年发布。

eef63ab02e0045a5825120566cc7c7a0~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=wszXCj%2FRdWSHfvy5uC%2FsR5dLlcc%3D

该消息还强调,Meta 的新大规模语言模型比Llama 2 大数倍,并且是开源的,并且很可能支持免费商业使用。

自今年年初Meta“不小心”泄露LlaMA 以来,到7 月份Llama 2 开源发布,Meta 逐渐在这股AI 浪潮中占据一席之地。 —— AI开源社区旗帜。

14922dcec45f418dbeee438c907c346d~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=dNFYEXUhzM%2BsoPVTAM%2F1uqUS6Sg%3D

工作人员不断焦躁,模型能力存在缺陷。我们依靠开源让我们回到主桌。

继今年早些时候OpenAI 凭借GPT-4 进军科技行业后,谷歌和微软也推出了自己的AI 产品。

5月,美国监管机构与当时考虑涉足AI行业的各大公司CEO召开圆桌会议,讨论AI技术的发展。

OpenAI、谷歌和微软都受邀参加,其中包括初创公司Anthropic,但Meta 没有出席。当时官方对梅塔缺席的回应是,“我们只会邀请AI行业顶尖的公司”。

b539db71c88841d2948853b289b993da~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=t0%2BQfKDfy1uRq6LAJXovNcIsd%2Fs%3D

梅塔并没有发生什么好事,但麻烦仍在继续。

首先,6月初,国会直接向小扎发出质询信,要求他严词解释3月LlaMA泄密事件的前因后果。

2a8f29b0d812424aa23d7277fcccacb4~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=ViGrvVxD0TQMy2YMhH5vlrsm5xM%3D

《Llama 2》发布几个月后,Meta 斥巨资打造的AI 团队仍在慢慢瓦解。

在Llama 2 的致谢中,最初开始这项研究的四个提到的团队中的三个已经辞职,Edouard Glaive 是现在元中唯一剩下的一个。

f65fb61f146a495ebb74d16d50dce51e~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=uF8ru3nfqs8mfHO86kXu%2BQcN5Jc%3D

行业巨头何恺明也计划离开Meta,重返学术界。

e2ded459dfad45b79aef810aa7b19e95~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=E3Dr0J6MkTK9q1I7i5Vs66u%2Ba6A%3D

据The Information 最近发表的一篇突发文章称,由于内部算力竞争,Meta 的AI 团队摩擦不断,导致一波人才离开公司。

在这样的背景下,小扎本人应该明确表示,Meta自己的大规模语言模型实际上无法与业界最先进的GPT-4竞争。

无论是不同方向的基准测试还是用户反馈,Llama 2 与GPT-4 的差距还是比较大的。

0ad2933f11d14faa994640368cab6b00~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=tybn%2FKwb1bv%2BRNHCqxjHpH0jRSE%3D

开源的Llama 2 和GPT-4 在各种基准测试中仍然存在显着差异。

9549f1e5d5e64316babb998582618e24~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=jqy%2BZjoVBp6z3EiKKcUzYblP4jQ%3D

网友们的实践经验也始终强调,GPT-4 还是比Llama 2 先进很多。

于是小扎决定让Meta继续它的开源典范之路。

或许小扎背后的逻辑是这样的。隐藏元模型的功能是没有意义的,因为它很平均,无法与闭源巨头竞争。然后,只需将它们开源,以便人工智能社区可以继续迭代自己的模型并扩大其产品在行业中的影响力。

此外,小扎多次公开表示,开源社区对其模型的迭代将激励技术团队未来开发出更具竞争力的产品。

2021e663915241508cfb4685478d4219~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=ALicFcFIT%2BmNnLKho7NHgBt010Y%3D

小扎在Fridman的播客中强调,开源让Meta能够从社区中汲取灵感,未来Meta可能会推出闭源模式。

参考:https://lexfridman.com/mark-zuckerberg-2/

而事实证明,Meta的选择确实是正确的。

尽管在计算资源和技术力量上不如Google和OpenAI,但Meta的Llama 2等开源模型对开源社区的吸引力仍然是首屈一指的。随着Llama 2逐渐成为AI开源社区的“技术基础”,Meta也在行业内找到了自己的生态位。

最明显的迹象是,小扎最终将作为监管机构的嘉宾,出席9 月份关于人工智能的国会闭门会议,与该行业最前沿公司的首席执行官一起,包括:在谷歌和OpenAI,他代表并为AI行业发声。

40a969b23dec4534b8d422cc5c2bfc81~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=Xgo%2F%2BiBJdXZSPTTmxb%2FcCyHZ4u0%3D

而如果明年发布的新模型Meta 继续前进并获得与GPT-4 相同的功能,一方面可以帮助开源社区继续缩小与闭源巨头之间一年左右的差距。

同时,小扎在采访中还透露,如果未来大模型的特性得到进一步完善,Meta可能会推出自己的闭源模型。如果新模型能够更加接近业界的SOTA,也许用不了多久Meta就会推出自己的闭源模型。

虽然Meta似乎暂时落后于这波AI浪潮,但小扎的野心并不只是跟随者。

在“AI三巨头”Yann Lecun的带领下,Meta也准备颠覆整个行业。

元的未来

那么,在这个堪比GPT-4的神秘大模型之后,元人工智能的未来将会如何呢?

由于我们还没有具体的信息,所以只能做一些猜测,比如从MetaAI首席科学家LeCun的态度来推断。

GPT这个当红炸子鸡,一直是LeCun诟病和鄙视的人工智能发展路线。

今年2月4日,LeCun直言“大规模语言模型是通向人类水平AI的道路上完全弯曲的道路”。

5e4fa0e999a24933b832eed6b21f9166~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=8sbSXHG4GRJ5d1nLnlAFW33HZRw%3D

他认为,这种根据概率生成自回归的大规模模型最多只能维持五年。因为这些人工智能只是接受了大量文本的训练,无法理解现实世界。

因此,这些模型无法计划或推理,而仅具有在上下文中学习的能力。

说真的,这些受过法学硕士训练的人工智能几乎没有什么“智能”。

LeCun先生希望的是一个通向AGI的“世界模型”。

15d2c5afa9df40c899ba5ac1fe255276~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=zEgPgh8N5sJGFSdM9l5DvU5Ic8Q%3D

世界模型了解世界是如何运作的,让您能够更快地学习、计划完成复杂的任务,并随时应对新的和不熟悉的情况。

这与法学硕士不同,法学硕士需要大量的事先培训。世界模型和人类一样,可以通过观察发现模式,适应新环境,学习新技能。

相比OpenAI在LLM领域不断完善和深化的策略,Meta力求多样化的模型开发。

今年6月14日,Meta发布了“类人”人工智能模型I-JEPA。这也是第一个基于LeCun 世界模型愿景关键部分的人工智能模型。

ee36e55495a84383befd92aae92b7ca1~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=HM34%2FGsG%2FCcRuyY21gbR8HjaK2E%3D

论文地址:https://arxiv.org/abs/2301.08243

I-JEPA可以通过监督学习来理解图像中的抽象表达并获取常识。

而且I-JEPA不需要任何额外的人工知识作为辅助。

Meta随后发布了Voicebox,这是一种基于——流匹配(Meta AI提出的新方法)的全新突破性语音生成系统。

06ad12e550e541bca849fc4c0f5bd9ae~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=6okUxp1LD%2FN1kFp0NMogY4WwdKQ%3D

合成六种语言的音频并执行去噪、编辑内容、转换音频风格等操作。

Meta还发布了通用物理AI代理。

通过语言引导的技能协调(LSC),机器人可以在部分预先映射的环境中自由移动和拾取。

Meta 在多模式模型的开发上也有所不同。

ImageBind 是第一个可以绑定来自六种不同模式的信息的人工智能模型。

1129f8aafaf044aba420183562aef972~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=enR1Fh1sYt21sf0uuH6vA%2Fa1npI%3D

这使得机器能够通过将照片中的物体与声音、三维形状、温度和移动方式联系起来,全面理解照片中的物体。

RoboAgent 由Meta AI 和CMU_Robotics 共同开发,使机器人能够学习各种重要技能并将其应用于数百种生活场景。

与此同时,所有这些场景提供的数据比该领域之前的研究少一个数量级。

bb6c137a3f674f8d93c089b209272cbf~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=kD141q3s5rC1ZpzaWDxiAnr8L2w%3D

对于此次发布的模型,有网友表示希望继续开源。

44aec6f89cae4e41a059f3126723e2d2~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=fNFIqkf5dJbPzsRkzEtOyT%2F6KwU%3D

不过,有网友表示梅塔要到2024年初才会开始训练。

5e8395745bea4c1896e0048943adee12~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717785382&x-signature=qrvKxOdJvjT%2BQ4rlANE9c0wBFtM%3D

不过,好消息是,meta 已经表明,它仍然坚持原来的策略。

参考:

https://www.wsj.com/tech/ai/meta-is-development-a-new-more-powerful-ai-system-as-technology-race-escalates-decf9451?mod=followamazon

原创文章,作者:小条,如若转载,请注明出处:https://www.sudun.com/ask/84002.html

(0)
小条的头像小条
上一篇 2024年6月1日 上午2:34
下一篇 2024年6月1日 上午2:36

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注