你的位置:age动漫(www.agefans.net) > 新闻动态 > >200万人关注!马斯克Grok 3号称“地表最强AI”,性能超DeepSeek,OpenAI加紧围堵
热点资讯
新闻动态

200万人关注!马斯克Grok 3号称“地表最强AI”,性能超DeepSeek,OpenAI加紧围堵

发布日期:2025-03-06 03:46    点击次数:50

马斯克(图片来源:视频截图)

刚刚,马斯克(Elon Musk)提前扔出"王炸",与 OpenAI o1、DeepSeek-V3/R1 等模型一决高下。

北京时间 2 月 18 日 12 点 30 分左右,马斯克 xAI 团队展示和 OpenAI 一样的发布会形式,三位技术负责人与马斯克一同发布 Grok 3 基座大模型。在此之前,马斯克称其为"地球上最聪明的人工智能"。

同时,xAI 还公布推理 AI 模型 Grok3 mini(Reasoning,精简版),基于 Grok 3 的"深度思考"(Deep thinking)的 Agent 智能搜索引擎,以及基于 Grok App 的独立订阅服务" Super Grok "等。

据钛媒体 AGI 统计,这场直播在 X 平台上拥有超过 200 万人观看。

具体来说,Grok3 模型训练计算量(能力)比上一代高 10 倍,使用了 20 万张 GPU 卡集群,第一阶段 122 天使用 10 万个 GPU 全面训练同步,第二个阶段,92 天扩展到 20 万张 GPU 卡再次训练、推理。

结果显示,在数学能力测试(AIME24)中,Grok-3 模型获得 52 分,超过 DeepSeek-V3 的 39 分,以及 OpenAI o3-mini 等模型;科学知识评估(GPQA)、编程能力测试(LCB Oct-Feb)等方面,Grok-3 模型表现优异,最新 AIME 2025 性能测试中,Grok-3 Reasoning Beta 版本在推理和计算时间复合评分上取得 93 分的优异成绩,其精简版本 Grok-3 mini 也达到了 90 分,而 DeepSeek-R1、Gemini-2 Flash Thinking 分别为 75 分、54 分。

马斯克表示,Grok 3 比 Grok 2 的能力提升了一个数量级。在一系列演示中,马斯克和他的同事让 Grok 3 解决一道物理题,并创作一款融合《宝石迷阵》和《俄罗斯方块》的游戏,不过,Grok 3 的推理模型处于测试版,仍在训练中。

事实上,就在上周在迪拜的世界政府峰会上,马斯克提到,xAI 距离发布新产品还有一、两周的时间,以确保最佳的用户体验,因为他不想操之过急。然而如今,马斯克决定提前推出 Grok 3,而且他花了整个周末的时间和他的团队一起完善产品。

"我们有信心 Grok 3 会比其他任何 AI 都强,而且很有可能,再也不会有比 Grok(系列)更强的 AI 了。"马斯克表示,Grok 3 模型有非常强大的 AI 推理能力,在测试中,Grok 3 的表现"优于市面上任何已知产品"。

然而,目前有分析指出,在 "推理 + 测试时间计算" 这一测试中,使用 20 万张卡的 Grok 3 模型,其数学性能相较于 o3-mini-high 模型,或是 DeepSeek R1 模型,并没有显著优势。

马斯克也坦言,语音模式仍有点不稳定,大概一周后可能推出,不过它非常棒。据悉,从今天开始,X 平台 Premium Plus 订阅用户将率先获得 Grok 3 访问权限,独立应用则需要订阅 Super Grok 服务,售价还未公布。

这场马斯克与 OpenAI 争夺"地表最强 AI "的故事并未结束。

这场直播的同一时间,OpenAI 对 FT "透风"称:为抵御马斯克主动发起的收购要约,OpenAI 正在考虑赋予其非营利性董事会特殊投票权,将确保其对重组后的公司保持控制权,并能够否决包括微软和软银等现有投资者以及董事会决策,从而确保 OpenAI 能够击退像马斯克这样的外部敌意收购。

OpenAI CEO 奥尔特曼早前透露:GPT-4.5 将会让更多人感受到 AGI 时刻。

Grok 3 如何成为"地表最强 AI 模型"

xAI 公司成立于 2023 年 7 月,马斯克的团队成员主要来自 OpenAI、DeepMind 以及其他顶级 AI 研究公司。马斯克创立 xAI 公司的目的,就是与 OpenAI 展开竞争。

回溯 2015 年,马斯克与奥尔特曼等人共同创立 OpenAI,旨在推动 AI 技术开源,让更多人受益。但到了 2018 年,双方出现分歧。马斯克坚持 OpenAI 保持非营利属性,专注开源和安全,并且马想要多数股权和董事会控制权,却被奥尔特曼拒绝,奥尔特曼则想让公司转为营利性,以吸引更多资本投入 AI 技术开发。

最终,马斯克在 2018 年离开公司,并且随着 ChatGPT 的爆火,马斯克建立 xAI 参与竞争。

过去一年多时间里,xAI 团队发布了 Grok、Grok 1.5、Grok 2 模型。去年 12 月,xAI 宣布将向 X 平台上所有用户免费提供 Grok-2 服务。同时,xAI 还发布 Grok 独立应用程序,这意味着用户不需要依赖 X 平台访问 AI 模型。

如今,马斯克证明自己的时间到了。

直播开始时,马斯克表示,xAI 和 Grok 的使命是了解 AGI(宇宙)的本质,外星人在哪里,生命的意义是什么?这将是好奇心所驱动,同时也导致 xAI 成为最大限度寻求真相的 AGI 公司的原因。

在此之前,Grok 2 模型使用了 2400 亿参数规模,性能媲美 GPT-4,如今在 Grok 3 上,"我们有一个非常正确的工程团队和所有最好的 AI 力量,我们唯一需要的是来自大集群的智能体系。我们现在可以恢复 xAI 的整个进度,运行多少个 GPU 来训练一个大型语言模型来压缩整个互联网。"

马斯克指出,过去的日子里,团队在训练质量上遇到了很多麻烦。"自(去年)2 月开始,我们认为我们有大量的芯片,但事实证明,我们几乎不能让训练芯片在任何给定的时间连贯地运行,冷却和电源问题太多了,数据中心真的有点像 AK 芯片,平均 80% 的效率,数百次有效 H100 训练。4 个月后,我们花了 122 天才完成了第一个 10 万卡训练,但我们并没有就此止步。实际上决定,如果我们想要构建巨型人工智能,需要立即将集群的大小增加一倍。因此,我们在另一个地方做了 92 天。"

马斯克早前直言,Grok 3 将成为 AI 领域真正的颠覆者,"有时候我觉得 Grok 3 聪明得可怕,如果它发现数据错了,它会反思并删除错误数据。"

马斯克表示,xAI 是基于合成数据进行训练的,能够通过反复检查数据来反思所犯的错误,从而实现逻辑一致性。

技术参数层面,Grok 3 模型拥有 20 万 GPU 数量。相较于 Grok2,计算能力提高了 10 倍,也是推理模型,具有 DeepSearch 功能,而 Big Brain 功能是通过更多的计算来解决问题。

有分析称,Grok 3 算力消耗是 Deepseek V3 的 263 倍。

直播结束后,OpenAI 联合创始团队成员、AI 研究学者安德烈 · 卡帕斯 ( Andrej Karpathy ) 表示:Grok 3+Thinking ,大概和 OpenAI 最强的模型(比如 o1-pro,月费 200 美元)相当,比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。

"考虑到该团队大约 1 年前从零开始,这个达到最先进领域的时间表是前所未有的,这真是令人难以置信。注意,这些模型是随机的,每次可能会给出略有不同的答案,而且现在还为时过早,所以我们必须等待未来几天 / 几周的更多评估。现在祝贺 xAI 团队,他们显然拥有巨大的速度和动力。"卡帕斯表示。

马斯克 xAI 正融资 100 亿美金,但他收购 OpenAI 计划泡汤

就在马斯克 xAI 新模型发布前数小时内,奥尔特曼发布了两、三条推文"吸引火力",释放 GPT-4.5、开源等关键信息,试图让 xAI 发布会"失焦"。

事实上,当地时间 2 月 10 日,由马斯克牵头的投资者财团提出以 974 亿美元的价格收购 OpenAI。

马斯克的律师马克 · 托贝罗夫确认了这一消息,并称已向 OpenAI 董事会提交了该收购要约。交易完成后,OpenAI 很可能会与 xAI 进行合并,这将帮助 xAI 迅速填补技术差距,并形成可与谷歌、微软抗衡的 AI 巨头。

如果实现这一收购计划,不仅成为全球 AI 领域最大规模的并购交易,促使全球 AI 行业未来走向充满变数,而且也让马斯克与奥尔特曼之间由来已久的矛盾激化。

就在 2024 年底,OpenAI 宣布,它需要筹集比预期更多的资金才能实现其目标,并制定了向营利性结构过渡的计划,计划重组为一家拥有普通股的公益公司(PBC)。"大公司现在投资于 AI 开发的资金高达数千亿美元,这充分说明了 OpenAI 继续追求这一使命需要什么。"

但对于马斯克来说,这种盈利性发展,违背了 OpenAI 成立初衷,因此,马斯克对此并未坐视不管。

2024 年 11 月,马斯克团队向美国加州北区地方法院申请初步禁令,对 OpenAI 提出多项指控,包括阻碍投资者支持其竞争对手 xAI、利用与微软的关系非法获取竞争敏感信息、改变非营利治理结构转移关键资产和知识产权,以及通过自利交易损害公众利益和初创使命。马斯克的律师称,若禁令不获批,将造成 "无法弥补的损害",还指出 OpenAI 已背离初心,成了微软的 "闭源子公司"。

而随着马斯克计划 974 亿美元收购 OpenAI 消息释出,奥尔特曼并不买账。对于收购要约,他在社交平台上回应称:"不了,谢谢。但如果你愿意的话,我们可以花 97.4 亿美元收购推特。"

这个回应也充满了奥尔特曼对马斯克的暗讽。要知道,97.4 亿美元的报价仅为马斯克当年收购推特成本的 22%,这也意在嘲讽马斯克的经营不善,导致 X 平台估值缩水。

对于奥尔特曼的回复,马斯克也作出了回应,他留言称奥尔特曼是"骗子"。

2 月 16 日,OpenAI 董事会正式拒绝了马斯克的收购邀约。

"OpenAI 是非卖品,董事会一致否决了马斯克先生破坏竞争的最新企图。OpenAI 的任何潜在重组都将加强我们的非营利组织及其使命,以确保 AGI 造福全人类,"OpenAI 董事长布雷特 · 泰勒(Bret Taylor)称,OpenAI 董事会认为这项收购提议不能代表公司的最佳利益,因此予以拒绝。

马斯克则指责:"一位朋友说泰勒是个骗子,他经营着一家代理初创公司,这家公司实际上没有任何产品,但却在向 OpenAI 注入资金。他只是在搞官僚主义。"

最终,这一目标并未达到,同时 xAI 也在面临融资。

据报道,xAI 计划筹集约 100 亿美元资金,目前正在接洽包括红杉资本、Andreessen Horowitz 等潜在投资者,此轮融资可能使该公司估值达到约 750 亿美元(约合 5440.5 亿元)。由于这轮融资的交易条款尚未最终确定,具体细节仍可能有所变动。

PitchBook 数据显示,2024 年 12 月,xAI 公司宣布完成 C 轮 60 亿美元融资,投资方包括英伟达和 AMD 两大芯片巨头等,公司估值约为 510 亿美元。

因此,这也意味着,短短三个月,xAI 公司估值增长了 240 亿美元,增速达 47% 左右。

复盘马斯克的收购之路,其实困难重重。

首先,奥尔特曼对收购提议并不感兴趣;其次,马斯克对 OpenAI 的报价也被分析师认为"缺乏诚意",近期有报道称,OpenAI 正进行高达 400 亿美元的融资,这将使其估值超过 3000 亿美元,即便在该融资没有完成前,OpenAI 现阶段的估值也达 1500 亿美元;最后,马斯克如何整合 OpenAI 和 xAI,是否涉及反垄断等议题,依然存疑。

马斯克曾表示,他希望将 OpenAI 从带向的危险方向中拯救出来,"是时候让 OpenAI 重新成为开源、注重安全的造福力量了。我们将确保这一点实现。"  

不过,无论是否收购,马斯克的介入已经对 OpenAI 下一步发展产生影响,并且使得 OpenAI 下一轮融资充满变数。英国剑桥大学副教授约翰尼 · 佩恩表示,马斯克"基本上是想阻碍 OpenAI 的增长轨迹"。

康奈尔大学高级讲师、AI 初创公司 R2Decide 创始人兼首席执行官卢茨 · 芬格 ( Lutz Finger ) 也表示,马斯克在给非盈利部分贴上价格标签,让奥尔特曼对 OpenAI 分拆的成本大大增加,给 OpenAI 发展产生了负面影响。

"马斯克此举只是压制竞争的小伎俩,我希望他能通过打造更好的产品来竞争;可能他的一生都处于不安全状态,我为这个人感到难过…我不认为他是个快乐的人。"奥尔特曼强调,OpenAI 不打算出售。

争夺战加剧:OpenAI 先发开源

开源成为 AI 大模型的下一个阶段。

"对于我们的下一个开源项目,我们应当选择开发一个虽然体积小但仍然需要借助 GPU 运行的 o3 mini 层级模型,还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢?"奥尔特曼今早发起投票,最终端侧模型的投票率大幅领先,相比于 o3 mini 的开源,显然高赞评论的网友更希望开源 GPT-4。

随着 DeepSeek 热潮席卷全球,给 AI 行业敲响了警钟。奥尔特曼也在考虑开源,他曾在本月初公开承认,OpenAI 的闭源策略"站在了历史错误的一边"。

正如 RWKV 创始人彭博早前表示,"我跟你说,现在   AI   的问题就在于它太简单了,傻瓜都可以做出来。所以它是没有壁垒、没有门槛的事情,所以这也是我认为   AI   的商业模式有很大的问题的一个原因,因为太简单,就是无脑的堆算力,堆数据就行。"

值得注意的是,就在今天上午,OpenAI 和 xAI 的供应商、AI 芯片巨头英伟达(NVIDIA),联合北京大学、Hedra 公司发布新的开源视频生成模型 Magic 1-For-1,该模型生成视频速度很快,能够在 3 秒内生成 5 秒的视频片段,1 分钟可生成 1 分钟视频,将文本到视频的生成任务分解为两个更易处理的扩散步骤蒸馏任务,即文本到图像生成,与图像到视频生成。

在国内,近期,字节跳动豆包大模型团队开源视频生成大模型" VideoWorld ",仅凭视觉信号就能理解世界,无需任何文本标注数据,同时字节还联合 M-A-P 社区开源全新代码大模型评估基准 FullStack Bench;2 月 18 日,"大模型六小虎"之一的阶跃星辰则宣布与吉利联合开源两款 Step 系列多模态大模型——开源视频生成模型 Step-Video-T2V 和开源语音交互大模型 Step-Audio,性能出色,远超业界开源最优水平。

在开源大模型 DeepSeek 冲击之下,无论是国外 OpenAI、xAI,还是国内百度、腾讯这些科技大厂,或是"大模型六小虎"这类头部 AI 大模型公司,都走到了一个新的"十字路口":要么开源发力 AI 应用和解决方案,要么用闭源打败开源。

悉尼新南威尔士大学 AI 研究所首席科学家 Toby Walsh 认为,这是把"猫和鸽子"放在一起,事实证明,西方和中国最好的 AI 之间真的没有差距,"一场谁的钱最多的竞赛"格局被完全打开,程维任何人都可以做到的一场 AI 比赛,很多人将能够以适中的成本重新构建 AI 模型。未来,如果 AGI 终极目标不是在数据中心上构建 AI,而是构建可以在手机上运行 AI 技术,这将贴近我们的生活,并成为一个新的发展标准。

中欧国际工商学院决策科学与管理信息系统教授谭寅亮对钛媒体 AGI 表示,对于 DeepSeek 这样的产品来说,其成功更多依赖于高效的算力调度和模型优化能力,而非单纯堆积硬件资源,因此外部限制并不一定会阻碍本土大模型的长期竞争力和全球化扩张。DeepSeek 的成功表明,中国企业在 AI 应用层面和用户体验上具有强大的创新能力,尤其是在产品快速迭代和市场化方面更具优势。

谭寅亮强调,DeepSeek 的崛起将进一步推动全球 AI 竞争的动态化发展。

(本文首发于钛媒体 App,作者|林志佳)



上一篇:日本央行:年中或再次加息 加息预期
下一篇:应对美国汽车关税威胁 加拿大设立“战略应对基金”
友情链接: