万人棋牌app下载
CN ∷  EN
新闻动态

看完Grok3的发布会,我对国内的AI发展更加乐观了

发布日期:2025-03-06 00:24 点击次数:110

现在几乎每周都有 AI 圈子的大事发生,让人有种应接不暇的感受。

近日,马斯克的 xAI 发布了万众期待的 Grok 3,20 万卡的集群 fully run 了几个月的时间,怼出来了目前 pretraining 模型的 SOTA,在各种榜单上都排到了第一。在性能方面,Grok 3 在数学推理、科学逻辑推理和代码编写等领域表现出色,在多项基准测试中超越或媲美 Gemini、DeepSeek 和 ChatGPT 等对手。除了 base model 外,xAI 还推出了功能更强大的 Grok 3 Thinking 推理模式,在 benchmark 上超过了 o3 mini。Andrej Karpathy 大神表示,实操层面,Grok 3 大概是 o1 pro 的水平,或者略超过 o1 pro。

从全球 AI 的角度来看,xAI 证明了有强大的算力就可以更快地追赶头部模型,缩短和世界第一的差距。马斯克也表示,将进一步提升算力,构建几十万卡甚至百万卡的 GB200 集群。如同我们之前多次强调的,下一步的多模态、合成数据、self-play RL 都需要海量算力验证能否"大力出奇迹"。

但是看完 xAI 的发布会,我们反而对于国内的 AI 发展可能更加乐观了。xAI 用 20 万张 H100,做到了超过 o1 和 o3 mini 的水平,而 DeepSeek 用几千张 H800,就能做到 o1 的水平。o1 和 o3 mini,大概也就是差了几个月的时间。也就是说,DeepSeek 用 xAI 百分之二至三的算力,就能紧跟目前 reasoning model 全球最前沿的水平。

这不禁让人想到了在制药领域,创新药和仿制药的对比。创新药的特点就是海量的研发资源投入,通过不断试错,找到最合适的药物组成。然而,仿制药可以用非常低的成本,实现对创新药的复现;如果做得好,效果也可以接近创新原研药。如果说北美头部 AI 公司是在做创新药,那么留给中国 AI 公司的机会就是做最好的仿制药。仿制药同样有着巨大的市场空间,如果质量过硬,同样可以创造巨大的社会和经济价值。比如在《我不是药神》这部电影里,印度的仿制药,就可以拯救众多白血病患者的生命。更重要的是,创新药有知识产权保护,而目前看起来,学习、追赶大模型,暂时没有有效的类似的手段来限制追赶。

当然,如果多模态、合成数据、self-play RL 在海量 GB200/300 算力的加持下取得了突破,pretraining scaling law 又取得了进一步的进展,中国的算力限制可能又会成为瓶颈,但到了那个时候,未尝不可能有新的追赶方法。比如最近 DeepSeek 又发布了一篇新的工作,梁文锋亲自署名,NSA:A Hardware-Aligned and Natively Trainable Sparse Attention mechanism for ultra-fast long-context training&inference,极大提升了模型在训练和推理阶段,对于算力和 HBM 访存的效率,降低了对于算力和 HBM BW 的依赖。这篇文章 idea 不复杂,但是工程实现是超一流的,是世界级的。

希望 DeepSeek 能保持这样的效率,希望大厂们可以慢一点挖 DeepSeek 的人才,让中国可以有这样一片大模型研发的净土,不断给我们带来更多的惊喜。

最新资讯
推荐资讯