主要内容
深觅计划在华为昇腾芯片上训练其新的 AI 模型 R2 失败,被迫转向英伟达,同时推迟了发布。数月来,北京推动的论调一直是不可阻挡的技术进步和迈向自给自足的步伐。然而,现实往往会反咬一口。中国 AI 宠儿深觅的近期困境就是一个野心遭遇技术限制硬墙的教科书式例子。
1 月 R1 模型成功发布后,深觅感到来自中国的压力,要为国家事业摇旗呐喊。据三位与《金融时报》交谈的人士称,信息很明确:使用华为芯片,而非英伟达。在实际训练新的 R2 模型时,消息人士称深觅在华为 AI 芯片上遇到了“持续的技术问题”。问题如此根本,项目陷入停顿。一位了解情况的人士表示,这是该模型 5 月计划发布被取消的主要原因,使该公司在一个不容等待的市场中处于劣势。
要理解这为何是个大问题,你必须了解 AI 训练和推理之间的区别。训练是艰难的部分,就像送学生去大学进行多年高强度学习。它需要大量的电力和稳定性。推理则是相对“容易”的部分,就像问毕业生一个问题。深觅发现,虽然华为的芯片可能准备好参加期末考试,但它们还无法胜任艰苦的大学课程。该公司别无选择,只能切换回英伟达强大的系统进行训练。消息人士称,深觅的团队仍在尝试让 R2 模型在华为芯片上运行,以满足需求较低的推理阶段。两人证实,华为甚至派出自己的工程师团队前往深觅办公室,帮助他们在其芯片上启动和运行 R2 模型。但即使有专家在场,他们也无法成功进行训练运行。
与业内任何人交谈,他们都会告诉你这并不令人意外。华为 CEO 任正非今年早些时候甚至表示,美国“夸大了华为的成就”,该公司“还没那么伟大”,并指出其最好的芯片仍落后一代。然而,北京仍在积极推动其科技巨头青睐本地硬件,《金融时报》报道称,企业现在必须证明英伟达符合出口规定的 H20 芯片的订单是合理的。这是打造国内冠军战略的一部分,但它可能迫使公司做出技术上次优的选择。
除了使用华为芯片进行训练所面临的问题外,据报道,深觅创始人梁文峰已告诉他的团队,他对 R2 模型的总体进展不满意。据说他正在推动他们设定更高的目标,构建能够使公司在 AI 行业保持领先地位的东西。尽管有自上而下的指令和民族自豪感,但工程学规律仍然适用。深觅的故事提醒人们,在全球 AI 霸主之争中,没有捷径可走。中国在打持久战,但目前,性能桂冠仍牢牢戴在英伟达的头上。