AGI的路上,GPU叙事仍在,Transformer却无法开门
日期:2025-12-24 15:52:05 / 人气:6

谷歌Gemini3的横空出世,在资本市场掀起了一场剧烈的“跷跷板”效应:谷歌市值暴涨5000亿美元,而算力霸主英伟达却在同一时期蒸发了6000亿美元。
这巨大的剪刀差,似乎预示着风向的转变——当TPU能跑出媲美甚至超越GPT的效果,当Meta也开始采购TPU时,通用GPU构建的算力护城河是否正在松动?硬件范式是否正在从通用的GPU向专用的ASIC发生根本性“转变”?
在腾讯科技2025 Hi Tech Day的圆桌论坛上,来自国产模型及基础设施领域的“卖铲人”们,围绕AGI关键基础设施的“稳态还是变态”,展开了一场终极拷问。
一、 GPU的“稳态”:通用性仍是最大护城河
面对英伟达的市值波动,沐曦股份高级副总裁孙国梁表现得异常冷静。他认为,GPU与ASIC(专用芯片)在几十年前就是“超级稳态”的架构,各有其适用场景。
“在模型高速迭代的今天,GPU的通用性是它最大的优势。”孙国梁指出,当前基模还远未收敛,更新速度快至按周计算,应用场景更是千奇百怪。在这种碎片化的需求下,专用芯片很难覆盖所有通用场景,而GPU凭借其强大的泛化适配能力,依然是主流选择。
对于华尔街的做空,他更是直言不讳:“这未必不是一种‘砍价方式’。”在他看来,英伟达的领先地位是由其在通用算力上的统治力决定的,这一基本面并未改变。
二、 算法的“变态”:Transformer无法支撑下一代Agent
如果说硬件仍在稳态中演进,那么算法侧则面临着一场即将到来的“变态”。阶跃星辰首席科学家张祥雨抛出了这枚“深水炸弹”:现有的Transformer架构,无法支撑下一代Agent。
张祥雨指出,在长文本环境下,模型的“智商”会随着上下文长度的增加而快速下降,这被称为“智商掉落”。对于追求无限上下文的通用Agent而言,Transformer单向的信息流机制存在先天缺陷。无论号称支持多少Token,模型最终都会退化。
“人类记忆有极强的压缩机制,而Transformer的深度(层数)是恒定的,无法表示这种复杂的函数。”张祥雨认为,未来的架构将向“Non-Linear RNN”(非线性循环神经网络)演进,通过短窗口Transformer建模短期记忆,叠加巨大的RNN建模长期记忆。这将是一个巨大的系统工程,需要软硬件协同设计。
三、 开源与闭源:一场“老二、老三”的生存博弈
在模型层,硅基流动联合创始人胡健分享了关于开源与闭源的洞察。他认为,这是一种“老二、老三”的生存法则博弈。
“就像安卓对抗iOS,DeepSeek一出来,市场就炸了,大家就都得跟进。”胡健表示,处于第二、第三梯队的企业为了不被头部完全挤出市场,必须选择开源。同时,企业客户对数据隐私和成本的考量,也倒逼开源模型持续存在。如果智能只掌握在少数巨头手中,客户将不得不承担更高的成本和风险。
四、 能源与工程:被AI加速的“终极瓶颈”
圆桌的讨论最终指向了两个根本性的“变态”挑战:能源与工程。
王晟提到了一个有趣的关联:AI正在加速可控核聚变的研发。托卡马克装置面临的最大难题——磁场约束和等离子体控制,正通过AI for Science和强化学习寻求突破。这预示着,能源可能成为制约AGI发展的终极瓶颈。
而在工程层面,孙国梁指出,当前的AI发展仍处于“工程学反推基础科学”的阶段。在脑科学和数学原理没有重大突破前,我们只能依靠GPU进行大量的暴力尝试。但正是这些工程实践,可能会反过来推动基础科学的演进。
结语
从GPU的通用性优势,到Transformer的架构危机,再到开源与闭源的博弈,以及能源与工程的终极挑战,这场圆桌揭示了一个清晰的图景:AGI的道路上,没有永恒的稳态。
GPU叙事仍在延续,但Transformer的大门即将关闭。真正的变革,或许就藏在下一代架构的突破之中,藏在能源问题的解决之时,也藏在每一个敢于打破常规的工程尝试里。
作者:风暴注册登录官网
新闻资讯 News
- 徐子,请你不要来非洲了:流量狂...12-24
- 游戏从业者的“独立游戏梦”:热...12-24
- 制造业浮沉与阶层重构:美国MA...12-24
- AGI的路上,GPU叙事仍在,T...12-24

