中国工程院院士李国杰畅谈AI发展策略
加快落地行业应用 构建基础设施生态

发稿时间: 2025-03-19 08:48 来源:人民邮电报 作者:李军辉 2025-03-19
分享X

观点速读

伴随生成式人工智能的迅猛发展,我们正迎来人工智能第三次浪潮的高峰期。DeepSeek的推出,成为世界人工智能发展史上的一个标志性事件,为在受限资源下探索通用人工智能开辟了新的路径。发展人工智能需要充足的算力和高质量数据,必须构建自主可控的AI基础设施生态来保障资源供给。笔者特邀中国工程院院士李国杰畅谈AI发展策略。

发展人工智能重在落地行业

人工智能是对人类智能某方面的再现和超越,其通用性是相对的,需基于特定条件或范围。大模型追求的通用人工智能(AGI)只是众多通用目标的一种。我们要认识人工智能的局限性,不能盲目追求天下通吃的人工智能,重点还是要根据实际需求,将相对通用的人工智能技术落地到各行业,让一定范围内的人工智能技术见到实效。

斯坦福大学《2024年人工智能指数报告》明确指出,机器学习大模型在图像分类、视觉推理及英语理解等方面的表现已超过人类。聊天机器人和其他智能软件正改变我们的工作和生活。AI驱动的科学研究作为科研第五范式,也展现出惊人潜力。比如DeepMind的Alpha-Fold3已成功预测地球上已知的超两亿种蛋白质的三维结构,有望颠覆当前的药物研发模式,其发明者获得了2024年诺贝尔化学奖。人们相信,智能技术的指数性发展一定会加速通用人工智能的到来,但自适应性、持续学习及与外界互动等问题仍需克服。

实现通用智能是一个渐进过程,不会因某项技术的发明就突然到来。尽管当前AI的通用性比前两波有显著提高,但距离真正的通用智能还有较大差距。在某些应用中通过图灵测试只是阶段性成果,发展既通用自主又安全放心的人工智能仍是巨大挑战。

DeepSeek开辟新路径

DeepSeek的推出成为世界人工智能发展史上的一个标志性事件,不仅创下了全球用户增长速度的新纪录,还引发了市场对相关硬件需求预期的调整。例如,英伟达的股价短期内有所波动,反映了市场对新兴技术可能带来的行业变革的敏感性。这也表明中国科技公司在全球最关注的核心技术领域,正通过持续创新重塑世界既有格局。

DeepSeek为在受限资源下探索通用人工智能开辟了新的路径。传统大模型通常从广泛的通用能力出发,逐渐向特定应用场景优化。相比之下,Deep-Seek采取了一种不同的策略,通过专注于特定任务或领域,逐步扩展其通用能力。这种方法有助于推动人工智能技术生态的发展,并促进通用人工智能的社会共享。“小而精”模型将AI的应用重点从面向企业转向面向消费者,从广泛覆盖转变为深度优化,让更多的中小企业参与,可能创造更大的市场空间。这种“垂直深潜”策略与通用大模型的“横向扩展”互为补充,共同构建智能时代的创新生态。

长期以来,中国AI企业侧重于应用和商业模式创新,追求快速盈利,较少涉足核心技术的原创性突破。与西方发达国家相比,我们真正的差距不在于资金或硬件的短缺,而在于缺乏原创技术和发明,以及在增强信心和有效组织高水平人才进行创新方面的能力不足。随着经济的发展和技术的积累,中国企业逐渐增强了原创研发能力。DeepSeek开了一个好头,他们把探索通用人工智能的实现之路作为奋斗目标,并吸引了一批充满创新热情和好奇心的年轻博士加入。这些“90后”的中国青年展现出与西方同行平等对话的信心和“敢为天下先”的勇气,成为中国科技自主创新能力发展的希望。

构建自主可控的基础设施生态

发展人工智能需要充足的算力和高质量数据,必须构建自主可控的AI基础设施生态来保障资源供给。

美国的AI基础设施是基于英伟达的GPU建立起来的。我国的人工智能加速芯片,如华为的昇腾、海光的DCU和寒武纪的芯片与GPU芯片的硬件性能差距并不是很大。英伟达的核心优势在于CUDA软件生态及NVLink和InfiniBand高速互联,其中CUDA生态最难攻克。Deep-Seek虽冲击了CUDA生态,但没有完全绕过CUDA,CUDA的生态壁垒仍然存在。从长远来讲,我们需要开发一套比CUDA更优秀的自主可控的AI软件工具系统。像取代Wintel和ARM+Android系统一样,就是要重构软件生态系统,这是一项十分困难的任务,需要周密的规划和长期努力。

信创工程对推广国产化芯片和软件有重大的推动作用,但产业生态的形成主要靠市场牵引。国家要通过政策引导,鼓励在PC、手机和物端设备上推广AI应用,扩大“国产大模型+国产GPU”应用空间,增大国产GPU、CPU和软件的市场份额。高度重视芯片设计和大模型的开源战略,争取我国在全球AI开源系统中起到主导作用。

GPU芯片可能在市场上延续相当长的时间。从长远来看,GPU并非终极方案,针对一类AI应用的专用芯片也可能成为主流。AI加速芯片将来可能进入多芯片竞争的XPU时代。Groq的LPU推理性能已达GPU的10倍,其单芯片能实现每秒250万亿次整数运算,延迟低于1微秒。算力是AI基础设施的重要组成部分,我们既要攻关ZFlops级的超算,也要探索类脑计算、光子计算等新范式。为了降低能耗,模拟计算、类脑计算、碳基计算等非传统计算无疑是重要的研究方向。


新闻附件:

新春走基层|我们一直在路上

特别推荐

相关新闻