科学网—郑南宁：人工智能正走向“智能文明”

作者：李媛来源：中国科学报发布时间：2026-4-8

选择字号：小中大

郑南宁：人工智能正走向“智能文明”

■本报记者李媛

40年求索，中国工程院院士、西安交通大学人工智能与机器人研究所所长郑南宁带领团队始终以“感知-认知-协同”为主线，推动人工智能（AI）从“看见”走向“理解”。在他看来，AI终将催生“智能文明”，但前提是技术必须服务于人，而非替代人。

这份对学术理想的坚守，也转化为他对团队未来的深切期许——希望团队能够打造经得起时间检验的AI领域“百年老店”。

探索“智能本质是什么”

《中国科学报》：你团队的核心科研理念是什么？其是如何在长期科研中形成并完善的？

郑南宁：1985年秋天，我从日本留学归国回到母校西安交通大学。飞机降落在西安时，我并未意识到那一刻不仅是个人命运的转折，也是一个时代的起点。彼时，中国的AI还处于萌芽阶段，计算机尚未普及，算法远未成为基础设施，“智能”在许多人眼中仍是一个遥远的概念。1986年春，在西安交通大学的支持下，我们创建了人工智能与机器人研究所。那是学校东二楼一间不宽敞的实验室，却承载着我的信念——让机器像人类一样感知并理解世界。

如今，40年过去了，我们团队始终围绕一条清晰的主线展开研究，即智能的基本结构并不是孤立的内部计算，而是“感知-决策-环境”的动态闭环。这条主线源于我的控制学科背景。控制系统强调输入与输出的关系，要使系统稳定并适应环境变化，动态反馈机制不可或缺。从这个角度看，AI不只是算法，更是一种信息处理能力，本质上体现为一种信息组织结构。

这一理念同样来自对人类认知行为的观察。例如，我们进入一个房间，会自然地寻找合适的位置坐下，而不需要复杂计算，这正是人对环境的“认知”能力。因此，我们的研究从早期的视觉感知，逐步发展到视觉认知与理解，再到构建对环境的“世界模型”。

为了更清晰地表达这一思想，我将其归纳为PCC框架：P代表感知（Perception），C代表认知（Cognition），第二个C代表协同（Collaboration）。从研究历程来看，我们早期聚焦视觉感知与计算；2000年后，面对复杂环境，我们开始关注如何让智能系统像人一样理解任务与环境；未来，在人机共存的时代，我们将更强调“人机协同”，而非简单的“机器替代人”。这一体系的核心不在于某一类技术或者算法，而在于对“智能本质是什么”的长期探索。

催生全新的“智能文明”

《中国科学报》：AI本身是交叉学科，你认为它在学科发展中扮演了什么角色？

郑南宁：AI研究具有鲜明的多学科交叉特点，涉及计算机视觉、模式识别、认知科学、神经科学、控制科学和数据科学等多个领域。这种跨学科深度融合，推动了AI理论的持续发展。因此，我们团队从一开始就注重多学科背景的融合，成员来自控制、计算机、软件、数学、生物、机械等不同领域。跨学科不仅体现在组织架构上，更体现在研究者个体的知识结构中。一个从事AI研究的人，除了掌握本专业知识，还需要了解认知科学、神经科学、计算机工具与平台等多方面内容。换言之，研究者本身也应当是“跨学科的”。

例如，在新型冠状病毒预测研究中，我们团队将传统流行病模型与长短期记忆网络（LSTM）、自然语言处理（NLP）相结合，构建混合AI模型，从而提升了预测准确性。这体现了跨学科技术融合解决实际问题的能力。

从更深层看，跨学科的意义不仅在于知识的多样性，更在于它带来了批判性思维。科学发展的本质不是单纯的发现，而在于批判。就像生物多样性维持生命的延续，学科多样性也维持着学科的活力。因此，跨学科不能停留在表层合作，深入思想和精神层面才能产生真正深刻的内涵。

《中国科学报》：未来5至10年，你认为计算机视觉与AI最值得关注的核心技术方向是什么，会对产业带来什么影响？

郑南宁：我把未来5至10年最重要的方向概括为六条主线，它们正汇聚于一个共同目标：从“感知智能”走向“认知智能”和“行动智能”。

第一，多模态基础模型，让机器从“看见”走向“理解”；第二，具身智能与机器人，让AI走出屏幕，进入物理世界；第三，构建世界模型，通过因果推理与记忆机制，提升AI的可解释性；第四，人机协同智能，从“替代逻辑”走向“增强逻辑”；第五，高效智能计算，包括端侧AI、神经形态计算与新型视觉硬件；第六，AI for Science（人工智能驱动的科学研究）与复杂系统智能，推动AI在科学发现与知识创新中的应用。

这些方向指向一个重要趋势：把数据-模型驱动智能与社会系统、科学发现、领域知识结合起来。这将推动公共卫生、能源、电网、交通、气候、城市治理等领域发生深刻变革。未来5至10年，社会结构将因AI而重组，就业形态也将发生显著变化。AI不仅改变物理世界，更重构了人类的认知方式，而人类通过需求与约束塑造AI，进而催生一种全新的“智能文明”。这是人类社会与AI深度融合的结果。

技术必须服务于人

《中国科学报》：你认为我国AI领域发展还存在哪些挑战？你和团队如何布局未来发展？

郑南宁：我国AI在基础理论、关键核心技术方面仍有短板，尤其是在高端芯片、基础软件领域亟待突破。结合产业现实，我认为主要存在五方面不足：一是底层硬件与软件生态薄弱，全栈自主性不足；二是原始理论创新滞后，应用强于理论的格局尚未根本改变；三是高质量数据与评测体系仍不完善；四是基础软件与工具链自主性不足；五是高可靠规模化应用能力薄弱，许多模型仍停留在演示阶段。

基于长期的学术积累，我们团队为中国AI发展探索出一条“认知驱动+人机协同+视觉落地”的特色路径。具体而言,从感知算法转向认知视觉系统突破；以混合增强智能推动高风险行业和极端环境的应用落地；加强认知科学、脑科学、物理学科与AI的深度融合，弥补原创理论短板；融合视觉、语言、知识与领域机理，发展“面向复杂环境或任务的安全可信的AI”；推进“算法-芯片-系统”协同设计，以应用场景反向牵引自主软硬件生态的协同演进。

未来AI竞争的关键在于能否率先整合感知、记忆、因果与协同，构建可信、可部署、自主可控的智能系统。这也正是我们团队持续探索的方向。

《中国科学报》：科技工作者如何在创新的同时坚守学术底线、规避风险？你的学术思想里有怎样的价值导向？

郑南宁：在AI伦理与技术安全日益受到关注的背景下，科技工作者应如何在追求技术创新的同时坚守底线？我的回答是技术必须服务于人，而不能脱离人、替代人，更不能压倒人。

首先，要严格区分“能做”与“该做”。当前AI面临的一个重要风险，是将“技术可实现”等同于“应用可接受”。科技工作者不能只追求指标领先，而忽视技术可能带来的不利后果。在我的科研实践中，始终坚持四条底线原则：第一，真实性底线，数据必须真实，实验必须可复现，结论不得夸大；第二，安全性底线，在高风险场景中必须经过充分验证，并确保人类参与最终判断；第三，可解释与可问责底线，越是高影响场景，越需要明确系统为何作出判断，以及明确责任主体；第四，以人为中心底线，不能将“机器替代人”视为唯一目标，应优先保障人的尊严与主体性。

风险规避需从研究设计、训练评测、部署治理三个层面协同推进。我的学术思想中始终贯穿明确的价值导向。2017年提出的“混合增强智能”强调，人机协作不是权宜之计，而是未来智能的基本形态。真正重要的突破不仅在于性能提升，更在于构建以人为本、安全可信、可持续演化的智能体系。

需要强调的是，智能并非某种突然而至的奇迹，而是世界演化出的一种新的认知结构。人类创造智能，用以扩展自身的感知与推理能力；与此同时，智能也反过来重塑人类的认知方式、决策逻辑与现实结构。二者形成持续反馈、相互塑造的关系。未来二者不是对立，而是共生与耦合。理性被技术放大，也在边界处显现出局限；意义不由计算给出，仍需由人类选择。

唯有“知来路”，方能“明去处”

《中国科学报》：西安交通大学的学术传统、育人理念对你的学术思想和学科发展有什么影响？

郑南宁：从学生到教师，我一生的大部分时间都在西安交通大学度过。母校的学术传统不仅塑造了我的学术思想，也教会我如何成为一名有温度、有担当的教育与科技工作者。

50年前，我们毕业设计小组完成“数字位移自动测量”项目。如今看来，这是我们研究AI的一个小小的尝试。为支持我们，学校教务处专门拨款让我们赴企业调研、购买元器件。值得一提的是，当时本科生多以项目形式组成毕业设计小组，大家协作完成。这种模式对培养学生综合能力、团队合作能力非常重要。硕士期间，我师从宣国荣教授，他充分尊重我的兴趣，支持我从事语音识别研究。当时学校接收了香港理工学院（现香港理工大学）捐赠的一台美国王安公司TRS80微型计算机，这是中国最早的一批微型计算机之一。为了在主板上接入话筒，我需要自行改造硬件，学校也给予充分的支持。正是在这样宽松、鼓励创新的环境中，我才得以在探索中不断成长。

如今，我们团队依然保留着当年那台TRS80计算机。每当看到它，我都会想起一句话：“岁月的脚步并未随风飘逝，回首相望，它还静静地诉说着一个研究所的过去、当下与未来。”这也不断提醒我们，唯有“知来路”，方能“明去处”。

长期以来，西安交通大学宽松的环境、鼓励创造的氛围与实际支持，让我的想法得以落地、能力得到提升，学术思想也在这片土壤中逐步形成。

对于未来学科建设，我的想法很明确，要把西安交通大学的AI做成“百年老店”，而不是一代人的热闹；对青年学者，我希望他们能够自信、包容、坚持、奋斗。我很早就提出，现在已经进入“后郑老师时代”，希望青年教师们接好这一棒。

《中国科学报》 (2026-04-08 第3版领域)