■本报记者 李媛
40年求索,中国工程院院士、西安交通大学人工智能与机器人研究所所长郑南宁带领团队始终以“感知-认知-协同”为主线,推动人工智能(AI)从“看见”走向“理解”。在他看来,AI终将催生“智能文明”,但前提是技术必须服务于人,而非替代人。
这份对学术理想的坚守,也转化为他对团队未来的深切期许——希望团队能够打造经得起时间检验的AI领域“百年老店”。
探索“智能本质是什么”
《中国科学报》:你团队的核心科研理念是什么?其是如何在长期科研中形成并完善的?
郑南宁:1985年秋天,我从日本留学归国回到母校西安交通大学。飞机降落在西安时,我并未意识到那一刻不仅是个人命运的转折,也是一个时代的起点。彼时,中国的AI还处于萌芽阶段,计算机尚未普及,算法远未成为基础设施,“智能”在许多人眼中仍是一个遥远的概念。1986年春,在西安交通大学的支持下,我们创建了人工智能与机器人研究所。那是学校东二楼一间不宽敞的实验室,却承载着我的信念——让机器像人类一样感知并理解世界。
如今,40年过去了,我们团队始终围绕一条清晰的主线展开研究,即智能的基本结构并不是孤立的内部计算,而是“感知-决策-环境”的动态闭环。这条主线源于我的控制学科背景。控制系统强调输入与输出的关系,要使系统稳定并适应环境变化,动态反馈机制不可或缺。从这个角度看,AI不只是算法,更是一种信息处理能力,本质上体现为一种信息组织结构。
这一理念同样来自对人类认知行为的观察。例如,我们进入一个房间,会自然地寻找合适的位置坐下,而不需要复杂计算,这正是人对环境的“认知”能力。因此,我们的研究从早期的视觉感知,逐步发展到视觉认知与理解,再到构建对环境的“世界模型”。
为了更清晰地表达这一思想,我将其归纳为PCC框架:P代表感知(Perception),C代表认知(Cognition),第二个C代表协同(Collaboration)。从研究历程来看,我们早期聚焦视觉感知与计算;2000年后,面对复杂环境,我们开始关注如何让智能系统像人一样理解任务与环境;未来,在人机共存的时代,我们将更强调“人机协同”,而非简单的“机器替代人”。这一体系的核心不在于某一类技术或者算法,而在于对“智能本质是什么”的长期探索。
催生全新的“智能文明”
《中国科学报》:AI本身是交叉学科,你认为它在学科发展中扮演了什么角色?
郑南宁:AI研究具有鲜明的多学科交叉特点,涉及计算机视觉、模式识别、认知科学、神经科学、控制科学和数据科学等多个领域。这种跨学科深度融合,推动了AI理论的持续发展。因此,我们团队从一开始就注重多学科背景的融合,成员来自控制、计算机、软件、数学、生物、机械等不同领域。跨学科不仅体现在组织架构上,更体现在研究者个体的知识结构中。一个从事AI研究的人,除了掌握本专业知识,还需要了解认知科学、神经科学、计算机工具与平台等多方面内容。换言之,研究者本身也应当是“跨学科的”。
例如,在新型冠状病毒预测研究中,我们团队将传统流行病模型与长短期记忆网络(LSTM)、自然语言处理(NLP)相结合,构建混合AI模型,从而提升了预测准确性。这体现了跨学科技术融合解决实际问题的能力。
从更深层看,跨学科的意义不仅在于知识的多样性,更在于它带来了批判性思维。科学发展的本质不是单纯的发现,而在于批判。就像生物多样性维持生命的延续,学科多样性也维持着学科的活力。因此,跨学科不能停留在表层合作,深入思想和精神层面才能产生真正深刻的内涵。
《中国科学报》:未来5至10年,你认为计算机视觉与AI最值得关注的核心技术方向是什么,会对产业带来什么影响?
郑南宁:我把未来5至10年最重要的方向概括为六条主线,它们正汇聚于一个共同目标:从“感知智能”走向“认知智能”和“行动智能”。
第一,多模态基础模型,让机器从“看见”走向“理解”;第二,具身智能与机器人,让AI走出屏幕,进入物理世界;第三,构建世界模型,通过因果推理与记忆机制,提升AI的可解释性;第四,人机协同智能,从“替代逻辑”走向“增强逻辑”;第五,高效智能计算,包括端侧AI、神经形态计算与新型视觉硬件;第六,AI for Science(人工智能驱动的科学研究)与复杂系统智能,推动AI在科学发现与知识创新中的应用。
这些方向指向一个重要趋势:把数据-模型驱动智能与社会系统、科学发现、领域知识结合起来。这将推动公共卫生、能源、电网、交通、气候、城市治理等领域发生深刻变革。未来5至10年,社会结构将因AI而重组,就业形态也将发生显著变化。AI不仅改变物理世界,更重构了人类的认知方式,而人类通过需求与约束塑造AI,进而催生一种全新的“智能文明”。这是人类社会与AI深度融合的结果。
技术必须服务于人
《中国科学报》:你认为我国AI领域发展还存在哪些挑战?你和团队如何布局未来发展?
郑南宁:我国AI在基础理论、关键核心技术方面仍有短板,尤其是在高端芯片、基础软件领域亟待突破。结合产业现实,我认为主要存在五方面不足:一是底层硬件与软件生态薄弱,全栈自主性不足;二是原始理论创新滞后,应用强于理论的格局尚未根本改变;三是高质量数据与评测体系仍不完善;四是基础软件与工具链自主性不足;五是高可靠规模化应用能力薄弱,许多模型仍停留在演示阶段。
基于长期的学术积累,我们团队为中国AI发展探索出一条“认知驱动+人机协同+视觉落地”的特色路径。具体而言,从感知算法转向认知视觉系统突破;以混合增强智能推动高风险行业和极端环境的应用落地;加强认知科学、脑科学、物理学科与AI的深度融合,弥补原创理论短板;融合视觉、语言、知识与领域机理,发展“面向复杂环境或任务的安全可信的AI”;推进“算法-芯片-系统”协同设计,以应用场景反向牵引自主软硬件生态的协同演进。
未来AI竞争的关键在于能否率先整合感知、记忆、因果与协同,构建可信、可部署、自主可控的智能系统。这也正是我们团队持续探索的方向。
《中国科学报》:科技工作者如何在创新的同时坚守学术底线、规避风险?你的学术思想里有怎样的价值导向?
郑南宁:在AI伦理与技术安全日益受到关注的背景下,科技工作者应如何在追求技术创新的同时坚守底线?我的回答是技术必须服务于人,而不能脱离人、替代人,更不能压倒人。
首先,要严格区分“能做”与“该做”。当前AI面临的一个重要风险,是将“技术可实现”等同于“应用可接受”。科技工作者不能只追求指标领先,而忽视技术可能带来的不利后果。在我的科研实践中,始终坚持四条底线原则:第一,真实性底线,数据必须真实,实验必须可复现,结论不得夸大;第二,安全性底线,在高风险场景中必须经过充分验证,并确保人类参与最终判断;第三,可解释与可问责底线,越是高影响场景,越需要明确系统为何作出判断,以及明确责任主体;第四,以人为中心底线,不能将“机器替代人”视为唯一目标,应优先保障人的尊严与主体性。
风险规避需从研究设计、训练评测、部署治理三个层面协同推进。我的学术思想中始终贯穿明确的价值导向。2017年提出的“混合增强智能”强调,人机协作不是权宜之计,而是未来智能的基本形态。真正重要的突破不仅在于性能提升,更在于构建以人为本、安全可信、可持续演化的智能体系。
需要强调的是,智能并非某种突然而至的奇迹,而是世界演化出的一种新的认知结构。人类创造智能,用以扩展自身的感知与推理能力;与此同时,智能也反过来重塑人类的认知方式、决策逻辑与现实结构。二者形成持续反馈、相互塑造的关系。未来二者不是对立,而是共生与耦合。理性被技术放大,也在边界处显现出局限;意义不由计算给出,仍需由人类选择。
唯有“知来路”,方能“明去处”
《中国科学报》:西安交通大学的学术传统、育人理念对你的学术思想和学科发展有什么影响?
郑南宁:从学生到教师,我一生的大部分时间都在西安交通大学度过。母校的学术传统不仅塑造了我的学术思想,也教会我如何成为一名有温度、有担当的教育与科技工作者。
50年前,我们毕业设计小组完成“数字位移自动测量”项目。如今看来,这是我们研究AI的一个小小的尝试。为支持我们,学校教务处专门拨款让我们赴企业调研、购买元器件。值得一提的是,当时本科生多以项目形式组成毕业设计小组,大家协作完成。这种模式对培养学生综合能力、团队合作能力非常重要。硕士期间,我师从宣国荣教授,他充分尊重我的兴趣,支持我从事语音识别研究。当时学校接收了香港理工学院(现香港理工大学)捐赠的一台美国王安公司TRS80微型计算机,这是中国最早的一批微型计算机之一。为了在主板上接入话筒,我需要自行改造硬件,学校也给予充分的支持。正是在这样宽松、鼓励创新的环境中,我才得以在探索中不断成长。
如今,我们团队依然保留着当年那台TRS80计算机。每当看到它,我都会想起一句话:“岁月的脚步并未随风飘逝,回首相望,它还静静地诉说着一个研究所的过去、当下与未来。”这也不断提醒我们,唯有“知来路”,方能“明去处”。
长期以来,西安交通大学宽松的环境、鼓励创造的氛围与实际支持,让我的想法得以落地、能力得到提升,学术思想也在这片土壤中逐步形成。
对于未来学科建设,我的想法很明确,要把西安交通大学的AI做成“百年老店”,而不是一代人的热闹;对青年学者,我希望他们能够自信、包容、坚持、奋斗。我很早就提出,现在已经进入“后郑老师时代”,希望青年教师们接好这一棒。
《中国科学报》 (2026-04-08 第3版 领域)