|
|
吕跃广院士、吴飞教授:人工智能赋能人类——特定任务驱动和通用智能评测 Engineering |
|
论文标题:Further Empowering Humans in Specific Fields and Rethinking AGI Testing
期刊:Engineering
DOI:https://doi.org/10.1016/j.eng.2024.02.001
微信链接:点击此处阅读微信文章

吕跃广,吴飞
March 2024
人工智能(AI)是当今时代的变革力量,对社会各个领域产生积极影响。其中,影响最深远的一个潜在应用是人工智能辅助个体发挥优势、促进个性化和帮助个体赋能社区。人工智能在人类社会的应用已遍及社会的每一个角落;从语言生成到分子合成,人工智能开始渗透到我们生活的方方面面。
尽管人工智能在广泛任务上展示了令人印象深刻的能力,但它们往往缺乏针对特定领域中特定任务的深度和细腻度,当然这些模型也内在固有不可解释性的不足。每个特定领域的人工智能模型本质上应该包含专业术语知识和针对特定用例的专家经验,以确保准确理解行业特定概念。因此,特定领域的模型应该能够理解特定行业用例,理解特定领域中令人生畏的专业术语、上下文和复杂性。
为了确保特定领域人工智能模型的成功,人类必须信任我们社会中的人工智能。因此,有义务在使用人工智能完成特定领域任务中保护隐私和确保人工智能结果可被问责,因此需要对人工智能进行评估,以确保人工智能对社会产生积极影响。本期专题包括了关于特定领域应用、可信联邦学习进化优化以及人工智能评估等最新研究进展。
文章《从信号到知识——基于人工智能的医学影像裸数据诊断价值初探》(DOI: 10.1016/j.eng.2023.02.013)中开发了一种利用人工智能来实现从信号到知识的思路,其可以直接基于计算机断层扫描成像(CT)所得原始数据(信号)来对肺结节进行分类。文章研究者发现在原始数据上所得分类性能几乎与在CT图像上所得分类性能相当,这表明无需重建图像即可诊断疾病。此外,将原始数据输入三种常见的卷积网络,在所有队列中大幅提高了CT模型的预测性能(提升幅度为0.01~0.12),证明了原始数据中包含CT不具有的诊断信息。
文章《学习和解释行人意图的群体交互场》(DOI: 10.1016/j.eng.2023.05.020)中提出了一种新颖的群体感知表达,即群体交互场(GIF),将预期行人行为量化为行人未来位置和注意力方向的概率场计算。文中提出了一个端到端的神经网络GIFNet,专门用于从明确的多维观测中估计GIF。GIFNet通过构建一个具有传播和图注意力机制的群体交互图来量化群体行为之间的相互影响,该群体交互图能够适应群体大小和动态交互状态的变化。实验结果显示,GIF在群体行为之间具有显著影响场景下,可有效表示行人预期行为的动态变化,并准确预测了行人的未来行为状态。
文章《使用深度学习在CTA扫描卷下实现主动脉夹层分类和直径测量的双功能系统》(DOI: 10.1016/j.eng.2023.11.014)中研发了一个名为主动脉夹层辅助诊断系统(DDAsys)的双功能深度学习系统,该系统能够同时实现对主动脉夹层的准确分类和主动脉直径的精确测量。为此,研究人员创建了一个包含来自武汉同济医院心血管外科279名患者的61 190张计算机断层扫描血管造影(CTA)图像的数据集。该数据集提供了难以识别特征的切片级汇总,有助于提高识别和分类的准确性。实验表明,所提出的系统达到了0.984的识别F1值和0.935的平均分类F1值;升主动脉和降主动脉直径的测量精度分别为0.994 mm和0.767 mm的均方根误差。
文章《基于数据挖掘技术的税务风险检测方法评述》(DOI: 10.1016/j.eng.2023.07.014)全面梳理了税务风险检测方面的研究,将现有方法分为两类,然后列举并分别逐一介绍了14种方法和每种方法的优缺点。
文章《安全联邦学习进化优化算法综述》(DOI: 10.1016/j.eng.2023.10.006)综述了优化隐私保护研究进展,重点介绍了数据驱动下的隐私保护进化和优化。本文旨在通过总结机器学习和优化中可以使用的安全机制和隐私保护方法,为从安全隐私保护学习过渡到安全隐私保护的优化提供路线图。文章最后概述了联邦数据驱动优化中悬而未决的问题和面临的挑战。
文章《通智测试——基于动态具身物理社会交互环境的通用人工智能测试》(DOI: 10.1016/j.eng.2023.07.006)中提出了五个关键特征作为通用人工智能(AGI)的基准,并建议将通智测试作为一个AGI评估系统。通智测试给出了价值和能力导向的测试系统,通过一个具有动态具身物理社会交互(DEPSI)的虚拟环境,勾勒出AGI中五个级别的关键阶段,从而实现无限任务生成。本文从各个方面对比了通智测试系统与经典人工智能测试系统的异同,并提出了一个系统性的评估体系,以实现标准化、量化和客观的AGI基准测试和评估。
在此感谢本专题的审稿人,感谢他们及时而专业的审稿。最重要的是,感谢所有作者。同时,感谢中国工程院信息与电子工程学部颠覆性信息技术研究小组。
文章信息:
Yue-Guang Lyu, Fei Wu. Further Empowering Humans in Specific Fields and Rethinking AGI Testing. Engineering, 2024, 34(3): 1–2 https://doi.org/10.1016/j.eng.2024.02.001
专题链接:
https://www.engineering.org.cn/engi/EN/volumn/volumn_4660.shtml
更多内容
让AI更智能,李静海院士团队提出“四一致”新范式
高金吉院士团队:人工自愈开辟装备自主健康新征程
Engineering征稿启事:人工智能赋能工程科技
东南大学洪伟教授团队提出双频双极化双工毫米波相控阵概念并完成原型设计及验证
反向阵通信国产芯片破解6G波束对准及实时跟踪难题
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。