
直播时间:2025年5月13日(周二)19:00——20:00
直播平台:

科学网视频号
【直播简介】

报告题目:叠层模型驱动的书法文字识别方法研究
报告人:麻斯亮,华南理工大学
报告摘要:
基于二维图像的书法文字识别是指利用计算机视觉技术对书法文字单字图像进行识别,在古籍研究和文化传播中具有重要应用。目前书法文字识别技术已经取得了相当不错的进展,但依旧面临很多挑战,比如复杂多变的字形可能导致的识别误差,汉字本身又存在较多形近字,且汉字字符类别数与其他语言文字相比更多,书法文字图像普遍存在类内差距大、类间差距小的问题。为解决这些问题,提出叠层模型驱动的书法文字识别方法(SDCR),通过使用数据预处理、节点分离策略和叠层模型对现有单一分类模型进行改进,按照字体类别对同一类别不同字体风格的文字进行二次划分;针对类间差距小的问题,根据书法文字训练集图像识别置信度对形近字进行子集划分,针对子集进行嵌套模型增强训练,在测试阶段利用叠层模型对形近字进行二次识别,提升形近字的识别准确率。为了验证该方法的鲁棒性,在自主生成的SCUT_Calligraphy数据集和CASIA-HWDB 1.1,CASIA-AHCDB公开数据集上进行训练和测试,实验结果表明该方法在上述数据集的识别准确率均有较大幅度提升,在CASIA-HWDB 1.1、CASIA-AHCDB和自建数据集SCUT_Calligraphy上测试准确率分别达到96.33%、99.51%和99.90%,证明了该方法的有效性。
讲者简介:
麻斯亮 工学博士,研究兴趣为模式识别与人工智能,2021年11月~2024年6月先后担任CCF华南理工大学学生分会执行委员、主席,担任IEEE Access 期刊、ICRA和ICASSP会议审稿人,已发表JCR-1区期刊论文1篇,CCF-A类和B类中文期刊论文各一篇,其中提出的MPDIoU度量方法被多个公众号转发,谷歌学术引用量330+,在目标检测任务中性能提升明显。

报告题目:基于料面视频图像分析的高炉异常状态智能感知与识别
报告人:朱霁霖,中南大学
报告摘要:
智能感知、精准识别高炉异常状态对高炉调控优化和稳定运行至关重要,但高炉内部的黑箱状态致使传统检测方法难以直接感知并准确识别多种高炉异常状态。新型工业内窥镜可获取大量料面视频图像,为直接观测炉内运行状态提供了全新的手段。基于此,提出一种基于料面视频图像分析的高炉异常状态智能感知与识别方法。首先,提出基于多尺度纹理模糊C均值聚类的高温煤气流区域提取方法,准确获取煤气流图像,并提取煤气流图像多元特征;其次,提出基于特征编码的高维特征降维方法,结合自适应K-means++、算法,实现煤气流异常状态的粗粒度感知;在此基础上,通过改进雅可比−傅立叶矩提取煤气流图像深层特征变化趋势,进而提出细粒度煤气流异常状态感知方法;最后,基于煤气流异常状态感知结果,结合料面视频图像,提出多级残差通道注意力模块,建立高炉异常状态识别模型ResVGGNet,实现高炉煤气流异常、塌料和悬料的精准在线识别。实验结果表明,所提方法能准确识别不同的高炉异常状态且识别速度快,可为高炉平稳运行提供重要保障。
讲者简介:
朱霁霖 中南大学自动化学院博士研究生,本科毕业于南京理工大学轨道交通与控制专业,硕士毕业于中南大学控制工程专业。主要研究方向为先进检测技术、工业过程信息智能感知与故障诊断。近年来,以第一作者或通讯作者在IEEE/CAA Journal of Automatica Sinica(自动化学报英文版)、IEEE Transactions on Instrumentation and Measurement、IEEE Transactions on Artificial Intelligence、《自动化学报》等期刊/会议上发表论文8篇,授权PCT国际发明专利1项,授权和公开国家发明专利4项。
【主持人简介】
樊彬 北京科技大学教授
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。