作者:赵广立 来源:科学网微信公众号 发布时间:2024/8/3 20:38:39
选择字号:
又一“大佬”回归学术,曾在两“大厂”做大模型

 

文|《中国科学报》记者 赵广立

又一产业界“大佬”回归高校。

近日,《中国科学报》记者通过多方确认,前雅虎首席数据科学家、知名人工智能科学家杨红霞目前已入职香港理工大学。香港理工大学也在官方网站更新了杨红霞的个人信息页面,职称为正教授。

图片

香港理工大学官网对杨红霞的介绍信息。

杨红霞在产业界的履历光鲜,曾先后任职于IBM、雅虎、阿里巴巴达摩院,最后一站是字节跳动。

今年5月,杨红霞从字节跳动机器学习系统团队离职,据传其去向为自主创业,方向为当下行业的热门“端侧模型”。

阿里通义大模型“元老”

资料显示,杨红霞2007年本科毕业于南开大学,获统计学学士学位。其后她前往美国杜克大学统计科学系攻读博士学位,师从著名科学家、统计学最高奖“考普斯会长奖”得主戴维·邓森(David Dunson)。

博士毕业后,杨红霞入职IBM 托马斯·J·沃森研究中心任研究员,之后入职雅虎公司,担任首席数据科学家。

2016年,杨红霞结束她在美国的留学及职业生涯回国,赴杭州加入阿里巴巴集团。杨红霞领导的阿里巴巴达摩院M6团队致力于认知智能方向,研发了AliGraph、M6大模型、洛犀等较为有影响力的人工智能开源平台和系统。

M6大模型是“通义千问”的前身,也是构建阿里巴巴大模型竞争力的关键基础。

在杨红霞领导的团队与清华大学教授唐杰团队的合作下,M6项目于2020年6月启动;仅一年后,从百亿参数升级到万亿参数规模的M6即获发布并投入使用;2021年10月,M6大模型再次升级,成为全球首个10万亿参数规模的多模态大模型,也是当时世界上最大的中文多模态大模型。

2022年9月,达摩院发布“通义”大模型系列,并构建了大小模型协同的层次化人工智能系统。其中,统一底座的M6-OFA模型由杨红霞领导完成,它在业界首次实现模态表示、任务表示、模型结构统一。

在该项能力的加持下,不引入新增结构,单一模型就可以同时处理多项跨模态任务。这项工作在GitHub上开源,目前被引用数为900+,GitHub星标2400+。

在阿里巴巴达摩院工作期间,杨红霞的职级为P9,曾任达摩院智能计算实验室主任。同时,她的工作成绩也颇为亮眼:2019年,她作为团队带头人获2019世界人工智能大会最高奖“卓越人工智能引领者”(Super AI Leader,简称SAIL奖);2020年,团队收获国评家科学技术进步奖二等奖和杭州市创新领军团队;2022年6月,杨红霞入选2022福布斯中国科技女性Top50榜。

然而,2022年10月,杨红霞被曝因“家庭原因”从阿里巴巴达摩院离职。

图片

 杨红霞在活动上发言。图源:AI Time

“再创业”似与学术任职不冲突

业界再次传来杨红霞的动态,是在2023年3月。此时她已加盟字节机器学习系统(AML)团队,就任字节跳动大语言模型研发技术专家、北美大模型负责人,在美国西雅图开展大语言模型的研发,汇报对象是字节跳动AML和豆包大模型团队负责人项亮。

不过,她在字节跳动的“停留”并没有太久。仅一年多后(2024年5月),杨红霞被曝从字节跳动离职,同时传出她正准备自主创业的计划,方向为端侧模型。

不同于自然语言大模型或多模态通用大模型,“端侧模型”是主要应用于手机、电脑、智能网联汽车等终端设备的“小模型”,具有成本低、可移动、数据安全等优势,是行业追逐的热门方向。

有消息称,杨红霞的创业团队正在筹备组建中,已获得3000万~4000万美元投资,投后估值1.5亿美元。

此后,就没有杨红霞创业的进一步消息了,直到最近,她入职香港理工大学计算机系担任教授的消息传来。不过,一位AI圈内人士告诉《中国科学报》,杨红霞回归学术似乎与创业不冲突。

首先,在人工智能细分领域的创业者,大都有高校院所背景,且许多仍在高校担任教职。

其次,香港理工大学的创业生态系统比较完整,不仅专门开设有“创新和创业”必修课,还积极与企业、科研机构等合作推动科研成果的转化和应用,为学校师生的创业活动提供宽松的环境和广阔的平台。

值得一提的是,杨红霞此前虽未在高校院所正式任职,但她一直与学术界联系密切。

除与清华大学唐杰团队联合开发M6大模型外,早在2020年,她就与浙江大学上海高等研究院开展了“面向产品的电商视频描述”等系列研究;此后,杨红霞还在该高等研究院任兼职教授。其学术成果更是有目共睹,她在顶级会议和期刊上发表论文100余篇,在美国和中国拥有50多项专利。

“AI教授创业者”并不鲜见

在AI创业的风口上,创业者有高校教授头衔的不在少数——

著名华裔计算机科学家、美国国家工程院院士李飞飞就是同时从事学术及创业的典范。她现任美国斯坦福大学“以人为本”人工智能研究院(HAI)院长、计算机科学系教授;今年初,她瞄准“空间智能”领域,筹备并创立了AI初创公司“World Labs”。该公司旨在利用类人视觉处理技术,使AI具备高级推理能力。

AI大模型领域4家创业公司智谱AI、月之暗面、百川智能和MiniMax被合称为“新AI四小龙”,其背后的创业者均有高校院所背景。其中,智谱AI的领军人物、创始人之一是清华大学计算机系教授唐杰。

开发了“国产Sora”——文生视频大模型Vidu的AI初创公司“生数科技”,其领军人物、创始人之一是清华大学计算机系教授朱军。同时,朱军还是第三代人工智能技术创业企业“瑞莱智慧”的董事长兼首席科学家。

此前被斯坦福大学学生AI团队抄袭的中国大模型公司“面壁智能”,其创始人也在高校任职,即清华大学计算机科学与技术系副教授刘知远。

选择“可信大模型”作为创业方向的漆远,曾在蚂蚁集团任副总裁,之后他也选择重返学界,在复旦大学担任人工智能创新与产业研究院院长、浩清特聘教授。后来,他产学研协同并进,创立了可信大模型公司“无限光年”。

另有一家AI芯片初创公司的主要人员几乎都在高校任职,它就是“无问芯穹”。无问芯穹的发起人汪玉是清华大学电子工程系主任、长聘教授,担任CTO的是北京大学副研究员颜深根,首席科学家为上海交通大学长聘副教授、清源研究院人工智能设计自动化创新实验室负责人戴国浩。

由此看来,杨红霞进入高校后,继续从事AI创业并不令人意外。换言之,人工智能前沿技术的推广应用,既离不开技术在实验室的深入打磨,也离不开进入市场后的落地锤炼,正适合这些既有学术背景又有产业化能力的AI高水平人才大展拳脚。

 
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
跨能量尺度原子核结构研究获突破 我国地震工程领域首个国之重器通过验收
遗传分析追踪潘多森林的进化 团队研制出高性能的蓝光量子点液体激光
>>更多
 
一周新闻排行
 
编辑部推荐博文