6月5日,“大晓机器人”联合香港中文大学多媒体实验室、深圳河套学院发布最新世界模型研究成果Kairos-HomeWorld。据介绍,这是全球首个全屋生成、个体物体全交互的世界模型。只需输入一句文本指令,模型就能自动生成一套结构连贯、物理合理、可操作的全套中国家庭三维(3D)场景。
全屋场景生成演示。 大晓机器人供图
据了解,此前,室内场景生成大多只能覆盖单个房间,且生成的场景“只能看不能用”。Kairos-HomeWorld首次实现了从单房间到全屋、从静态到可交互的跨越。机器人可以在这里完成抓取、开门、整理物品等复杂家务训练,新增场景近乎零边际成本,无需担心场地租用或家具损耗。
团队同步开源了全球规模最大、专为中国家庭打造的全屋3D数据集。该数据集包含30万张真实住宅平面图、5000个带可交互家具和物体的全屋仿真场景,以及5万个可交互物体资产,覆盖从30平米小户型到200平米以上大户型的各类典型中国住宅,还原了南北通透、封闭式厨房、独立阳台、玄关等本土居住特征。相比之下,此前国际主流数据集多基于欧美户型,机器人在中国家庭中容易出现“水土不服”。
信息显示,大晓机器人成立于2025年,由商汤科技联合创始人王晓刚出任董事长,知名AI科学家陶大程担任首席科学家。该初创公司专注机器人自主决策能力,此前已发布开源世界模型Kairos 3.0和具身超级大脑模组A1,并通过蚂蚁集团、启明创投、联想创投等机构完成天使轮融资。此次联合发布全屋生成模型和配套数据集,旨在为具身人工智能的国产化落地提供核心数据与技术底座。
技术层面,Kairos-HomeWorld采用四阶段分层生成架构:先从真实户型图生成建筑骨架,再精细布局家具,然后用视觉模型自动修正“沙发挡门”“物体穿墙”等错误,最后为每个物体赋予密度、铰链等物理属性。生成的每个场景平均包含15个以上可操作物体,机器人可直接在仿真引擎中抓取、移动、堆叠,甚至模拟倒液体、拉窗帘等动作。
目前,该模型已用于大晓机器人的日常训练。在现场演示中,工作人员输入“生成一套新中式90平米两室一厅”,模型迅速生成完整户型;再下达“全屋物品整理”指令,机器人自动拆解任务,按“客厅—阳台—厨房—主卧—餐厅—次卧”的动线完成导航、识别、抓取和归位全过程,期间还打开了冰箱门、倒出了洗衣液。
研究团队表示,Kairos-HomeWorld和配套数据集将面向学术界与产业界全面开源,后续还会持续扩充不同地域、装修风格的场景样本,进一步降低服务机器人的研发门槛,加速具身智能在中国家庭中的落地。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。