腾讯混元大模型继续拥抱开源。11月5日,腾讯混元宣布最新的混合专家模型(MoE)“混元Large”以及混元3D生成大模型“Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。
“本次开源是腾讯混元继文生图模型后持续开放的一大举措。”腾讯机器学习平台总监康战辉再发布活动中介绍称,其中,腾讯混元Large是目前开源领域参数规模最大的MoE模型,腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。两个模型均属腾讯自研,在架构、算法、数据等方面有独特创新。目前,两个模型均已经在腾讯业务场景中落地应用,是经过实践检验的应用级大模型。
当天,腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。
据康战辉介绍说,腾讯混元Large模型总参数量 389B,激活参数量 52B ,上下文长度高达256K,经第三方评测,腾讯混元Large 在CMMLU、MMLU、CEval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等9个维度实现领先,超过Llama3.1、Mixtral等一流的开源大模型。
腾讯混元Large 在各类测试集上得分领先现有主流开源模型。腾讯 供图,下同
?
腾讯混元Large模型专项提升的长文能力已经应用到腾讯AI助手腾讯元宝上,最大支持256K上下文,相当于一本《三国演义》的长度,可以一次性处理上传最多10个文档,并能够一次性解析多个微信公众号链接、网址,让腾讯元宝具备独有的深度解析能力。此外,腾讯混元Large 模型已同步上架腾讯云 TI平台。
腾讯混元3D模型负责人郭春超介绍,腾讯混元3D生成大模型首批开源模型包含轻量版和标准版,轻量版仅需10s即可生成高质量3D资产,目前已在技术社区公开发布,包含模型权重、推理代码、模型算法等完整模型,可供开发者、研究者等各类用户免费使用。同时,腾讯混元Hunyuan3D-1.0 模型也已上架到腾讯云HAI,通过HAI上更高性价比的GPU算力、模型一键部署能力和可视化图形界面WebUI,有效降低模型开放和部署门槛。
混元3D-1.0生成的3D产品。
?
郭春超表示,此次腾讯混元开源的3D生成大模型 Hunyuan3D-1.0 ,解决了现有的3D生成模型在生成速度和泛化能力上存在不足的问题,可以帮助 3D 创作者和艺术家自动化生产 3D 资产。该模型具有强大泛化能力和可控性,可重建各类尺度物体,大到建筑,小到工具花草。效果方面,过春潮介绍,在两个公开的3D数据集 GSO 与 OmniObject3D 上,腾讯混元Hunyuan3D-1.0 效果优于主流开源模型,整体能力属于行业领先水平。应用上,3D生成相关技术已经开始应用于UGC 3D创作、商品素材合成、游戏3D资产生成等腾讯业务中。
相关开源模型链接:
https://llm.hunyuan.tencent.com/
https://github.com/Tencent/Tencent-Hunyuan-Large
https://huggingface.co/tencent/Tencent-Hunyuan-Large
https://3d.hunyuan.tencent.com/
https://github.com/Tencent/Hunyuan3D-1
https://huggingface.co/tencent/Hunyuan3D-1
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。