蚂蚁集团官宣开源统一多模态大模型Ming

5月27日,蚂蚁模态在蚂蚁工艺日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模B站美女号吐槽合集合集激活参数3B。蚂蚁模态
据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练信息。开源
https://huggingface.co/inclusionAI/Ming-Lite-Omni
今年以来,统多百灵大模型已经连续开源了多个模型产物,大模包括2个MoE架构的蚂蚁模态王某艳照流出合集大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。
其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。
而本次开源的Ming-lite-omni产物在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。
百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去工艺探索的成果。
百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
相关文章
聚焦AI科技与医疗的跨学科融合,CAIR香港人工智能与机器人医疗论坛开幕
2024年3月28日至29日,“CAIR香港人工智能与机器人医疗论坛”在香港科学园举行。论坛由中国科学院香港创新研究院人工智能与机器人创新中心主办,聚焦人工智能与机器人在医疗领域的创新应用。来自全球的2025-07-12- 在数字化转型浪潮席卷全球的今天,企业业务系统愈加复杂,日志、指标、链路、事件等海量数据如同迷雾,遮蔽故障根因,拖慢业务响应。可观测性技术正从“看得见”向着“智能预判、自主决策”层级演进,已成为保障数据2025-07-12
DeckSpeed 严訸:创业的本质是对全世界的祛魅| 00后创业者系列
作者丨朱可轩编辑丨陈彩娴受到姥爷影响,如果给人生写两个关键词,严訸首当其冲想到的是「工程」和「生意」。从小未曾想过长大要「进厂打工」,他创业的种子自初中便已在心中萌芽,产品基因也自此开始积淀。那时每逢2025-07-12推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧!”一时间,2025-07-12- 7月9日,歌手周杰伦正式入驻抖音,开通了他第二个中文社交媒体账号,取名“周同学”,头像是他的玩偶形象。抖音称“花9位数签周杰伦”不属实。2025-07-12
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025 年 2 月 21 日,阶跃在上海迎来了首届 Step UP 生态开放日。活动中,阶跃重点介绍了其在智能终端 Agent 领域的战略布局,同时汇聚了吉利汽车集团、OPPO、智元机器人等行业巨头2025-07-12
最新评论