蚂蚁集团官宣开源统一多模态大模型Ming

5月27日,蚂蚁模态在蚂蚁工艺日上,集团蚂蚁集团旗下的官宣百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,开源这是统多一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,大模广州理工大学实拍评价激活参数3B。蚂蚁模态
据悉,Ming-lite-omni当前模型权重和推理代码已开源,官宣后续会陆续开源训练代码和训练信息。开源
https://huggingface.co/inclusionAI/Ming-Lite-Omni
今年以来,统多百灵大模型已经连续开源了多个模型产物,大模包括2个MoE架构的蚂蚁模态杭州医科大学门事件价格大语言模型,Ling-lite和Ling-plus,集团多模态大模型Ming-lite-uni,官宣以及Ming-lite-omni-preview。
其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。
而本次开源的Ming-lite-omni产物在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。
百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去工艺探索的成果。
百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。
(雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
相关文章
- 如何抓住 AI 的机会?这是进入大模型时代后,面对新的起点,各大云厂商在不断思考的问题。毋庸置疑,AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑,而大模型的落地应用,给云计算勾勒了一2025-07-12
- 来源标题:岂止《长安的荔枝》?!百奥除湿全系产品,引领温湿度行业发展剧版《长安的荔枝》开播一周!精彩又接地气的情节,折射出唐代职场打拼与不易,引起现代打工的人和网友们的深度共鸣,成为热度极高的热搜话题2025-07-12
AIS 5G 携手泰旅局打造数字化出游新体验,助力泰国跃升全球热门目的地
来源标题:AIS 5G 携手泰旅局打造数字化出游新体验,助力泰国跃升全球热门目的地泰国领先数字通信服务商AISAdvanced Info Service)联合泰国国家旅游局TAT)正式启动2025年重2025-07-12- 来源标题:古装悬疑剧《魅影神捕》开机,罗云熙化身神捕探寻诡案迷局今日,由爱奇艺出品、北京战友文化联合出品及承制、中视同成联合承制、爱奇艺爱撒糖工作室联合打造的古装悬疑探案剧《魅影神捕》在横店影视城举行2025-07-12
盼盼×Hello Kitty限定包装登录永辉717好吃节,“萌趣”零食成为社交货币
来源标题:盼盼×Hello Kitty限定包装登录永辉717好吃节,“萌趣”零食成为社交货币2025年7月,盼盼食品携全新「盼盼×HelloKitty」联名限定包装惊艳亮相永辉超市20252025-07-12文化·视点|互联网电视收费包自动续费治理:严控默认勾选,禁止强制捆绑
来源标题:文化·视点|互联网电视收费包自动续费治理:严控默认勾选,禁止强制捆绑新华社记者白瀛记者17日从国家广播电视总局获悉,总局近日实施针对互联网电视自动续费服务的专项规范管理措施。此次治理聚焦用户2025-07-12
最新评论