关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1716人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

复盘瓦格纳"24小时哗变":一度称距莫斯科仅200公里

澎湃新闻 浏览 15860

何洁携家人看画展靠老公怀里甜笑,俩女儿超有爱

娱絮 浏览 14746

找来索尼做帮手,本田即将向特斯拉“宣战”

车快评 浏览 12678

iPhone17来了!华强北最新实探

中国基金报 浏览 1734

逆光派对加冕年度总冠军!首届“怒放竞技场”厦门圆满落幕

直播吧 浏览 13833

28岁女子和56岁老汉缠绵后想嫁他 老汉不愿离婚杀死她

汉史趣闻 浏览 84953

荣耀 Magic V Flip 官宣 6 月 13 日发布,折叠屏形态行业最全

IT之家 浏览 11026

罗体:国米有意米兰15岁天才卡马达,本周日后他可与任何队签约

直播吧 浏览 12318

日本计划部署导弹可攻击中国 当地民众:万分危急

环球网资讯 浏览 13125

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 756

以军对黎巴嫩真主党多个目标发动空袭

环球网资讯 浏览 12783

无惧比特币现货ETF上市以来天天跌!贝莱德ETF突破10亿美元

华尔街见闻官方 浏览 12454

媒体:李尚福成为中国防长后第二次访俄 信息量不小

直新闻 浏览 14634

镜报:阿联酋财团准备收购曼联股份,小贝或任此次收购代言人

懂球帝 浏览 1023

伊姐周日热推:电影《海关战线》;综艺《闪光的夏天》......

伊周潮流 浏览 11333

Rivian R3亮相 提供三电机版套壳R2 售价低于4.5万美元

智车情报局 浏览 12216

ESPN:普利西奇与米兰原则性谈妥个人条款,但转会费未谈妥

直播吧 浏览 15379

看了这些日系穿搭才知道,还是西装和衬衫最靠谱,舒适大方

静儿时尚达人 浏览 806

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 1050

谷歌DeepMind曝光首个“AI 经济体”完整架构,Agent催生全新经济体正在悄然成形

AI寒武纪 浏览 1817

一周前还参会的"老虎"任上落马 下属曾遭黑社会殴打

中国新闻周刊 浏览 92880
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1