首页>基金 > 正文

清华联合字节,开源听觉大语言模型SALMONN

2023-08-23 04:40:40    出处:DoNews


(相关资料图)

清华大学电子工程系日前与字节跳动的火山语音团队携手合作,推出一款开源大语言模型 SALMONN。SALMONN 模型支持语音、音频以及音乐输入,它可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。

官方表示,SALMONN 支持语音、音频以及音乐输入,可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。

目前 SALMONN 能够胜任英语语音识别、英语到中文的语音翻译、情感识别、音频字幕生成、音乐描述等重要的语音和音频任务,同时又涌现出多种在模型训练中没有专门学习过的多语言和跨模态能力,涵盖非英语语音识别、英语到(中文以外)其他语言的语音翻译、对语音内容的摘要和关键词提取、基于音频的故事生成、音频问答、语音和音频联合推理等任务。

目前该模型已经发布于 GitHub 中。

关键词:

相关内容

消费
产业
我国首个独立知识产权的大连达思科航运指数发布 8月18日,大连东北亚国际航运中心和国际物流中心建设10周年高端论坛,
再下一城!中国U18男篮71分大胜中国澳门 明天下午17:00,中国U18男篮将迎战中国香港队,球迷朋友可以登录企鹅
李易峰回国后显窘状!独自穷游顶烈日排队买票,帮老人抬绳有善心 近日,消失将近一年的李易峰罕见现身成都机场,还有很多粉丝去接机,场
非对称“降息”!8月LPR报价出炉:1年期降10BP,5年期按兵不动 非对称“降息”!8月LPR报价出炉:1年期降10BP,5年期按兵不动,降息,央
基金