Meta推出多模态语音翻译模型 SeamlessM4T 可转录翻译近百种语言


(资料图)

编程客栈()8月23日 消息:Meta 发布了一种多模态编程语音翻译模型 SeamlessM4T,可以无缝地在语音和文本之间进行翻译和转录。

该模型支持近100种语言的自动语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译以及文本到语音翻js译等任务。为了支持这个模型的发展,Meta 还发布了 SeamlessAliandroidgn 的元数据,包含了27万小时的语音和文本对齐数据。

SeamlessM4T 在近100种语言上取得了最好的结果,并在支持语编程客栈言中资源较少的语言上表现出色。Meta 希望通过开放分享 SeamlessM4T 模型和相关技术,推动多语言翻译领域的发展。

此外,Meta 还提供了 SONAR、stopes 和 fairseq2等工具和库,用于数据挖掘、多模态数据处理和序列建模。

推荐DIY文章
持续引领智能手表体验!OPPO Watch系列新品沟通会召开
当智能健身走向全民化:AEKE轻力量家庭智能健身房引领未来
海艺AI:迎合“AI时代”发展潮流,刷新绘图市场传统认知
布局产业新高地!海星医药健康创新园B区奠基仪式隆重举行
未来五年500亿投入打底,北汽蓝谷锚定细分市场增量
【展会直击】华秋慕尼黑上海电子展精彩ing,助力电子产业高质量发展!
精彩新闻