Meta 声称,SeamlessM4T 将与新的翻译数据集 SeamlessAlign 一同开源,它代表了人工智能驱动的“语音到语音”和“语音到文本”领域的“重大突破”。
Meta 表示,该模型可以在近 100 种语言之间进行文本到语音的翻译,并支持 35 种语言的完全语音到语音翻译,而此前要想实现类似的操作只能在单独的 AI 模型中分别进行翻译。SeamlessM4T 支持:
1、近 100 种语言的语音识别。
2、近 100 种输入和输出语言的语音到文本翻译。
3、支持近 100 种输入语言和 36 种输出语言的语音到语音翻译。
4、支持近 100 种语言的文本到文本翻译。
5、支持近 100 种输入语言和 35 种输出语言的文本到语音翻译。