Meta发布新AI模型 实现跨语言实时交流

2024-02-18 15:48:42 Xone

Meta发布了一款名为SeamlessM4T的AI模型,可以在数十种语言之间进行语音翻译,为实现跨语言实时交流奠定了潜在基础。根据Meta在一篇博文中的宣称,SeamlessM4T模型支持近100种语言的文本和语音翻译,以及35种语言的语音翻译,将以前只能在单独的模型中提供的技术结合在一起。

Meta的首席执行官马克·扎克伯格表示,他设想这些工具将帮助全球用户在元宇宙实现实时的无障碍互动。该公司计划向公众提供这一模型,供非商业使用。

作为全球最大的社交媒体公司之一,Meta今年发布了许多免费的基本AI模型,其中包括一个名为Llama的大型语言模型。Llama模型对OpenAI和谷歌销售的专利模型构成了严峻的竞争。

扎克伯格表示,对于Meta来说,开放的人工智能生态系统非常有利。与提供收费AI模型相比,Meta可以通过高效的众包方式为其社交平台创建面向用户的工具。

然而,Meta也面临着与其他行业企业类似的法律问题,这些问题与创建模型时所使用的训练数据有关。喜剧演员莎拉·西尔弗曼(Sarah Silverman)等创作者在今年7月对Meta和OpenAI提起了版权侵权诉讼,指控这两家公司未经许可将他们的书籍用作训练数据。

Meta的研究人员在一份研究论文中表示,SeamlessM4T模型的音频训练数据来自于400万小时的"原始音频",这些音频来自一个公开的网络数据抓取库。然而,该公司没有具体说明是哪个库,Meta公司发言人也没有回答有关音频数据来源的问题。

论文还指出,文本数据来自去年创建的数据集,这些数据集是从维基百科和相关网站中提取的内容。

版权声明:Xone 发表于 2024-02-18 15:48:42
转载请注明: Meta发布新AI模型 实现跨语言实时交流 | Xone