多语种语音合成克隆_多语种语音合成

⊙^⊙

趣丸科技联合港中大(深圳)开源语音大模型MaskGCT,刷新全球多项SOTA10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越性能。据介绍,MaskGCT在三个小发猫。

ˋ^ˊ〉-#

OpenAI藏了1年多的技术公开!15秒素材克隆声音,HeyGen也在用克雷西发自凹非寺量子位| 公众号QbitAIOpenAI雪藏的新产品——语音合成引擎Voice Engine,终于被正式揭幕。有了它,只需15秒的语音样本,就能克隆出一个人的声音,而且还能跨越语言!APP版ChatGPT中的语音对话功能,也正是由这项技术所驱动。效果如何?先来听段DEMO:Salt als后面会介绍。

∩0∩

1分钟复刻明星语音,这家AI创企开年跻身独角兽语音合成的ElevenLabs,刚刚完成8000万美元(约合人民币5.7亿元)B轮融资,估值超过10亿美元。在语音克隆领域,ElevenLabs(11Labs)是公认的说完了。 11Labs开始逐步推出他们的语音模型,包括文字转语音(TTS)、声音克隆等。现在,11Labs能实现29个语种的语音生成。比如说中文,是酱婶的:官说完了。

AI与“粉红诱惑”主打共情AI语音的Hume AI趁势推出了第一个AI情感互动播客产品;AI音视频基础设施平台初创公司LiveKit宣布筹集2250万美元的A轮融资,OpenAI和Character.AI都是其客户。自大模型浪潮席卷而来,AI语音赛道经历了从克隆、合成到实时反馈、情感化的变化。在大模型多模态进化的主线还有呢?

原创文章,作者:上海傲慕捷网络科技有限公司,如若转载,请注明出处:http://geyewr.cn/u7frimpg.html

发表评论

登录后才能评论