英伟达携全新AI模型“颠覆”音频界：可创作音乐、修改人声

茶欲醉人 2024-11-26 销售维修 12 次浏览 0个评论

财联社11月26日讯（编辑黄君芝）据报道，英伟达（Nvidia）开发了一种新型人工智能（AI）模型，可以创造声音效果，改变人的发音方式，并使用自然语言提示生成音乐。

这个模型被命名为Fugatto，即Foundational Generative Audio Transformer Opus 1，是一个研究项目。英伟达表示，它不会宣布任何发布这项技术的计划，但它可能会对从音乐、娱乐到翻译服务等行业产生广泛的影响。

英伟达应用深度学习研究副总裁Bryan Catanzaro在接受采访时表示：“Fugatto最令人兴奋的地方在于，它拥有一个模型，你可以要求它以某种方式发出声音，这真的打开了你对它应用范围的想象。”

他进一步解释说，市场上的其他模型，有些可以合成语音，有些可以为音乐添加音效，但Fugatto全部都可以做到。Catanzaro说，可以将其视为视频和图像生成模型（如Stability AI的Stable Video Diffusion或OpenAI的Sora）的一种补充。

“这里最基本的改进是……我们能够使用语言合成音频，我认为，这为人们可以用来创造惊人音频的工具开辟了新的前景。”他补充说。

根据英伟达的说法，Fugatto是第一个具有新兴特性的基础模型，这意味着它能够混合经过训练的元素，并遵循“自由形式的指令”。

具体而言，该模型可以通过标准的文字提示生成音频，也可以处理您上传的音频文件。所以，如果你有一个人说话的文件，你可以把那个人的话翻译成另一种语言，同时让它听起来像他的声音。你也可以选择一个简单的曲调，让它听起来像管弦乐表演，或者在音乐中添加不同的节拍。

此外，你也可以上传一个文档，让模型用你喜欢的任何声音朗读。更重要的是，你可以告诉模型发出带有情感分量的声音。

不过，Catanzaro也补充说，这种模型并不总是完美的。而且，就像生成图像和视频的模型一样，Fugatto也会催生艺术家、音响工程师和相关领域人员的担忧。但Catanzaro指出，他的本意是希望这项技术能帮助音乐家。

“我希望这是艺术家探索的新工具。”“我认为音频一直是一个富有成效的探索领域。你知道，当我们获得新的音频工具时，有时我们会获得新的音乐形式。”他说。

转载请注明来自衢州市恒通茶机有限公司 ，本文标题：《英伟达携全新AI模型“颠覆”音频界：可创作音乐、修改人声》

本文标签：澳门二码精准资料新澳门精准资料大全新澳门精准免费资料下载

茶欲醉人 1762篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！

茶先生管理员

最近发表

标签列表

英伟达携全新AI模型“颠覆”音频界：可创作音乐、修改人声

热门文章

茶饮机家电评测语,茶机好评评语

茶饮机做咖啡怎么做,aca咖啡茶饮机使用教程视频

可以充电的茶饮机叫什么,可以充电的茶饮机叫什么品牌

目前口碑最好的茶吧机即热即饮,茶吧机好用还是即热饮水机好用

咖啡机做茶饮怎么做,咖啡机怎么泡茶的

飞天茅台，快跌破2000元了！经销商说还会跌

文章目录

茶先生管理员

最近发表

标签列表

英伟达携全新AI模型“颠覆”音频界：可创作音乐、修改人声

极越内部人士：夏一平仍留在公司现场办公，正在寻求融资

品钛盘中异动 股价大跌6.80%报0.960美元

纽约料将通过一项新法案 租客有望告别高昂的中介费用

免费特马资料大全,2021年特马免费资料

公考时政免费资料大全,公考时政考试范围

短视频陪跑资料大全免费,短视频陪跑资料大全免费软件

天下免费大全正版资料,资料大全正版资料

澳门传奇资料大全免费,搜索澳门传真网

热门文章

茶饮机家电评测语,茶机好评评语

茶饮机做咖啡怎么做,aca咖啡茶饮机使用教程视频

可以充电的茶饮机叫什么,可以充电的茶饮机叫什么品牌

目前口碑最好的茶吧机即热即饮,茶吧机好用还是即热饮水机好用

咖啡机做茶饮怎么做,咖啡机怎么泡茶的

飞天茅台，快跌破2000元了！经销商说还会跌

文章目录

品钛盘中异动股价大跌6.80%报0.960美元

纽约料将通过一项新法案租客有望告别高昂的中介费用