听 Dreamtonics 创始人华侃如亲自介绍 Synthesizer V Studio 2 Pro 的厉害之处

为你量身打造专属音乐世界:BrianFay Poly50 / Para50 耳机评测

全能音频接口的进化与突破:Focusrite Scarlett 18i20 第四代如何颠覆录音体验?

Pro Tools 专家国际认证全程班开启报名,4 月假期北京线下等你加入

颠覆传统排练模式:Wolff Audio MEMORE 让灵感永不褪色的「时光保险柜」

听 Dreamtonics 创始人华侃如亲自介绍 Synthesizer V Studio 2 Pro 的厉害之处

musiX 添加于 13 小时前 ·

分享到微信

暂无评论


图:Dreamtonics 创始人华侃如在 NAMM Show 2025 展位向我们介绍全新的Synthesizer V Studio 2 Pro
摄影:DTM Station网站创始人藤本健

Midifan十分有幸的在NAMM Show 2025美国乐展上采访到了Dreamtonics 创始人华侃如,正值AI歌声合成软件Synthesizer V Studio 2 Pro在展会上首次盛大发布,我们借机体验了最新一代的人声合成引擎。


如果你还不了解 Synthesizer V Studio,它是一款基于人工智能的歌声合成软件,只需通过导入MIDI文件或MIDI键盘输入旋律并填入歌词,它就能立即为你提供基于旋律渲染的高品质合成歌声,如同真人一般逼真自然。Dreamtonics 通过与专业歌手合作,录制了各种风格的可商用人声,并提供丰富的参数,帮助您根据作品需求深入定制歌声的每一个细节。

据华侃如介绍,这次跨版本更新的重点是对整个界面和工作流程的改进。


从新开始:为什么?怎么走?


Synthesizer V Studio Pro软件从诞生到现在已经五年之久了,在五年前诞生之时,它的底层合成引擎还是采用当时比较传统的拼接合成模式,发布一年后转向神经网络,但编辑器是按照优化拼接合成的工作流程设计的,这对未来功能和质量上的改进带来了困难。

华侃如以人声录音流程的例子解释了先前 AI 的局限:

「假设你让一个歌手,演唱同一个歌五遍,其实每一遍唱的都是不一样的。但如果你用这五遍演唱结果去让 AI 学习的话,它并不知道哪一遍是最正确、最符合人类喜好的,如果就这样反复学习,那么它的结果就会越来越趋近五遍演唱平均的演唱水平。」

「虽然后来我们找出了许多办法来试图克服掉这个技术问题。但是合成引擎和UI的接口是基于拼接式合成开发的,很多设计固定死的,在这个基础上硬加上一些魔改之后,就会导致内部很多地方出现不兼容的情况。随着开发越来越深入,我们逐渐发现软件整体的音质和操作流程都受到了这个框架的限制。

「所以我们下决心从新开始,推出V2版本。」


逼近真实的人声:什么才是我们想要的歌声?


华侃如表示Synthesizer V Studio Pro软件每次版本迭代的重点都是提高歌声合成的人声质量,其目标始终是能够为创作者提供尽可能逼近真实的人声。但什么才是真实的人声?华侃如也表达了自己的看法:

「对于歌声的质量在不同的阶段,不同的人会有很多不同的定义。比如一开始我们离最终目标——如同真人版真实自然的歌声——还不是很接近的时候,我们和用户会觉得声音本身要尽量清澈一点,这样会感觉听起来干净一些,它呈现出来的质量也就更好。」

「当我们越来越接近合成出几乎等同于真实人声的时候,我们开始把使用新算法合成的歌声给更多的人去听,把它们和真人的演唱录音放在一起,进行主观对比测试,让听众来选出哪个比较真实,伴随我们开发的深入,新的算法在测试中越来越多地在测试中获得比真人录音还要高的分数。大概就在两年前,我们终于可以做到为合成歌声赋予真实人声级别的自然度了!」

「能够取得这个突破,来自于我们之前推出的AI重录功能。从技术上讲,我们放弃了去追求所谓的“最好的声音”,放弃去探索和定义什么才是最优质,而让AI去全面的尝试呈现所有可能的演唱,就像刚才提到的,让一位真人歌手演唱同一首歌五遍,每一遍的呈现都是不同的。我们就是设想在软件中重现这一过程,虽然这么做可能会出现一些表现比较差的演唱,但更有可能会出现超出平均的,更好的的声音表现。」

「当我们获得了更多的演唱效果,就需要我们进行挑选了,这个过程既有用户的参与,也通过机器学习让AI实现。最终我们综合用户在使用过程中的反馈,不断引导AI去接近最好的表现。最终成为我们开发新一代歌声合成的质量基准。」


歌声兼容性:不升级也可以继续使用


Synthesizer V Studio Pro 开发五年至今,Dreamtonics 和他们的合作伙伴已经为创作者带来了80 款合成歌声,在软件换代时如何实现歌声的平滑过渡也是诸多创作者和用户关心的话题。华侃如在采访中也向我们证实,V1版本的声库可以直接在V2里面使用,Dreamtonics 和合作伙伴将为V1版本声库发布免费的兼容性更新受益于软件内部实现的大量技术更新与优化V1版本声库能够在 Synthesizer V Studio 2 Pro 上获得一定的歌声质量提升,但如果你要获得全面的质量改进和全部的更新的话,就需要使用V2升级版的声库。

「目前我们已经率先把自己第一方所有的声库都升级到了V2,一共29款。接下来我们会和各家合作伙伴共同合作帮助他们也升级到V2声库,目前已经和一些合作伙伴沟通取得了共识,将在产品正式发布的时候同步提供新版本。」

「目前升级方案的细节还在讨论中,但是我们可以明确的是,我们整个软件系统还是一次性购买的模式,不会有订阅制或年度费用。」


编辑器改进:熟悉的界面 全新的功能


Synthesizer V Studio 2 Pro 虽然在界面之下做了许多改进升级,但用户界面还是保持着与上一代同样的风格,更加精细化。创作者大部分使用习惯也都能得到保留,包括MIDI输入、歌声转 MIDI 这些便利性功能都与上一代保持着一支的体验。与此同时,Dreamtonics也根据用户反馈做了一些改进,华侃如向我们介绍了几个例子:

「比如说现在新写一个新的音符的时候,软件会自动创建的一个新的音符组。整个音符组的操作逻辑也有很多改善。你可以在这个编排面板里面点击右键做很多操作,比如说分割音符组。」

「再比如说节拍和曲速现在也有专门的选项和节拍音轨。」

除此之外,Synthesizer V Studio 2 Pro 还引入了一系列全新的功能。华侃如介绍,在 Synthesizer V Studio 2 Pro 中,歌声质量提升将围绕“动态”与“控制”两个关键词进行。一方面,更好的动态是为歌声带为更加精准地还原真实人类歌声中的动态变化,在保持发音与音高精度的同时,带来细腻的细节处理和更强的临场感。

另一方面,更好的控制为创作者带来了深入定制歌声细节的新功能。在新版本中,新的音素时值面板可以让你控制每一个咬字的元音与辅音发音时机与力度变化,口型参数能够让你改变虚拟歌手的演唱口型,全新的声线唱法提供覆盖音高、音色、发音三个维度的唱法风格化控制,帮助创作者更加精准地定义歌声的演唱风格——例如,将“强力(Powerful)”风格的音高、“实唱(Belting)”风格的音色、“柔和(Soft)”风格的发音三者相结合,实现在上一代产品无法到达的全新变化。


资源占用:依旧离线 更加高效

Sytnthesizer V Studio Pro 是完全的离线合成软件,它的歌声合成过程完全在电脑本地进行,不依赖网络,因此它的合成速度依赖于电脑的CPU配置。虽然上一代软件已经取得了良好的合成效果,但是每次修改后仍然有一定的渲染等待时间。为了消灭这“最后一秒钟”的等待窗口,Synthesizer V Studio 2 Pro 在渲染速度上下了大力气进行改进。虽然这带来了一定的CPU占用提升,但却带来了V1难以比拟的渲染速度提升。华侃如也向我们解释了这其中的变化:

「与上一代相比,V2的重要改进在于会在瞬间集中CPU资源处理。如果你观察 Synthesizer V Studio Pro 软件的CPU占用变化就会发现,V1的CPU占用一直很高很平,几乎没什么变化,但需要很长时间渲染。V2版本将长时间的CPU渲染占用集中到一个短暂的周期中,将渲染在这个周期内集中完成,CPU会在一瞬间一次性渲染完,之后就用不到CPU了。这也是V2版本相对V1最大的改进。」

「这么做有两个好处,一是播放的时候不会再重复占用CPU进行渲染,二是在编辑的时候就可以更快看到你的编辑结果。现在实时呈现波形渲染的功能在V2上经过了很多优化,不只会整体减少对CPU的占用,而且可以把整个系统调度做得更灵活了,减少了资源浪费。」


实时人声变形插件Vocoflex:最大化歌声的表现维度


Synthesizer V Studio Pro 的歌声都是预先制作的,由 Dreamtonics 与专业歌手合作制作,以此确保 AI 合成的歌声经过授权且适合商用,减少创作者需要处理的法律问题。长期以来,创作者和用户都在期待能够将自己的音色用于合成歌声,甚至能够像他们的歌声数据库产品一样方便地做成声库,并使用Synthesizer V Studio Pro 强大的编辑功能来制作演唱歌声。但很遗憾 Synthesizer V Studio 2 Pro 还是没有向普通消费者开放自制第三方声库的功能,对此,华侃如解释说,制作一款歌声数据库不仅对录音数据有着较高的质量要求,还会用到相当多的运算资源进行处理与训练。目前对于家用电脑设备来说,这些要求都还很难满足。不过,Dreamtonics 还是给出了他们的解决方案,那就是去年发布的革命性的实时歌声变形插件 Vocoflex。

如果Synthesizer V的用户想得到自己的声音,那华侃如也推荐大家使用Vocoflex。

「如果你想要使用自己的歌声去演唱更多的歌曲的话,我会推荐使用Vocoflex,也就是使用 Vocoflex 对 Synthesizer V Studio Pro 合成的音高进行变形,将自己的声音融入到演唱中。现在,每个 Synthesizer V 歌声数据库都配备了很多声线唱法,每个声线唱法里面现在又分成了音高、音色、发音等维度,它们给定制不同的演唱风格提供了非常广阔的探索空间,将这些维度与你自己的声音风格相结合,就能制作出与你的歌声最相配的延长效果,使用 Vocoflex 可以最大化每个歌声数据库的价值。」


V2升级即将到来:超值价格 一次付费


现在 Synthesizer V Studio 2 Pro 现在已经开放预订,已有用户可以享受优惠价格进行升级,新用户也能够以优惠价格购买歌声,还能在升级到 V2 后重新选择新的随附免费歌声数据库。只需 1099 元即可获得能够终身使用的 Synthesizer V Studio 2 Pro 编辑器软件与一款歌声数据库,还可以从三款免费随附产品中额外自选一款。对于老用户,在 2025 年 4 月 21 日前都可以享受优惠价格,编辑器升级仅需 299 元,歌声数据库根据你拥有的数量不同而不同,五款以上更有 599 元的封顶优惠价。

Synthesizer V Studio 2 Pro 和它们的歌声数据库都是一次性付费,只需要一次购买就可以终身使用并用于商业目的。

软件将在2025年3月21日正式发售,届时大家就可以用上地表最强大的完全本地离线运行的人声合成软件啦!

你也可以关注 Dreamtonics 官方公众号详细了解他们的升级与优惠政策。

中文官网:https://www.dreamtonics.com/zh-CN/synthesizerv/

文章出处 https://www.midifan.com/

转载文章请注明出自 Midifan.com

暂无评论