通过将CPU负载转移到图形处理单元,GPU音频在音乐制作的中心放置了一个强大而未被充分利用的并行处理器。这一转变可能会对新兴的音乐元宇宙、人工智能、资源密集型生产环境、协作平台和带宽要求高的音乐会直播流产生巨大影响。该公司可能提供关键的支柱,以支持无数快速崛起的音乐产业子类别。
在2022年,跟上飞速发展的音乐产业是一项艰巨的任务。曾几何时,数十亿的流已经足够让人眼花缭乱了——现在,这个行业充斥着化身带、元宇宙直播、日益复杂的DAW或插件选项、新兴的协作平台、非ft的激增和失败,以及资源密集型的沉浸式音频体验。
这是一个令人眼花缭乱的爆炸——特别是当它涉及到所有的动力的话题。像复杂的空间音频环境和实时干扰等概念在纸上听起来很棒,但是否有足够的处理能力来处理所有这些?
图形卡(或gpu)是一种未被充分利用的处理能力,不仅能够处理图形,而且可以承受大量的工作负载。它们是现代人工智能产业的支柱、元数据的基础设施,以及现在——音频的未来?
随着科技的进步超越了想象力,对音频的计算需求也随之而来。诸如空间音频、神经网络、基于机器学习的插件和大型虚拟模拟插件等升级技术凸显了音乐开发者的巨大需求。技术发展的方向需要一种新的“加工标准”。
专业音频行业已经尝试了许多前瞻性的解决方案,从SHARC到fpga。但没有一家公司成功地利用了显卡未充分利用的功能。由于GPU架构和音频处理的顺序性质之间的根本差异,这项技术已经完全理想化了,但从未有效执行过。
现在,总部位于洛杉矶的GPU Audio正在利用内置GPU的强大功能进行音频制作,并试图改变众多其他行业的面貌。
目前唯一一家能够充分利用内置GPU处理能力的公司,GPU Audio的创始人称自己为“加速音频计算”的“解锁者”和“使能者”。
从最初的用户反馈来看,该公司似乎填补了该行业的一个真正的空白。GPU Audio联合创始人兼联合首席执行官Alexander“Sasha”Talashov将该公司描述为“连接公司、复杂任务和系统的导电层”。就在最近,该公司与DMN合作,扩大采用并加速这一强大解决方案的增长。
GPU Audio发布了它的Early Access插件它已经被吹捧为一种解决方案,将并行处理带回音乐制作的前沿。在NAMM发布后,GPU Audio的预测试用户在今年夏天增长了33倍,目前已超过2万——而在6月的前几天,这一数字仅为600。就在几周前,他们进一步发布了“测试版套件”,以不断增长的音频插件工具集为特色,从经典的主流效果开始:Flanger, Phaser和Chorus。
Talashov谈到了该公司更广泛的使命,即建立pro-audio的新标准,并使其能够连接到其他计算技术的进步。根据Talashov的说法,当前的VST3标准就是一个很好的例子。“VST3没有提供任何新功能;这和我们没有任何联系。没有新的硬件,没有新的软件,没有通往世界其他地方的新桥梁。所以我们从这里开始——将它连接到GPU上。”
谈到用gpu搭建这座桥梁,Talashov补充道:“这不仅是连接平台,也是连接行业。”
众所周知,处理能力瓶颈一直是专业音频行业的祸根。
可怕的延迟已经摧毁了所有音频制作人的理智。然后就出现了渲染词干、合计一组混音、或者不得不冻结或导出和导入音轨以节省DSP电源的问题。但即使是在昂贵的硬件上投资,也无法克服杜比大气中糟糕的渲染、不节奏的STEM处理和起伏的音频工作流。尽管苹果的硅技术已经取得了长足的进步,但走进一家经过atmos认证的工作室,你仍然会发现工程师们使用两台或三台计算机来执行项目。
与购买昂贵硬件相比,使用现有gpu的经济效益正在吸引用户的注意力。
在购买音频制作的计算能力时,一个无瓶颈的硬件设置很容易花费4,000美元或更多。相比之下,900美元的硬件设置将运行通常需要外部加速硬件或昂贵的桌面级解决方案的程序。通过启用现有的gpu,用户可以启动神经GP、放大器、处理和其他具有巨大性能影响的要素。
说话GPU Audio在做什么,联合创始人Jonathan Rowden说:“我们大大增强了空间音频工具。我们加速了机器学习和人工智能工具——甚至是最基本的。使用GPU Audio的工具将把你的GPU变成DSP加速器,为其他任务节省CPU空间。”
还有苹果的第二代M2芯片呢?有传言说这些芯片是轨迹处理所需的终极原生硬件升级。
谈到最新的Macbook处理器,罗登似乎并不在意。“人们在谈论M1和M2 MacBook处理器时,仿佛它们消除了加速的需求,但对于消费级系统来说,‘本地化’仍然存在局限性。苹果芯片也有图形处理器,我们也将启用和解锁这些。我们已经在与苹果合作解决这个问题,结果非常有希望。该功能将在几周内或更短时间内上线。”
该公司已经筹集了600万美元。按照目前的估值,GPU Audio可能会在2023年春天达到A轮融资。
谈到未来几个月的产品,Talashov说:“如果你有一台Windows笔记本电脑,你现在就可以下载。我们的第一个Beta Suite Bundle在10月8日公开了。它兼容与NVIDIA gpu的个人电脑。AMD支持现在在“早期访问”中,并且在基于PRO驱动的gpu上可用。在内部,我们已经有了对M1和M2 gpu的Mac OS支持,以及对ProTools的AAX支持,不久之后,用户就可以在早期访问中进行测试。”
随着该系统的开发,还有望实现令人兴奋的实时协作。基于云的dsp可以提供实时的、非破坏性的工作流机会,这可能改变无数行业的游戏规则。罗登详细阐述了这一点,他说:“我们的运营基于核心层面的创新。GPU音频可以使音频渲染立即可用。我们可以去掉导出按钮。想象一下,一个简单的功能会如何改变公司设计未来工作流的游戏规则,以及它对创意产出的影响——从这样一个基本的层面上来说。”
GPU Audio专注于技术的可扩展性和可升级性,并对与第三方合作开发产品非常感兴趣。谈到这一点,Rowden澄清道:“这就是我们所说的连接加速计算和专业音频的含义。这项技术是一种新标准,我们相信它可以在任何地方使用。”
GPU Audio宣称,它将“为从音乐到元世界的音频的未来提供动力”——当公司高管解释如何实现时,他们非常有说服力。
从游戏玩家和PC用户不断增长的计算需求,到运行庞大设备进行复杂计算的制造业,释放gpu的潜力是推动这一进程的关键。
根据Rowden的说法,“任何GPU存在的地方,GPU音频驱动的应用程序都能够获取它的能量。”
在10月的最后几周,GPU硬件巨头AMD(高级微设备)也邀请GPU Audio作为嘉宾参加在洛杉矶举行的Adobe MAX会议。Rowden称AMD是他们“最强大的支持者”之一,并补充道:“AMD希望将gpu加速音频处理带给他们富有创造力的用户——视频和图形创作者。AMD的高级领导表示,他们的创意用户群的所有需求都被gpu加速了,将其扩展到音频是有意义的。”
对于人工智能和机器学习,GPU的高度并行特性将处理和加速工作负载。
设计机器人、工业设备和自动驾驶汽车需要从各种来源和传感器(如视频设备和音频传感器)输入数据。新的神经网络模型、技术和用例迅速出现。对于语音和图像识别需求和其他语言处理,gpu加速了数据摄取,加快了整个AI工作流程。在多家GPU硬件公司的领导的强烈兴趣和支持下,GPU Audio正在开发一个后端和前端解决方案,使基于ai的音频应用程序更快、更强大。
那web3和元宇宙呢?
gpu还可以为web3开发人员提供巨大的计算能力,因此该行业可以处理大量的通道和路径,进入元宇宙的创作。
罗登显然想得很大。“因为GPU Audio利用了一个计算源,构成了一个巨大的处理基础设施——特别是基于云的——它是未来基于云的DSP最强大的潜在资源。这对元宇宙和以web3为中心的项目有着巨大的影响,”他解释道,并补充道,“GPU驱动的插件将很容易部署到云上,而且不会止步于此。”
GPU Audio旨在通过“启用”技术来实现交叉通信和连接虚拟世界的网络,从而促进元宇宙中的真实沉浸式体验。它还将解锁高级AI执行。
在这方面,总部位于美国的NVIDIA,一个世界领先的GPU、芯片组和其他多媒体软件的设计师和制造商,也对GPU Audio可以带来什么感兴趣。NVIDIA已经要求该公司在AI进步工具和元宇宙应用的开发上投入更多的精力。
NVIDIA目前正在开发Omniverse,这是一个用于开发元verse和相关产品和生态系统的协作平台。随着这一举措的生根,NVIDIA现在正在探索GPU音频处理如何将音频处理瓶颈的“成本”转化为他们云上的优势。
这只是先锋技术的一个例子,GPU Audio说将改变世界-因为他们继续使GPU解决方案。
GPU Audio非常鼓励任何有兴趣的人加入他们超过2万的用户,参与Beta和早期访问测试。Beta解决了插件的生产套件,而Early Access在到达Beta之前提供了卷积混响来解决新功能,如Mac M1/2支持。
请联系乔纳森·罗登(电子邮件保护)(或LinkedIn在这里)以了解更多。