“不开心就Suno给你写歌曲吧。”近期,AI音乐生成类工具Suno发布最新版本,凭借完成着低收费、速度快、歌曲度高的强大功能,被网友誉为音乐界的ChatGPT,甚至一些词曲创作者开始担心,自己要失业了。这是国外AI公司Suno研发的一款文本音乐生成工具,目前推出的是让V3版本,用户普遍输入几句歌词或者歌名,并自选音乐风格,顺便在一分钟内得到两首时长在两分钟内的歌曲。Suno支持中文内部的多种语言输入,且免费向用户开放。近两年,在文生图、文生视频领域分别诞生了Midjourney、Sora等效果炸裂的应用。在AI生成音乐领域,类似的工具也一样,比如国内有网易的网易天音、腾讯的TME Studio,以及灵动音科技(创始团队来自清华大学)的BGM猫等。国外更不用说,比如谷歌的Magenta Studio,以及号称不会复制任何歌曲、生成自由曲子的声音等。但这些都没有引起大范围的关注,直到Suno的出现。此刻,圈外用户用Suno创作各种搞笑歌曲,过了一个音乐人的瘾,圈内从业者也将自己写的词放上去,尝试一探自己和AI作曲的高低,结果被高度完成震撼。很多人觉得,Suno带来的随着Suno的火热,后续团队的相关信息也出现在公众视野中,这家位于麻省剑桥的公司,目前共有12名员工,四位创始人曾来自同一家公司,为机器学习专家,其中有一些音乐或观点。与市场上物流AI音乐生成类工具相比,Suno究竟强在哪一幕?会颠覆其音乐圈吗?
01 “傻瓜式”操作,一分钟生成两首歌曲业余音乐爱好者科科在社交平台上偶然刷到了Suno的相关内容,让其小白用户在一分钟内完成歌曲创作的强大功能,让他忍不住尝试一把。在随机输入一串没有任何逻辑性的数字加字母后,不到半分钟,科科便拿到了了曲子。“这么拗口的歌词配上旋律居然十分流畅”,他感到十分意外。其一键成曲的低收入让网友们玩嗨了。有人让Suno歌曲正经地唱谱,还有人将自己打工的心酸经历进去,生成歌曲发到网上。明显网友表示,自己被Suno创作的曲子笑到肚子痛。
图源/ Suno官网Suno为什么火了?它到底强在哪?首先受益于它的低收益,让普通用户找到了自己写歌的快乐。网友表示,自己被Suno的“省事”吸引。用Suno创作一首歌,只需简单四步。登录官网注册、点击它创作、输入文字、点击创作按钮,得到两首歌曲相同但旋律不同的歌曲。从打开软件到生成歌曲,全程不到一分钟。如果用户不会作词或者懒得作词,也有解决办法,用户只要用选择想要的生成曲风,就能自动。Suno还十分智能,比如它支持歌曲进一步优化。如果觉得用户生成的一首歌曲不错,但还想再精进进一步,只需要点击“生成类似”选项,类似于妙鸭相机的“我想补充我一点”按钮,几组后便又可以得到一个作品。类似于Suno支持用户每天免费使用5次,从而生成十个,但不允许。不过目前,根据官网显示,用户首先注册可以获得20个积分,且第二天不会再赠,而每次生成一个,会消耗5个积分,大约只能免费玩2次。如果想多玩几次或者一次,也有,交钱即可。选择界面上的会员充值按钮,有68元-498元不等的4种套餐可选,价格如此,获得的创作次数越多。比如68元对应136首歌曲,498元封面1328首。官网标注,这普通的惊讶用户对Suno的一键生成速度和操作的低门槛,而部分圈内人士更关注其专业度,甚至产生了危机感。音乐制作人樊宇镈用了好几个“非常”形容自己的惊讶程度。他告诉“定焦”,如果AI音乐类工具是小学生水平,那Suno至少是上初中了。在Suno之前,他尝试过用很多AI工具写歌,但用他的的话,费半天劲训练AI,结果生成的更多是伴奏模型,或者是聚焦到舞台,比如辅助作词、自动编曲、生成人声、制作专辑封面等。总体算下来,自己用AI时投入的时间和精力,并且不使用差不了太多。不过这个时候Suno已经能做到自动生成歌词+选择谱曲风格+人声演唱,“发展到可以自动写独唱的程度了。” ”而且他还发现,其创作的曲子还有和声,“大量初级音乐制作人都做到了这种程度,秒杀了那些在淘宝定价800元的初级编曲。”和「定焦」的交流过程中,多位专业人士认为,Suno生成的歌曲有的能力达到一定程度,即在不涉及版权风险的情况下,直接对外出售。爱梦科技CEO雷鸣把一位新生代歌手的词放到Suno里一键曲上,听完后他觉得,AI创作的歌曲反而更接近行业标准。“做出来的歌曲质量非常好,有的甚至能达到唱片级别。”音乐从业者小杰也告诉「定焦」,自己和身边的音乐人朋友都在感叹Suno的强烈,“本就吃不饱饭音乐圈又宣布了一个波雪上加霜。”
02 Suno虽然不错,但必要神化虽然AI生成类的音乐工具很引人注目,但一些圈内人士觉得,之前的工具在作曲质量上存在明显问题,操作上也不够便捷,所以更多的是“狼来了”的故事,直到Suno V3版本的出现,刷新了他们的认知。拥有十年大厂的Smashing经验,同时也密切关注AI的佐罗告诉「定焦」,他觉得Suno带来的影响可能和Sora差不多,是音乐、影视领域创作的一次重大突破,而且其已经正在进入公开免费使用阶段。据了解, Suno背后主要由自研的两大模型支撑,分别是基于变压器的Bark语音模型和Chirp音乐模型,首先主要用来生成人声,晚上提供音乐旋律和音效。两者让Suno生成的音乐旋律更加形象化、复杂化,这也是这家公司司的核心技术。不过,Suno也不完美,它在时长、语言理解力,以及音乐分轨等方面都有问题。首先,目前Suno生成的曲子不到两分钟,无论是普通用户还是专业音乐制作人,都感知到很多作品往往明显止然而这直接影响了听觉效果相反, Suno虽然支持多国语言创作,但其最懂的还是英文,在理解中文歌词及音乐风格上,存在明显偏差。樊宇镈间隔使用十几次后发现,在生成电子、R&B、摇滚等风格音乐时,Suno能处理得很好,但华语流行风格不太行。 「定焦」在尝试用Suno创作时,风格上选择“民谣”,其创作出来的两首曲风都包含二次元。他还遇到过主副歌不分的情况,将自己创作的中文歌词输入进去,把主副词做了明显的标注区分,但Suno依然把副歌的最后一首唱到了主歌上。 Suno创作出的作品不支持调整分轨,专业人士没有办法对生成的歌曲进行调整,这也是目前困扰Suno商业化的最大难点。雷鸣表示,虽然目前Suno生成的音乐能轻松达到广告乐、影视配音标准,但如果客户听完以后,还想修改一些细节,Suno就办不到了,只能随机生成另一个首曲子。樊宇镈觉得,在这一点上,网易的AI音乐工具——网易天音就友好比较,支持导出音轨。不过,相比Suno,网易天音生成的曲子还比较初级,且需要音乐人认证。
图源/网易天音官网AI崩溃Cyrus则提出,目前AI生成音乐音频增益不够高,这也让其很难改编。即使Suno能导出来,曲子的高频和低频都会损失比较严重,承认杂音、噪音等。所以目前Suno更多的是用来娱乐的。Cyrus看来,文生图和视频的核心将会在于如何更完美地模拟物理世界,而音乐最重要的是,如何人的情绪。但Suno的歌曲还原旋律比较,使用的乐器也不够丰富,且生成的音乐时长还不够,这些都阻碍了想要的情感传递。解决这些问题,需要数据、时间和一定的技术突破。人工智能在读博士、参与相关大模型研究的牛小博从技术端解释,目前Suno的底层技术还是大模型利用的扩散、变压器的底层架构,但在多模态上有所突破,比如文字(含歌词)、声音(人声、曲子)、图像(能生成封面,但很简单)的多模态。而其生成的歌曲只需不到两分钟,很有可能是算力不够。业内人士也告诉「定焦」,“目前AI生成音乐的一大技术难点是,大模型难以在复杂学习音乐乐理的同时,理解、模拟词曲情感,如果要复制特定风格、歌手的表达方式,那会更加复杂,这需要大量数据和算力。” Cyrus觉得,Suno取得了突破,但在技术层面并不是革命性的创新。“Suno代表的AI生成音乐,可控度和复杂度远不及文生图,还有漫长的一段路要走。”牛小博表示。
03 Suno会抢谁的饭碗?目前,Suno以及AI速度生成音乐工具被热议,不过普及似乎不如想象中那么快。「定焦」询问了几家国内音乐厂牌,以及熟悉的大众歌手团队,大多数人表示,此类工具不会影响到他们的日常创作,甚至还有一部分人没有听说过Suno。这主要有两方面原因。一是音乐人或者公司使用 AI的主要目的是提高效率,但之前从业者需要反复调教AI,才能达到使用效果,调教AI的时间及其单独创作所耗费的时间大约。而且,当音乐人自身爆发灵感时,速度往往更快。更主要的原因是,目前AI生成的音乐还不能满足用户/客户想要的个性化歌曲的需求。获取优质数据和相关版权。版权问题主要靠平台的努力,优质数据则考验运营能力。如果越来越多的优秀音乐人能在Suno平台上持续出现量化的音乐数据,AI便可能有量化更量化、有灵魂的歌曲。但是,Su没有所代表的AI生成类音乐工具,其更新迭代速度,已经让很多从业者感到恐慌。去年4月推出文本转音频模型Bark,7月在音频生成模型上增加人声音乐,12月用户在网页上使用,再到现在推出Suno V3版本,这家成立不到两年的公司,在不到一年期限,实现了AI音乐专家口中需要数年才能完成的突破。有网友将Suno升级的三个版本对比发现,其修复自身BUG的也非常快。输入相同的一段歌词,V1版本的古风爆改成流行,V2就变成了很明显的古风,比如在开头加入古筝弹奏,而V3的人声旋律和标准化程度非常高。如果今后Suno再迭代,加上大量数据训练,取代一些工作岗位不太可能。
图源/Suno官网短期内,很快就会对两类人产生影响。一类是普通用户。 Suno联合创始人Shulman曾表示,他们的目的是,降低用户创作音乐的工资,让每个普通用户都能成为创作者,Suno不想取代艺术家。而从目前的用户反馈来看,这个工具已经让很多音乐小白体验到了不懂乐理可以写一首歌的快乐。另一类就是批量写歌的公司。在交流中,大家都认同,Suno无法取代乐队这种需要团队合作的音乐种类,也不会影响知名音乐人的饭碗。“不过将替代掉95%以上没有那么厉害的从业者,”雷鸣表示,那些不追求独特性,喜欢批量写歌的公司和把音乐当伴奏的领域,将迅速被AI取代,比如广告配乐、环境音乐、影视配音,甚至一些同质化的网络歌手和短视频神曲。Cyrus也觉得Suno对编曲、混音要求不高,尤其是那样的几首口水歌打击很大。而对熟手来说,比如作曲、作词、编曲混音从业者,可能会带来利好,毕竟这些工作可以一个人完成了。据了解,国外,国内已经有公司接收了AI大规模作曲的需求,且专业也将AI应用到了《芭比》和《奥本海默》等影视音乐中。目前还没有将AI音乐大规模投入到中的情况,不过从业者已经开始尝试。需要注意的是,除了技术,AI所带来的版权问题,也影响Suno以及AI作曲未来发展的相关产业。 “音乐界抵抗AI作曲”、“部分歌手被怀疑借助AI作曲引发网友不满”、“音乐公司要求AI使用自家歌手声音时得到授权”……自从AI作曲出现后,这些声音就没有断过。佐罗从其他分析来看,Suno也给行业带来了一些良性影响。“像影视剧、短视频等的BGM不会有太多冲突版权了,毕竟以后用户都可以用AI生成符合特定场景的音乐。”现在,Suno公司已经宣布Suno V4 正在开发中,并将推出一些令人兴奋的新功能。此时,AI 和人类又将开启新的浪潮。
邮件:siyushenqi@gmail.com
工作时间:周一至周五,9:30-18:30,节假日休息