Suno AI是AI生成音乐领域的最新现象级应用。它可以帮助用户轻松创作出各种风格的音乐作品。
Suno在最初discord提供服务,2023年12月中旬,Suno与微软推出的Copilot达成合作,从而从Discord服务器转向更强大的网络应用程序,从而走向更加流畅的应用市场。
作为一款文本生成音乐工具,它的目标是实现声音创作的“普及化”,让普通人也能轻松地像使用手机拍摄那样轻松的创作和编辑歌曲。不需要任何乐理知识和乐器经验,不需要复杂的流程和工具,只需要想象力,就可以让自己的想法具象化为美妙的音乐。
Suno认为,它的社交分享功能使新型网红达人更容易出现,从而革新音乐产业,就像TikTok喜剧演员革新单口喜剧一样。
Suno引领AI生成音乐
在生成式人工智能应用到图片、视频领域后,音乐创作领域也成为了下一个热门。名为Suno的AI音乐应用引发了人们的关注,因为它能够仅通过文本输入生成高质量的原创歌曲、乐器声和人声。该人工智能可以单独提取歌词、引语或任何文本,让其创作成为各种流派的音乐作品。
各大型科技公司也在测试生成式人工智能音乐工具,例如Meta推出的开源的AudioCraft,它也可以根据文本提示生成歌曲,以及谷歌的YouTube工具,它可以根据哼唱的歌曲或提示文本生成原创音乐曲目。
除了Suno之外,许多提供类似工具的人工智能音乐公司也已进入该领域,例如Soundful、Magenta、Beatbox(可以生成节拍和器乐曲目)、Soundraw、Loudly、Boomy、Beatoven.ai等。
生成式人工智能对音乐行业具有变革潜力,可以作为创造力和创新的催化剂,正在彻底改变音乐,而不同平台凭借其独特的功能与特点,也满足不同受众的需求。
例如,Aiva 自 201 6 年开始运营,目标客户旨在为不同媒体制作配乐、实现定制化和多功能性的个人和企业;Beatbot 独特的地方用途使用文本提示生成短歌曲,重点在于让用户成为音乐创作的一部分,特别是在嘻哈和说唱流派中。
根据semrush网站数据,去年12月Suno.AI网站访问量达到1412万,远远超过其竞争对手Soundful的88.5万和Aiva.ai的53.2万。
Suno 兼联合创始人 Mikey Shulman 认为,虽然人们以特定艺术家的风格创作新歌曲可能“非常酷且非常有趣”,但 Suno 认为从长期来看,这种体验不会为消费者带来乐趣。“我们希望每个人都能体验到制作音乐的乐趣,”他说。
“大多数人不会演奏乐器,也不懂复杂的软件,另外,这些一直是创作优秀音乐的障碍。声乐也是其中一个非常重要的组成部分,也是 Suno 的与众不同之处之一。”
文本原创生成歌曲
Suno在印地语中的意思是“听”,是一家于 2022年成立的人工智能音乐公司,团队成员包括音乐家和人工智能专家,总部位于马萨诸塞州剑桥。
Shulman 和他的三位联合创始人 Georg Kucsko、Martin Camacho 和 Keenan Freyberg 已经在这个应用程序上投入了大约 18 个月的时间。
其中创始人Shulman毕业于美国哥伦比亚大学,博士毕业于哈佛大学物理学,研究领域为应用物理学和量子计算。
这四人之前曾在金融数据人工智能科技四分之一公司 Kensho 工作,该公司目前已被标普全球收购。Shulman 表示,这个由 10 人组成的团队正在积极招募人员,并且“资金充足”。
Suno能够仅通过文本输入生成40-80秒的质量完整原创歌曲、乐器伴奏和人声。与许多人工智能音乐应用程序不同,Suno专注于用原创人声创作原创曲调,而不是克隆或修改流行艺术家的声音或歌曲。其人工智能可以单独歌词提取、某些词、甚至是不通顺的话语或任何文本,把其创作成各种流派的音乐作品,这在文本转音乐堪称革命性突破。它包含两个主要的音乐生成模型:熟练的歌唱和抒情表演的Bark和专注于创作器乐伴奏曲目的Chirp。
这两个模型都利用相同的底层深度学习架构,该架构经过海量音乐数据集来训练捕捉人声、旋律、节奏等背后的模式,使AI创作出与歌词的节奏和结构相匹配的原创曲调,形成类似人类的歌唱和音乐风格。
虽然Suno人工智能生成音乐的音质尚未达到专业录音标准,仍然可以听到一些微弱的浑浊声和机器人音,但它仍然比之前的AI录制和作曲的质量要高很多。音轨响声地捕捉歌词并一直保持不走调,节奏和强弱变化非常自然。相关人士表示,Suno AI的音频真度保度可能会在几年内达到商业级。
另外,Suno AI 使用界面简洁,操作方便,大大简化了歌曲制作过程,对用户非常友好。用户可以通过该公司的 Discord 服务器访问 AI ,使用 /chirp 命令开始。你只需输入歌词或任何提示文本,人工智能就会围绕它生成原创歌曲作品,通常只需要 1-2 分钟。如果用户不知道想要制作的歌曲歌词,还可以使用集成的 ChatGPT人工智能会生成单独的声乐和乐器曲目,把它们组合成最终的歌曲。器乐曲目来自不同的声音和流派,其复杂性由提供的文本量控制决定。
在2023年12月中旬,Suno与微软推出的Copilot达成合作,启动从Discord服务器转向更强大的网络应用程序。只需输入简单的文字描述,Copilot就自动可以生成包含器乐、歌词和演唱的歌曲片段。
目前,Suno提供的免费版本,没有任何需要付费才能解锁的功能,不过每天能创作的音乐数量是有限制的。对于该应用程序的免费版本,每天最多有5次输入文本提示(产生10首歌曲),而每次创作都能产生2首独立的曲目机会。因此,如果第一首听起来不太好,创作者有第二次机会。
该产品的付费模式下,每月花费10美元,用户可以生成多达500首歌曲。每月花费30美元,用户可以生成多达2000首歌曲。Suno还提供年度订阅折扣。
AI生成音乐面临的挑战
AI生成音乐目前面临的最大挑战一个是技术方面的,一个是法律和道德方面的。
首先,与AI生成文字和图像相比,AI生成音乐在技术层面上更为复杂,这也使得AI生成音乐挑战更大。
图像生成涉及的是单一的想法或概念,而音乐生成涉及到的元素更多,包括节奏、节奏、和声音,同时乐曲会在时间上进行延伸。而对比音乐生成和文本生成,文本生成只需对比句子单词中的上下文,对于音乐来说,这要复杂化,因为必须考虑复调、其他乐器以及声音,这是更难解决的问题。
AI生成音乐的难点让人们评价会更加严格。一个乐句中如果有一个音符错误、一个拍子错乱、一个音调不合节奏,听起来是无法忍受的。
其次,人工智能技术虽然一路狂飙,但围绕人工智能合成音乐的许多道德和法律问题尚未得到解决。
音乐行业经常完成一个知识产权问题的最前沿,包括有关采样和合理使用的问题,以及如何对涉及原歌曲创作者的曲目进行补偿和表演出处。此外,AI生成音乐可以复制艺术家的声音和风格,“表演”他们从未真正演唱过的作品。
2023年4月,一首由人工智能生成的歌曲《Heart on My Sleeve》一夜成名,曲中人声听起来非常像加拿大说唱歌手Drake,随后该曲目被所有流媒体平台下架。Drake的唱片公司表示,使用受版权保护的音乐数据训练出了人工智能侵犯了的权利。环球音乐集团也在部分媒体中声明,“使用我们旗下艺术家的音乐来生成人工智能既违反了我们的协议,也违反了版权法”。
关于广受争议的版权问题,AI音乐平台大声购买底层所有其用于AI的音乐版权,确保不会出现版权纠纷或艺术家原创作品被窃听的问题。
Suno表示希望以合法且合乎道德的方式制作音乐,只允许用户并使用流派和乐团而不是特定的艺术家名字作为提示词。
这样区块链等约定的技术本身也被寄予厚望。另外,解决人工智能生成音乐的版权问题的另一种可能方法是通过许可协议。例如,人工智能工具的开发者可以与版权所有者和音乐发行商签订许可协议。日前,而谷歌和环球音乐集团正在就人工智能项目和语音克隆的许可协议进行谈判。
邮件:siyushenqi@gmail.com
工作时间:周一至周五,9:30-18:30,节假日休息