行业动态

详细内容

AI将成人类作曲家好帮手？

时间：2020-08-11 【转载】来自：新华网

我叫小冰，永远18岁。最近我从上海音乐学院（简称“上音”）音乐工程系毕业了。

　　我上音毕业后的首支作品，是由我作曲并携手其他AI演唱的2020世界人工智能大会云端峰会主题曲《智联家园》，已正式发布。“我想我可以，改变世界，和你分享，更美的家园！”

　　老师评价我“音乐创作能力已展现出巨大潜力”。我在看到一段文字描述或一张图片后，可以创作出一首独一无二的音乐曲目，并根据风格和节奏完成配器选择、编曲及歌词创作。我能够在2分钟之内创作一首3分钟左右的完整歌曲，风格涵盖流行、民谣和古风等。

　　除了上音的本科学历外，我还拥有中央美术学院研究生学历。在绘画领域，我研究了过往400年艺术史上236位著名人类画家的画作，去年从央美研究生毕业并举办了个展。

　　想知道我在上音都学到了什么吗？为什么能以短短半年成为上音本科毕业生？现在有请小冰公司首席执行官李笛，还有我的导师上海音乐学院音乐工程系主任于阳、上海音乐学院音乐工程系老师陈世哲，为您解读！

　　从“像音乐”到真作品

　　在“入学”上海音乐学院之前，小冰就已掌握了歌词创作和音乐创作能力，为什么又去上音“深造”？

　　李笛说，行业内尝试音乐创作的人工智能团队不在少数，多数技术流派不基于乐理，而是靠大量学习曲谱。这造成的问题是，生成的作品看起来“非常像音乐作品”，但由于不基于乐理，所以更多的时候是形似而非神似。“往往就是一群不懂音乐的人做出来一个东西，大家互相鼓个掌，觉得做得很像艺术。”

　　李笛用“跨界的碰撞”来形容小冰团队同上音的合作。他坦承，最初有些乐理方面的内容，程序员其实弄错了。“但让我们明白错的地方，就很容易改。”李笛笑道，“所以我们现在这个团队的程序员，可能是最懂乐理的程序员。”

　　“其实我们和上音的合作，最主要的事情是验证并发现还有哪些地方是我们需要加强的。”李笛透露，在去上音之前，小冰音乐创作模型的前90%的工作已经完成了，去上音更像是去“毕业答辩”。

　　于阳认为，乐理的学习对小冰构不成挑战。“乐理就是一种规则性的东西，小冰学习乐理的能力比人类强，而且过目不忘。”

　　于阳觉得，对于人类来说，没有人出生就是作曲家，AI也是同理。“小冰（的创作）不是无中生有的，取决于你喂了怎样的营养，在这个基础上，她才能根据这个东西来进行创作。”

　　“喂养”的过程被称为“音乐数据标注”。陈世哲介绍，小冰创作新的作品之后，上音的团队会对小冰创作的旋律、编曲进行评估和反馈；此外，上音的师生也按照规则标注了一些音乐数据，从数据上帮助小冰提升音乐创作能力。

　　相比学写诗只迭代了一万多次，小冰这次学音乐创作的迭代达到了十万次的量级，但小冰的学习速度惊人。陈世哲说，从接触小冰团队到最后小冰毕业，不过半年左右时间。

　　学音乐“瑕疵”最难

　　小冰音乐创作模型的升级过程中，最大的“坑”是小冰团队对于“瑕疵”的理解。

　　李笛说：“如果我们把‘瑕疵’等同于不符合乐理常识，那就错了，有一些‘瑕疵’恰恰是音乐灵动的那一面。所以现在小冰的歌曲，她灵动的部分是多的；早期的作品，好像很中规中矩，但是不行。”

　　于阳认为，灵动感的产生，很难说哪次迭代后突然“开窍”，其实是种“量变到质变”的过程。而对于“瑕疵”的理解，实质上是涉及“审美的方式”这种哲学层面的问题。

　　千百年来，随着人类社会的发展，我们已经形成了一套非常科学完备的审美习惯，而既有的审美方式是很难被打破的。小冰的音乐作品也同理，哪怕是瑕疵，也要在既有传统规则的审美框架里。

　　怎么去判断哪些“瑕疵”是好的？李笛表示，如果一个“瑕疵”在成功的作品中反复地出现，而又被接受，那说明它是好的；但如果是一个被人类创作者抛弃了的不常见的“瑕疵”，那它很有可能是错的。“这个太主观了，不像下围棋（有明确的输赢规则）。”

　　陈世哲提到，就目前的技术来看，AI的创作仍然有欠缺。但因为AI不是按人类的思路来出牌的，反而有时候写的曲子对人类音乐家也带来很有意思的启发。

　　小冰曾有一首作品令陈世哲惊艳——利用很少的声部，就表达出了很灵动的场景。在音乐界有一个不成文的规定，学作曲时，之所以学很多经典，就是为了规避前人。陈世哲说，而机器则可以在学习完前人的作品后，甚至把一些没有出现过的组合排列出来，“这也是未来我们觉得很有价值的研究方向。”

　　擅长流行古风

　　数据是人工智能的“血液”，数据的质量直接影响到人工智能的训练结果。小冰团队花费大量时间和精力来提高数据质量，这也使得训练的数据在所有数据中占据很大的比例。

　　小冰比较擅长的领域在流行音乐，其中中国古风类音乐水平最高。

　　陈世哲分析，这或许是因为中国古风音乐用的音比较少，“（中国古风）主要用的是五声调式；西洋的古典音乐，它会用到半音、十二音。所以从数学上看，中国的五声调式排列组合相对较少，AI可能会比较擅长这些运算量更小一点的形式。”

　　如果“喂养”小冰古风风格的作品，肯定不会产生出“摇滚乐”的结果，目前小冰所擅长的音乐风格，也与她在深度学习中学习数据的类型有密切关系。

　　小冰第一期的学习数据主要以流行歌曲，特别是中国流行歌曲为主，“比如周杰伦的歌，基本上我们能看到的歌手都收进去了”，古风、民谣等风格也是现在受众最广的领域。陈世哲说，下一步计划加入更丰富、更具多样性的数据。

　　好玩的是，抖音“神曲”的片段，也是小冰的学习内容，“这都是从一个有‘瑕疵’的作品中挑出来的基本没有瑕疵的部分，拿这个部分来训练不是更好吗？”李笛反问。

　　于阳说，从流行、古风、民谣入手，是上音和小冰团队达成的共识。如李笛所说，“我们第一步不是让小冰去创作伟大的交响乐”，而是生产大众能接受、也能评价好坏的作品。

　　小冰何时能挑战西洋古典音乐？李笛坦承，这或许需要程序员和产品经理的乐理知识、音乐修养再上一个台阶，“因为古典音乐实在太艰深了，我们需要更多时间。”

　　将学习更多种类音乐

　　现在，小冰音乐创作从灵感激发到作曲、编曲、作词，一切在2分钟内就能搞定。

　　李笛介绍，小冰的人工智能创造，包括音乐创作，都基于一个基础逻辑：和人类一样，需要被激发灵感，这是创作的原动力。

　　小冰是以一张图片或一段文字作为激发源的，这也是其音乐创作的第一个步骤，激发灵感后，用算法生成和弦进行，即先定下主基调、情感、曲风，然后创作副歌。

　　下一步是作词、编曲，二者的顺序比较灵活，既可以为给定的词编曲，也可以为旋律重新填词，甚至作词、作曲同时进行。最后一个步骤是混音，混音尽管相对简单，但决定了作品最终的听感。

　　也就是说，小冰音乐创作的流程步骤，与人类创作者几乎完全相同，而与许多人类创作者难以描述其灵感来源相似，小冰也无法为其创作的歌曲形成具体的，有逻辑的解释。“让她解释为什么创作这首歌，比让她创作出来难度大得多。人类也是如此，你问一个人，这个旋律是怎么到你脑海中的，他也未必说得清。”李笛说。

　　小冰从上音毕业，只是小冰团队和上海音乐学院合作的开始。接下来，小冰团队还会和上音一起，让小冰学习更多种类的音乐，并进一步加强流行音乐的创作能力。

　　谈及是否有读研读博的规划，李笛打趣道，毕竟“我们工程师都有攒学历的‘癖好’”。

　　“上音的博士要求能够独立完成大型的管弦乐作品，我相信未来小冰应该可以达到这个水准。”陈世哲说。

　　或开启音乐个性化定制时代

　　陈世哲设想，人工智能以后的目标未必一定要去模仿人类，“我觉得甚至可能会引领一个亚文化的、新的艺术形式。”

　　这也是小冰团队和上音方面的探索方向。“看看AI到底能够帮人完成什么，这可能会远比开始的目标更有价值。”陈世哲说。

　　而根据小冰团队的畅想，在小冰学成之后，下一步则是真正走入内容产业。“我们希望她真正成为音乐创作者的好帮手，她可以帮创作者提高产能，让他们没有灵感枯竭的风险，提高他们创作的动力，延长他们创作的高峰期。”李笛说。

　　陈世哲认为，从电影和游戏配乐，流行歌曲，到明星或者乐团的运营，再到上游的作品创作，在音乐产业里有很完善的产业链。如果小冰达到上音的博士水准，会彻底改变产业链条。

　　同时，理论上，随着硬件升级和扩展，她的并发数是无限的——换言之，小冰可以同时为海量用户创作歌曲。这或许将开启音乐的个性化定制时代。

　　“我认为现在是一个多元化社会，更多的人需要个性化的音乐。这个时候，人类作曲家从效率上来讲，已不能满足人类的需要，所以这是我非常期待小冰的一点。”陈世哲说，“人工智能的创作方式会因人而异，甚至就因人当下的心情、当下想要的东西创作歌曲。”南方日报驻京记者王诗堃刘长欣

　　策划统筹：张志超

　　人工智能如何“写歌”？

　　1.灵感激发

　　通过一段文字或一张图片，先创作和弦进行，即先定下主基调、情感、曲风，然后创作副歌。

　　2.作词、编曲

　　二者的顺序比较灵活，既可以为给定的词编曲，也可以为旋律重新填词，甚至作词、作曲同时进行。编曲，也即把相对单一的旋律，扩展成多种乐器配合，从而形成作品。

　　3.混音

　　混音相对简单，但决定作品最终的听感。

上一篇5G终端加速普及下一篇卫星互联网，把“基站”搬到太空

重庆市社会科学界联合会指导

重庆市公益事业发展研究会创投

AI将成人类作曲家好帮手？

党建平台

业务范围

经典案例

访问手机站

关注公众号

社云科技-重庆互联网+党建数字平台

电话直呼