GoogleのAI音楽生成ツール「MusicLM」は、テキストから曲や音を作ることができます。
上記の動画は誰かがGoogleの発表した音声を抜粋してアップしたものですが、「MusicLM」が作曲したメロディックテクノのトラックです。
現段階では楽曲は必ずしも創意工夫や音楽的なまとまりがあるわけではありませんが、驚くほど人間のアーティストが作曲したような音になっており、AIによる音楽制作の新時代が到来したと言えそうです。
イントロやAメロ、ブレイク、サビなどの起伏ある表現が行われていることが驚きです。
人間が初心者からこのレベルの作品を作れるようになるには、かなり集中的に取り組んだとしても最低数年はかかるでしょう。
AIによる音楽生成は過去にも、音楽を視覚化して作曲する「Riffusion」をはじめ、「Dance Diffusion」、「AudioML」、OpenAIの「Jukebox」など、多くの試みがなされていました。
しかし、技術的な限界や学習データが限られているため、複雑な構成の曲や忠実度の高い曲を作ることは今まで出来ていませんでした。
「MusicLM」は複雑な構成の曲を作れるようになったおそらく最初の製品です。
この印象的な新しいAIシステムは、テキストで内容を記述することで、どんなジャンルの音楽でも生成できますが、Googleは様々なリスクを恐れて、すぐにリリースする予定はないようです。
学術論文によると、MusicLMは28万時間に及ぶ音楽のデータセットで学習し、例えば「記憶に残るサックスソロとソロシンガーによる魅惑的なジャズソング」、「低いベースと強いキックによる90年代のベルリンテクノ」などのように一貫した曲を生成するよう設計されました。
技術的にはまだ初期段階ですが、今後より良く、より正確に、そして熾烈な競争になっていくことが予想されます。