美东时间周三,meta发布了一款开源人工智能(AI)工具AudioCraft,通过AudioCraft,用户就根据文本提示创作音乐和音频。
meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。简单的理解为,就是根据文本内容生成AIGC,只是meta更侧重于智能语音方向。
这项技术本身并不是新技术,百度较早的时候就已经开始应用。但从目前的实际情况来看,还存在不少问题,比如根据文本生成语音时,还是比较明显的机器感,缺乏人的那种交流表达的情感与语调。
从音乐方向切入,对于meta而言,是最符合平台娱乐属性,也能增加用户的使用粘性。对于娱乐社交来说,好玩是核心。
而借助于文本能给自己的文字生成音乐或者音频,会增加娱乐趣味性,并且还能让一些可能唱的并不自信的人,也可以为自己生成唱歌的音频进行分享。同时,meta还可以借机省下一大笔音乐版权费。
不过meta这项技术的推出,将会带来两个方面的挑战。
一个方面是对音乐行业,包括音乐版权的挑战,当AI拥有了作曲与声音生成能力之后,对于本身就走快餐文化的流行音乐行业将带来冲击;