相关推荐
AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定
2024-11-10 23:59

衡宇 发自 凹非寺

AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定

量子位 | 公众号 QbitAI

小美、小帅、丧彪和佛波勒,这几位AI配音的主角,已经成为某音某手用户心里比“李华”还要亲的朋友们了。

然鹅,配音显然已经满足不了AIGC“大放异彩”之心,它对短视频赛道的入侵再加一:

生成式AI,开始拍视频!

还是带画外音的那种。

这个技术来自一个名为QuickVid的新网站,它把好几个生成式AI组合成了一个工具。

创建的短视频适配YouTube、 Instagram、 TikTok和Snapchat等。、

哇哦,Unbelievable~

QuickVid,明星AI产品杂烩

QuickVid,是个刚出生7天(去年12月27日推出)的小baby网站。

年纪虽小,但不妨碍它一展身手。让我们看看这个网站要怎么玩儿:

首先,用户需要输入一个提示词或一小句提示语,用来描述想要创建的视频的主题。

比如本文开头的视频,就由短短的两个提示单词“Machine Learning”生成。

这个功能,依托的是GPT-3的文本生成能力。

接着,根据这些提示,QuickVid会从免版税的媒体储备库Pexels中选择一个背景视频,并使用DALL-E2生成覆盖图像。

然后,QuickVid会通过Google Cloud的文本到语音API输出画外音。

这一步可以选择克隆用户自己的声音。

因为创始人了解到,好多创作者对自己制作的AI配音视频提不起多高的兴趣,毕竟视频配音没有用自己的声音。

最后一步非常简单,就是把上述元素合并。

当当当当!一个AI生成的短视频就诞生了。

GPT-3、DALLE-2……总而言之,QuickVid像是一道现有AI产品的明星杂烩。

并且,利用重复的、模版化的B-roll短视频格式,还避免了必须自己生成视频这一关。

值得关注的一点是,因为允许Copilot在GitHub的公共仓库上“偷代码”,微软、GitHub和OpenAI正因被指控违反版权法而接受集体诉讼。

这个案子对DALL-E2这类的AI产品有着深远的影响,因为人们发现AI可以从训练集中“抄袭”。

不过QuickVid并不太担心,他的创始人Daniel Habib大胆放话:

如果明天出现一起让OpenAI消失的诉讼,我们也不怕。

因为我们有好几种替代方案可以为QuickVid提供AI生产力呢~

这里提到的替代方案,是类似于DALL-E2的开源系统Stable Disusion,QuickVid已经在用它测试生成头像图片了。

Habib曾是meta的员工,负责Facebook Live和视频基础设施的开发,他用几周的时间搞出了QuickVid。

根据一些媒体的实测,QuickVid生成的视频质量好坏参半。

生成的背景视频内容往往十分随机,有的和提示词只能有拐十八道弯的一丢丢联系。

不过也不算稀奇,因为QuickVids目前背靠的仅限于Pexels,而且DALL-E2生成的图像本身也有文本混乱和比例失调的局限性。

官方针对这一点给出的回应是,“我们每天都在修补bug哟”!

现在的QuickVid功能还比较简单,但已经足以凑出一个带有信息量的YouTube或TikTok短视频了。

△推特用户用QuickVid生成短视频

这个月,QuickVid会维护更新一些个性化功能。

摆在QuickVid们面前的几道坎

Habib在回复TechCrunch电子邮件时,将QuickVid称为为创作者提供快捷制作高质量内容的工具。

“(目的是)帮助创作者增加内容输出,减少过度劳累的风险。”

创作者生产短视频时的工作量是减少了,但用户和审查者的工作量蹭得往上涨。

大量内容的一键生成,让目前质量还不高的视频内容,连字带影像,有瞬间挤满整个视频网站的能力。

没错,像QuickVid这样的工具,可能会让已经拥挤的短视频网站和APP充斥着没啥营养的信息,以及重复内容。

回答相关问题时,Habib把相关责任归在平台身上。

他认为,是视频平台的算法而不是QuickVid来决定这些视频会不会被推荐、是否会被放在首屏。

“如果人们不想看你的视频,那么你在YouTube这类平台发了视频也传播不开。”他补充道,“不管你是不是使用QuickVid生成的视频,但凡内容质量太低,人们就会抛弃你的频道。”

当然,站在QuickVid面前的难题显然不止这一个,它面临诸多问题考验。

比如有创作者的潜在抵制。

不管是因为成本问题(QuickVid的包月费用是10美元/月),还是因为会面临与AIGC抢饭碗的窘境,对自己内容质量更为看重的创作者们,有的会选择不使用这类工具。

再比如版权问题。

根据Habib的说法,QuickVid用户们可以将自己生成的视频商用,但是AIGC的版权问题本就处于暧昧不明的阶段。

就前几天的事儿,美国专利和商标局(USPTO)撤销了对AI漫画的版权保护,称要获得版权保护需要人工授权。

不过,Habib觉得USPTO的这一行为跟QuickVid没啥直接关系,因为那只涉及AI产品的“可专利性”,而不涉及创造者使用和商业化其内容的权利。

创作者关心的是放出高质量的内容,帮助频道涨粉。

除了法律问题,摆在QuickVid面前的还有内容审查这个大工程。

虽然OpenAI已经利用过滤器来防止偏激内容和歪曲事实的内容生成,但bug依旧存在。

GPT-3时不时仍会提供错误信息,尤其是近期发生事件,因为近段时间的信息还没进入它的知识库。

这对ChatGPT来说也一样,而且后者已经被证明会被“套出”性别歧视和种族主义相关内容。

当Techcrunch进行测试时,QuickVId在“批判性种族理论教育学生”这个提示下,生成了一个视频,其内容暗含观点,认为批判性种族理论可以用来给学生洗脑。

对此,QuickVid主要依赖的还是OpenAI的过滤器来避免错事儿发生。

同时还动员每一个使用QuickVid的用户,宣称大伙儿有义务手动审查每一个由QuickVid创建的视频,以确保“一切都在法律的范围之内。”

One More Thing

不过有个值得令QuickVid们小兴奋的消息,那就是谷歌并没有区别对待人写文本和AI文本。

不过谷歌还是对那些“旨在操纵搜索排名而不是帮助用户”的内容采取裁制,因为这些内容“没有足够的价值”。

这就让QuickVid们需要小心了,因为纯自动化流程生成的内容,很容易就被归到“没啥价值”那一类。

不过说到底,如Habib所说的那样,生成式AI革命是不可阻挡的。

如果AI生成短视频开始大规模流行,各类平台不会也不敢拿它怎么样——至少不会全面禁止它。

你会因为有了这样便利的工具,成为短视频平台的创作者吗?

也许今晚打开短视频App刷到的第一个推荐就是你的(手动狗头)。

直达链接:https://www.quickvid.ai/

(由于涌入人数过多,现在注册需要排队了,我恨)

科技前沿进展日日相见 ~

原标题:《AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定》

    以上就是本篇文章【AI渗透短视频赛道:只需一个提示词,文本影像画外音一键搞定】的全部内容了,欢迎阅览 ! 文章地址:http://tiush.xhstdz.com/quote/73937.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://tiush.xhstdz.com/mobile/ , 查看更多   
发表评论
0评