小泥人解读百度研究院的黑科技:十分钟内文章变视频的AI神器面世
近日,百度研究院推出一项黑科技:十分钟内文章变视频的AI神器面世。这个消息瞬间轰动了整个业界,尤其是新闻工作者和媒体人,更是奔走相告。这个AI神器的面世表明,只要有一篇现成的图文链接,AI神器就可以根据图文描述的主题,重新组织语言,自动搜寻素材,剪出一条短视频。
换句话说,如果看到有意思的新闻却懒得读文章,那就把你在读的这篇文章的地址输入给AI,文章就自动变成了短视频。而且,这个过程只需要几分钟的时间,完全无人化自动操作,你下楼买了杯咖啡,视频就自动做好了。
这个“AI做视频”技术来自百度研究院,产品的名字,叫做VidPress。你看,它可以自己做一条视频,来报道自己的出生:
看起来就像正常的电视新闻一样。这下,视频编辑们再也不用为了搜素材、改脚本、加特效、渲染导出而加班熬夜了。
1、文章变视频的AI
本质上,VidPress是做的事情是“图文转视频”,把人类写好的图文稿件重新编辑成视频,可以参考一下上面视频内容的原文:
比较之下,你会发现视频和文章的文案部分都是类似的,但视频中用到的素材却远不止文章中这么少,增加了许多人物和场景的动态镜头,而且相当契合主题。那一定是用语音合成做了配音部分,然后视频编辑随手搜了几个视频素材放上去了咯?
并不是。整个视频都是AI生成的,视频编辑只需要给出一篇文章的链接,过几分钟,热腾腾的视频就出锅了,不信往下看。
2、文章自动生成视频,只需有文章地址链接
用VidPress来做视频,不需要视频编辑有任何技术背景,会复制粘贴就行。
首先,把需要改成视频的文章地址复制,粘贴到VidPress。
然后,选择用哪个声音合成,确定所需视频的长度以及分辨率。
现在,视频编辑就可以放手让AI开始工作了。
获得图文内容后,AI会借助NLP模型进行语义理解,用主题模型聚合相关新闻和素材。
之后,需要分别完成音频和图像的编辑工作。
音频方面,系统会用多种语言模型处理解析原文,生成解说词,之后借助语音合成技术变成音频。
而图像方面,原文中的图片肯定是不太够的,需要再搜寻更多视频和图片素材。素材的来源可以是视频编辑自己的素材库,也可以直接实时的用百度搜索来找素材。
找到素材后,需要借助人脸识别、物体识别、OCR、视频内容理解等技术来解析理解视频素材的内容,自动剪切选取合适的片段。
有了视频素材和解说词音频文件,需要把两者合二为一。在这个任务上,百度自研了两代对齐算法,第一代对齐算法是基于段落的对齐,第二代则是基于锚点的时间轴对齐算法。
第二代对齐的算法首先需要找出解说词里观众的兴趣点,然后再将搜到的素材和这些兴趣点,进行相关度打分,综合考虑素材的来源、相似度、图片/视频内容的贴合度、内容质量等方面。
之后,得分高的素材就率先被翻牌子,放到视频时间轴里兴趣点的位置。而剩下的素材就会被填充到空隙里,最后再对整个时间轴的内容分布进行调整。现在,AI就把视频做好了,渲染一下,就是一个完整的视频。
这个过程只花费几分钟后。当编辑再次切回VidPress页面,视频已经自动生成好了,还自动配好了字幕。之后,编辑也可以人工修改。如果觉得某一部分的文案不够好,可以替换编辑成所需的文案重新导出视频。
3、速度快,用时短:10分钟内完成
诚然,VidPress目前还无法完成真人视频博主那样专门策划拍摄的短视频作品,但是如果用来做新闻简讯类视频,那VidPress的水平已经足够实现商业应用了,除了没有真人播音员,做出来视频的样子和以前的电视新闻节目十分类似。
但是它胜在速度太快,生成一条视频可能只要十几分钟,而其中一半的时间都是AI在自动工作,人类视频编辑只要粘贴链接,设置好声音时间分辨率就行了,再也不用苦苦守在电脑前剪视频了。
可以说,用这种方式来工作,做视频的时间比往各个平台发视频的时间都短,以前一小时的工作,可能现在10分钟内就能完成,再也不用加班熬夜,短视频编辑们要笑着迎接955了。
有了这样的剪辑效率,当瓜来了的时候,别的编辑还在哼哧哼哧找素材剪视频,用VidPress的编辑已经做好了视频,发给了吃瓜群众,还没等撤热搜就可以收获10W+,美滋滋。
目前,VidPress生成一个2分钟左右的720p视频, 所需时间的中位数仅为2.5分钟。而在百度好看视频内部,整个平台每天可以生产500到1000条视频,而且这些视频所围绕的新闻热点都是系统自动发现、自动生成的。只要服务器在跑,即使躺在家里,平台上就会有源源不断的视频出现,并自动分发给观众。
如此高的生产效率,简直是短视频领域的一记惊雷。
如今短视频火得一塌糊涂,正处红利期,无论是腾讯、头条还是百度自己,都在争相自研或投资短视频平台,这类工具一旦开放,会是大大小小创作者、MCN们争抢市场的巨大机遇,AI制造的短视频,会像当年的中国制造一样,涌入各个视频平台,成为新的一波流量收割机。
毕竟,图文内容的生产成本,可比视频内容低得多,只要写好文章,分分钟就会有配套的视频出来,同一份辛勤,收获多几倍的流量,那么至少在目前阶段,这类AI生成视频就是触手可得的红利。
以上就是关于“小泥人解读百度研究院的黑科技:十分钟内文章变视频的AI神器面世”的全部内容。这项黑科技大大提高了工作效率,同时也能带来超大流量。抓住了这个机遇,就抓住了成功。更多精彩请电话咨询4006566135,或登录小泥人官网www.xiaoniren.com
小泥人成立于2010年,总部位于以创新而著称的中关村科技园区,成立以来一直秉承服务于企业和商家,在移动互联网的背景下,帮助全天下的企业和商家进行基础信息建设,建立全网营销,打造移动营销闭环为宗旨,帮助全天下的景区和场馆打造智慧景区和智慧场馆为己任,以务实,专业,创新的态度,依托强大的技术研发能力,成功服务于百万企业用户。
小泥人是一家蓬勃发展的创新性企业,一直以技术为驱动,市场先行,经过6年发展,于2016年11月18日在北股交正式敲钟挂牌,股票代码是:099189。挂牌后,迅速开通了河南,山东,江苏,上海等40多个分站。2017年又获得创新中国2017年十大领军企业,国家高新技术企业,目前已经获得了千万级A轮融资。小泥人主营业务有小程序制作,VR全景拍摄,智慧景区建设等,现在发展更加迅猛,为实现一家伟大的互联网公司而全力以赴!
小泥人是国内领先的小程序一站式解决方案原生案例的提供者和制作平台,此平台是一款基于小程序的可视化编辑器,实现可视化操作,所做所见即所得,无需代码,无任何编程基础即可一键生成小程序;此平台海量小程序模板,多样功能组件,最大程度满足开发者需求,只需要简单的拖拉就可生成任意行业的小程序,并能一键完成域名注册、解析及 SSL证书部署等;此平台轻松上架商品,自定义商品排列方式和分类,实现线上支付,一键组建你的商城,一键打包生成小程序代码,对接微信平台和开发者工具,帮助企业无代码快速搭建自己的小程序,帮助实体店实现方圆5公里免费展示和海量客户引流!
小泥人是国内领先的全景和VR(虚拟现实)服务平台,融合互联网和拍摄技术,为客户提供全景展示策划,720度全景拍摄,全景制作,VR发布和分享。此平台帮助企业提升形象,提高客户信任度,缩短了用户与现实世界的时空距离感,是一种新型的企业展示方式和宣传方式,广泛应用企业,政府机关,事业单位,院校,工厂,餐饮,酒店,景点等各个行业。
小泥人是互联网+智慧景区和智慧场馆的实践者和引领者,率先自主研发了智慧景区系统,获得国家版权局软件著作权证书,率先实现了线下纸票出票检票系统,线上电子票分销和移动微信营销,VR拍摄和小程序建设,硬件支持等四系统的合成,此系统以景区和场馆等资源方为中心,具有跨媒体营销和多硬件支持的能力,既能帮助景区和场馆实现信息化,全面打通了分销渠道,又能掌握了终端消费者,达到了宣传效果,节约了成本,提升了客户体验。
阅读量:19433