人工智能AI技术是当今炙手可热的技术领域,它在制造、家居、零售、交通、安防等行业的应用已经是大势所趋。本文笔者将分享一些AI技术在视频中应用现状,回顾AI是如何渗透到短视频生产各个环节中的。
AI技术在视频中应用现状
AI技术创新已经渗透到了短视频各个环节。可能我们没有注意到,其实AI技术已经应用到了视频的生产、传输、消费等各个阶段。比如,在用户创作阶段,基于人脸识别及跟踪技术实现瘦脸、大眼、美白功能已经相当常见;当视频上传到服务端之后,我们会对视频内容进行审核、去重、溯源等处理,并进一步对视频的打标、分类,同时采用AI技术去定义最有美学感的封面,便于完成用户个性化搜索、智能推荐等动作,提升用户的点击率和体验。
算法在数据积累到一个临界点后,才会带来爆发。这里举个我们非常熟悉的例子,2018年9月,移动资讯的独角兽平台趣头条赴美上市了,股价更是一路飙涨。趣头条的安装用户数在2018年达到一定数量级,伴随着用户数增多,上传视频数也成倍增长。所以,当到达了某个数据积累的临界点之后,个性化推荐的算法开始发挥其强大的作用,用户DAU激增。
用户对视频质量要求高,短视频虽短,但处理流程趋于精细化。移动互联网时代视频量暴增起来,但是其中不乏一些低质量的内容,比如一些互联网搬运工的作品,他们在网上下载视频后经过批量地二次加工,再上传到网上去。这种情况对于原创者是个致命的打击,同时也影响了平台的用户体验。所以,现在一般平台都采用多重方式,对视频的质量进行把控审核。处理流程大概是:面对平台100个视频,去重和版权违规过滤掉一些视频,涉黄又过滤了一部分视频,最终到转码的时候可能只有70个视频,整个处理流程的好处是,转码和存储的量会大大降低,用户体验也会相应提升。
视频DNA技术实现视频的去重、溯源与盗版打击
短视频平台通常会面临视频大量重复的情况,所以在整个视频AI的应用中,怎么样去辨别视频的唯一性,以及根据内容分析来追溯视频来源是关键所在。视频AI可以帮助平台高效地判定对视频的剪拼改编行为。
视频DNA的技术原理是:当你上传一个视频的时候,可以生成唯一的指纹,指纹的特性是唯一性,同时具有稳定性,它不会随音视频文件的格式转换、剪辑拼接、压缩、旋转、增加LOGO等变换而变化。
所以当其他类似视频上传后,你就可以在视频库中与现有视频做检索比对,相似性达到一定程度,就被证明是重复性视频。
同时,我们运用视频DNA在做相似性溯源的时候,会对视频内容关联关系进行挖掘,对视频内容制作路径溯源。它的应用场景是:平台可以先将电视剧的长视频录入库中,当用户看了长视频后,可以把相应的短视频做推荐,根据用户偏好进行推送,提升用户体验。
此外,视频DNA可以配合DRM数字版权保护技术(没有授权的账号不能播放)和视频水印(专属LOGO识别),更好地打击行业盗版。
谈到盗版,还有非常关键的一步是存证。视频DNA和存证体系做关联,推出了可信数字内容版权服务。方案运用了区块链将DNA等关键信息上链,实现多方透明共享、无法篡改和删除,进而构建拥有版权存证、侵权追溯和版权交易等能力的平台。可以重塑版权价值,并提供侵权监测、法律维权、IP孵化等相关服务,进而助力提升全社会的版权意识。
低成本高效率的视频审核
视频在去重后会进入审核阶段。低成本高危视频审核方案可以针对色情、广告、暴恐、涉政、不良场景、视频黑库等做审核。它具备两个特点:第一是色情图片识别准确度高于90%,模型高度灵活,可根据用户要求实时调整生效;第二是能够针对二维码、文字、LOGO等内容多层防护,层层过滤,以最快的速度达到最大的效果。
通常内容审核需要截取视频帧进行排查,在直播中,我们通过业务截帧策略决策系统,先判断是否是高危业务,如果是高危的话,进行高频截帧,加大审核力度;如果不是高危业务,可直接进行关键帧截取,排除违禁内容。这样可以实现成本的节约与效率提升。
基于视频内容分析搭建智能推荐与智能生产系统
内容分析和用户标签挖掘是搭建推荐系统的基石。它可以应用在两个场景之中,第一个场景是:当上传一个短视频,系统会将其先拆成最低的元素,包括声音、图片、文字等。对基本维度做一些识别与分析,进而对视频采取分类、打标签等动作,选取最佳的视频封面,对于后续的广告推荐、内容个性化推荐有了基础输出。此应用场景是通过内容分析帮助视频内容更好地消费。那么反过来思考,我们的视频如果都是人去产生,是不是效率太低了呢?我们能不能通过一篇文章、一句话、甚至一个标签,生成一段视频?
所以有了第二个应用场景,通过视频智能产生系统,输入视频、音频、文字等信息,一系列分析后,可以从库里拿一些图片、文字、声音,去生成一个视频。在2018年世界杯的时候,阿里云视频AI技术通过下图的方案,在比赛结束后几分钟内快速生成了明星集锦视频,这些视频都是机器自动生成的,极大地提高了视频生产效率。
作者系阿里云视频云产品专家
沒有留言:
張貼留言