a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

IVA音视频识别技术解析

IVA是In Video Action技术的缩写,IVA目前与Google Voice的字幕自动化生成技术、百度Video In视频无痕植入技术并称改变视频行业的三大革命性技术。
资讯频道文章B

  随着全球触屏时代的到来,交流平台的移动化、社交化、智能化已成为必然的发展方向。在这样的趋势下,视频互动成为视频行业制定战略的最新重要考虑因素。下面重点介绍下在欧美近两年最受关注的IVA技术。

  IVA是In Video Action技术的缩写,IVA目前与Google Voice的字幕自动化生成技术、百度Video In视频无痕植入技术并称改变视频行业的三大革命性技术。

  随着触屏时代的到来,交流平台的移动化、社交化、智能化已成为必然的发展方向。在这样的趋势下,视频互动成为视频行业制定战略的重要考虑因素。

  IVA技术简单来说是一种音视频识别技术,加上一套互动工具所构成的互动体系。识别技术就像一个探头,能够寻找视频中拨动心弦(或人为设定)的时刻,并用互动技术实现与观众的互动共鸣。值得一提的是,IVA技术可将直播视频画面中的人物、物体、品牌、纹理、场景甚至情绪等信息分拣出来,再通过各种互动工具与受众进行双向交流。

  IVA的使命分三个层次,初级IVA、中级IVA、高级IVA。

  其中,初级IVA是依据音视频样本库标记视频流中与样本库匹配的视频片断,比如从视频流中识别广告时段和广告主、识别新闻联播等节目的片头、根据录音识别用户正在观看的节目等。

  中级IVA利用图像处理技术、大数据技术和深度学习技术,识别视频流中的场景、形状、纹理和人物等。中级IVA可以从视频流中识别大海、森林、闹市等多达200多种场景,在场景连续出现超过30帧的情况下,识别率可以高达90%以上;形状识别的典型案例是从视频流中准确识别1000多种饮料瓶的品牌、容积;衣物、布料的质地和品牌识别属于纹理识别的范畴;人物识别被广泛应用在机场、车站等场所的嫌疑犯追逃和运动追踪,也被电视台用来进行视频索引和标签。

  高级IVA是识别音视频对受众的感性刺激和情绪影响,比如识别一部电影中的泪点、笑点等,高级IVA才刚刚起步,还有很长的路要走。

  目前,IVA已被应用在EPG(电子节目单)自动校准、视频自动索引和标签、电视“摇一摇”等领域。IVA更具广阔前景的应用是互动营销(又称心性营销)。2011年,国内就引进欧美技术开始了在这方面的尝试和探索。人性付费模式是在IVA技术基础上的另一种延伸,利用IVA技术加强视频内容与受众之间的情感联系,让观众在一定情绪的引导下掏腰包。以《中国好声音》为例,当观众被天籁的声音所陶醉,通过IVA技术可以弹出互动窗口,让观众为歌手献上鲜花以资鼓励;亦或是在破音时,用鸡蛋表达无奈;甚至可以在选手表演时,直接通过手机参与到导师转椅子的过程中。将传统的被动收视改变为观众与观众之间、观众与节目之间全方位的互动,极大地激发出观众的存在感、沟通欲、控制欲等人性需求。当然,在播放广告的过程中,在某个消费刺激点时利用IVA技术,可以出现互动按钮,为感兴趣的用户直接提供营销通道,将广告、销售合二为一。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈