a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

能看懂图片内涵的视觉识别图像分类器

IBM 近日迈出了重要一步,对 Watson 视觉识别图像分类器( Watson Visual Recognition)的处理能力进行了更新,它能让用户理解图像或者是视频中的内容。
资讯频道文章B

  IBM 近日迈出了重要一步,对 Watson 视觉识别图像分类器( Watson Visual Recognition)的处理能力进行了更新,它能让用户理解图像或者是视频中的内容。这一系统内置数万视觉标签,使其常用词汇量比之前的模式大2.5倍。内置词汇量的扩大,使其识别特殊视觉概念的能力大大提高。

  新植入的视觉标签涵盖了很多种类的视觉概念,其中包括物体、人、地点、活动、场景以及其它一些关于细致特点类型的词汇,比如特定的颜色。

  每一类词汇的涉及深度都有所增加,也增加了很多特定的视觉描述词汇。这使得新植入的分类器能够对典型图片进行更加精确详细地分类。同时,它也以分类等级为基础,对图片增加了一般性描述——比如知道马是一种动物。

  该服务也能通过识别细小差别来对图片进行详细描述。比如图片显示“人们在愉快地就餐”,那么它能够识别出,该场景不只是在餐馆吃饭,而是能根据视觉形象更加详细地描述出这是在啤酒园里。比如图片显示这是 GAIR 全球人工智能与机器人峰会的会场,机器也能识别出背景图上的雷锋网 Logo。

  视觉识别能达到这么精确的水平,是因为它现在能够平均为每个图像至少贴上九个描述性标签——之前平均只有两到三个。

  IBM 机器视觉负责人 Matthew Hill 表示:“我们之所以能取得这么大的进步,是因为我们用各种各样的摄影镜头获得的大量图片进行了实验,并且采用了图形处理器(GPUs)的分布式网络。 Watson 将所有这些信息都融合到具有数万标签的卷积神经网络。我们也研发出新的推论方法:利用语义推理优化该服务对图片的描述,使其更加特殊、突出、准确。”

  当然,有些企业有自己的自定义数据,他们想为这些数据创造自己的分类器。 Watson 视觉识别也有自定义开发和分类的特点。当需要该服务需要为某一领域学习一套新的图像标签时(像产品组合),开发者可以进行快速开发,通过提供示例图片植入新的自定义模型。然后,应用程序可以利用自定义模型,结合最基本的服务,用一般描述词汇和特定领域的描述词汇对图片进行描述。自定义分类器也可以通过加入新的示例图片来进行升级。

  Hill 表示,视觉识别的发展是 IBM 持续提高 Watson 认知领域能力的重要一步。它是基于世界范围内对视觉理解的不断研发。视觉理解取得了一系列突破性进展,包括利用图像分析改善对皮肤癌患者的治疗,改进图像自动生成字幕技术以及突破人工智能和创造性的限制,制作世界上第一步认知电影预告片等。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2020 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈