人工智能作为当代最具代表性的使能技术,理应受到各行各业的欢迎,但现阶段,纵观人工智能应用最为成熟和广泛的领域,仍然以公安、交通、金融、教育等专业性领域为主,而其他的行业对于人工智能的应用需求虽然广泛存在,但由于场景的多样性、需求的高度分散使得人工智能的渗透相对较浅。
从技术实现的角度而言,现阶段的人工智能技术发展水平已经毫无疑问能够满足中小型行业轻量级、个性化的AI应用需求,但在技术方案和各式各样的场景之间依然存在着一系列的瓶颈和门槛问题,诸如数据瓶颈(数据采集、数据标注)、算法训练瓶颈、模型评估和发布的平台等等。对于一些中小型行业用户而言,尽管他们可能构想了一套又一套理想的AI应用方案,但如何获取上述这些资源来实现方案的落地是个问题。
在过去几年里,互联网科技领域、人工智能以及智能安防产业圈的几大头部企业陆续推出了AI开放平台,这些AI开放平台的一个共同的特性就是均以“普惠AI”为核心理念,而推进AI普惠的一个关键便是降低AI应用的门槛,其中就包含帮助用户实现零基础训练出一套自定义的AI应用模型。
在2019年深圳安博会上,华为、百度云、海康威视这几家都有详细展示自家的AI开放平台在自定义AI应用模型方面的服务,也让我们看到了AI开放平台相比于传说中的神奇更接地气的一面。
短、平、快,零基础自定义一套AI应用模型
海康威视AI开放平台在助力用户自定义AI应用模型方面,主要有5大服务流程:明确用户需求-数据标注-导入标注后的数据做模型训练-模型部署-应用上线,自定义一套AI算法应用时间周期要多久呢?海康给出的答案是不超过一个小时。
在此前安防知识网对海康威视高级副总裁、研究院院长浦世亮的专访中,浦世亮也特别提到了海康威视在AI开放平台上的思考,他认为,AI技术在一个场景中的落地往往需要漫长而专业的开发过程,从数据的收集标注、算法设计、训练、集成到上线往往需要历经数月。而现在通过AI开放平台,可以利用各种自动化的工具,使得AI算法的开发过程,变得非常简易。一个零算法基础的用户,可以在一个小时之内完成整个算法的训练及部署。
举一个例子,比如一家连锁商店的老板需要通过AI技术检测商铺门口是否堆有垃圾,但商户本身没有任何技术能力。这种情况下,只需要商户注册成为海康AI开放平台的合作伙伴,在线上传几十张自己拍摄的店门口的垃圾图片,并通过平台上的标定工具标定垃圾信息,同时选定摄像机,将标定后的垃圾数据进行算法训练后关联到选定摄像机,商户即可自行给普通的摄像机DIY出可实现垃圾堆叠检测的AI能力,整个过程只需半小时左右。
安博会上百度云也重点展示了其VideoMind算法训练平台。这套平台同样可提供从新建模型、创建标签、上传数据、标注数据、训练模型、评估校验、发布模型全流程服务。开发者几乎可以零开发搭建一套业务demo,据介绍只需2~3天时间即可完成部署,省去业务系统基础功能的重复开发、以及基于AI的业务功能的开发成本。
据了解,VideoMind已经支持四类模型训练:场景分类模型,如识别出视频中是工厂、农田、还是建筑工地等;实体分类模型,如识别出视频中出现的是货车、跑车还是卡丁车等;自然摄像头实体检测模型,如识别出街边的违章停车、无照游商、乱丢垃圾现象等;人体属性检测,如识别出工人是否戴安全帽,法官是否穿法袍等。
华为ModelArts2.0开放平台可以以全流程的极简和自动化升级已有的AI开发模式,助力用户完成数据准备、算法开发、模型训练、模型管理、模型推理全链条自定义AI应用模型。
安博会上,华为展出的ModelArts2.0拥有十余项新特性及服务,包含智能数据筛选、智能数据标注、智能数据分析、多元模型自动搜索、ModelArts SDK、图神经网络、强化学习、模型评估/诊断、模型压缩/转换、自动难例发现、在线学习等,覆盖AI模型全生命周期。
华为ModelArts 2.0 AI开放平台(图片来源:华为云)
据现场工作人员介绍,ModelArts可自动学习,不断提升识别的准确度和运行速度,还可以不断扩充模型类型,包括文本分类、行为识别等场景模型的定制化开发。
不同平台在算法训练服务方面背后的核心技术
这三大算法训练平台,几大流程步骤虽然大同小异,不过不同的平台在不同环节上都有针对性的核心技术来解决响应的问题。
比如在处理数据瓶颈的问题上,针对数据样本少的问题,海康威视AI开放平台提供了基于领域模型的迁移学习能力。AI开放平台训练了大量不同应用领域的领域模型,根据用户的任务,开放平台会自动选择的一个领域模型作为训练基础,然后在这个训练基础上利用场景数据进行迁移学习,这样可以让用户能够用极少量的数据得到一个可用算法。
对于数据样本单一的问题,海康威视AI开放平台还开发了虚拟数据引擎,它可以利用三维建模、光线追踪、对抗学习等技术生成虚拟数据来丰富训练样本,虚拟数据引擎可以帮助用户丰富训练样本,大大降低了用户的数据成本。
在数据标注方面,华为ModelArts 2.0采用了混合智能标注技术,据了解,这样可以让标注效率获得至少5倍以上的提升。还有智能数据筛选,即通过AI的方式自动过滤和筛选出对训练模型无效的数据。比如视觉类场景中失焦、过曝的图片以及不符合应用需求的一些无关图片等等。
而在模型训练环节,华为ModelArts 2.0采用了多元搜索技术,可以将自动数据增强、超参自动搜索、神经网络架构搜索等技术进行融合,以帮助用户快速构建AI模型。与此同时,小样本/半监督学习、强化学习、联邦学习等前沿技术的融合应用,不仅可以降低对训练数据的需求,同时还能够让模型随着数据的增长和变化,实现在线持续学习和进化,真正提供企业级的可进化的AI。
在完成模型训练后,算法在产品端的移植工作也需要投入大量研发工作。为了提升从算法到产品的研发效率,海康威视开发了自动编译工具(AI编译器),利用神经网络图优化、汇编优化、指令编译优化等技术手段实现了算法在各类芯片平台上的自动优化及部署。
AI开放平台提供自定义AI应用模型服务的意义
将算法训练以工具的形式开放给广大的零散的用户,这是企业对于AI赋能意义最接地气的诠释,也是实现价值转换的基础途径。
AI开放平台提供了数据标注、算法训练、模型评估、应用发布和部署的一系列能力,而广大的行业用户他们对于细分的业务需求有着充分的了解,而通过这一类AI开放平台,则可以很好的聚合平台以及用户双方的优势,让AI技术能够深度融合到实际业务需求当中,实现定制化的AI应用。
与此同时,通过AI开放平台这一固定平台,可以进一步放大AI技术工具的通用性,让这些能力成为可共享的资源,一定程度上也为海量的、零散的小型行业应用需求提供了一个公共的入口,缩短了中小行业用户在这方面需求响应的距离和速度,让传统的可能需要以项目方式进行的方案能够短、平、快的快速完成方案设计和应用部署。
并且,伴随着平台对各项个性化AI应用模型训练经验的积累,多元化数据的持续“投喂”以及业务应用逻辑的聚合积累,也将不断为平台输送“养分”,强化平台在算法训练方面的普适性,从而让模型训练的速度更快,也能够完成越来越复杂的应用类型的训练。