Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于AI智能标签图片管理的探索实践论文

发布时间:2022-10-14 10:01:19 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
  摘要:本文主要阐述中国气象报社如何利用人工智能新技术来应对新媒体时代大量图片管理和使用带来的挑战,介绍构建图片标签卡的设计思路,并提出采用光学文字识别、人脸识别、自然语言处理等人工智能技术对海量图片进行结构化管理。
 
  关键词:人工智能;图像识别;自然语言处理;智能标签;图片库
 
  Exploration and practice of image management based on AI smart tag
 
  Liu Jie
 
  (meteorological publicity and Science Popularization Center of China Meteorological Administration,Beijing,100041)
 
  Abstract:This paper mainly expounds how the China Meteorological News Agency uses new AI technology to deal with the challenges brought by the management and use of a large number of pictures in the new media era,introduces the design idea of constructing picture label card,and proposes to use AI technologies such as optical character recognition,face recognition,natural language processing to structurally manage a large number of pictures.
 
  Key words:artificial intelligence;Image recognition;Natural language processing;Smart tags;Picture library
 
  一、海量图片给传统图片管理带来的挑战与机遇
 
  传统的采编系统管理要求每张照片上传到业务系统时必须有时间、地点、人物、事件等要素。但是,当下,若人们在拍摄了有价值的照片后,只是将照片保存到自己的电脑上,随着照片数量的不断增加,后期管理难度会越来越大。同时,目前的图片库管理必须由图片编辑对图片进行人工分类,并进行图片信息及关键词的标注,审核无误后才能正式存入图片库中。虽然图片的标签相对精准,但处理的数量有限,只是部分入库,入库量与图片存量差越来越大,因此给传统的图片管理方式带来了挑战。
 
\

 
  有挑战就有机遇,人工智能技术的发展带来了前所未有的机遇,随着图片识别技术的创新发展,当前的人工智能发展日益成熟,图形识别、语音识别、人脸识别等智能感知技术在识别精度上得到了显著提升。图像识别已成为当下的主流,每天成千上万的企业和消费者都在使用这项技术,阿里、百度等互联网一线服务商纷纷在云端推出了图像识别服务,甚至提供了免费的API接口,该服务能准确识别超过10万种物体和场景。人们在各个领域使用人工智能图像识别技术,如使用人脸门禁系统开门、手机人脸解锁、银行人脸取款等。随着图像识别、人脸识别、场景识别等智能算法的高度发展,图片管理越发智能化。图片管理具备了智能服务规模化图片标签的能力,极大程度地丰富了图片库内容。
 
  二、人工智能技术对海量图片管理的方法
 
  目前,虽然各渠道获取和采集的图片数量越来越多,但只有将海量的没有详细说明和关键词的图片进行结构化加工才能发挥图片管理的价值。这种加工只有采取智能化技术,才能大幅提升图片的管理效率。在图片数据结构化的基础上,可建立标签体系,为图片检索、加工、关联、分类、聚合奠定基础。
 
  为实现图片结构化,中国气象报社为每张图片建立了知识卡片,并规定图片入库智能识别的元数据元素,以有效满足图片快速打标的需要。元数据元素主要由以下部分组成:一是基本信息,主要包括图片的标题、创建者、拍摄时间等;二是地点信息,主要包括图片中的重要地标信息;三是人物信息,主要对图片中的国家政要人物、行业重要领导、行业知名人物、敏感人物进行标引;四是场景信息,主要对图片中的场景进行描述,如室内、室外、会议、天气会商、气象观测、科普宣传、天气现象等;五是其他信息,主要对图片的主体信息和文本信息进行识别并形成关键词,如百叶箱、观测塔、小红帽、雨伞等。
 
  在对整体图片存放结构设计的基础上,可利用图形识别智能算法获取图片中的主体图形特征并进行处理。一方面,可对图片内的图形直接标引,另一方面,可通过几个图形的潜在关联或者映射关系,给图片添加描述性的关键词。计算机自动建立标签后,可将图片信息的内容转化为文本信息。文本信息处理技术已经相对成熟,针对自动标注后的图片用户可以更快查询和浏览,并在海量的图片中找到目标。如此,数以万计的闲置图片就能发挥价值并被很好地利用和分析。
 
  三、主要技术解析
 
  (一)文字识别
 
  文字识别俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),是指通过检测图片中文字图像符号,将其符号形状转译成文字。文字识别后,文字处理软件可进行加工编辑。世界各国对OCR方面的研究可以追溯到二十世纪六十年代,中国对OCR的研究则是从二十世纪七十年代开始,直到八十年代末,汉字识别技术才有了较快的发展,并推出了最早的汉字识别OCR产品。20世纪90年代之后,OCR的汉字识别速度和正确率已基本达到商用水平,能满足自动化图像文字加工需求,目前,OCR对中文简体字的识别已经非常精准,OCR成为一种非常高效、便捷的汉字录入方式。应用OCR技术对照片中的文字进行识别,有助于机器理解图片。大部分的会议及活动照片都有文字图标、图示,利用OCR技术识别图片中出现的文本,如会标、宣传标语、路标及单位人员名称等,可将识别出的文字进行关键词筛选,进而提取多种类型的标签。
 
  (二)地标识别
 
  图像拍摄地点是图像的重要标识之一,而地标是判断图片拍摄地点的重要依据,通过对地标的识别可以标识图像所属的地理位置。深度学习及大规模图像训练支持上千种的物体识别及场景识别,使用第三方接口,并应用第三方大型标注过的数据集,可以弥补数据集训练的不足,并对图片中出现的标志性地理特征进行打标,从而为图片加注地理位置属性。
 
  (三)人脸识别
 
  人脸识别是通过分析、比较人的脸部特征信息而辨别身份的一种识别技术,主要是利用人脸数据库存储的样品数据进行比较分析,从而识别图片中的人物。人脸识别一般分三个步骤:第一,在图片场景中,对人物脸部所在的位置区域进行确定标识;第二,对人脸的生物特征进行抽取;第三,将抽取的特征信息与数据库中的样品进行匹配和识别。在新闻报道中,重要人物的照片使用频率高,将重要的人物的人脸图像导入人脸识别系统,可建立基于本行业的重点人脸数据库,利用人脸识别技术为图片添加人物标签,对涉及图片进行快速定位和处理。同时,这些设计对于检测图片中出现的敏感人物也十分有用。近年来,人脸识别算法发展迅速,检出率和正确率都得到大幅提高,视频识别的检出率和正确率分别达到97%和90%,照片中的人脸识别率可达95.7%。
 
  (四)实体识别
 
  利用智能检测技术可以检测图片中出现的人物、动物、物体等实体对象。常见的气象观测设备包括气象卫星、天气雷达、百叶箱、网速仪、能见度仪、天气现象仪、温度计、量尺、计量桶等实体对象,利用智能检测技术检测到这些对象时,就可以为图片设置相应的文字标签。
 
  (五)场景识别
 
  场景识别技术可准确地识别、分析图片中的各种场景,并将图片的背景、物体分离,进而对图片的宏观信息和微观信息进行分别标识和融合分析,可达到对图片中场景的准确识别。例如,针对室内室外场景、天气情况、会议、颁奖、服务、监测、活动、文体、宣传等场景,应利用场景识别技术检测这些场景,就可以为图片设置相应的文字标签。

\
 


        (六)图片检索
 
  图片的整理入库本质上是为了更好地检索和使用图片,人工智能算法对图片进行主体、场景等加注标签,虽然可以极大程度地增加对图片的描述,使这些图片能够更加容易被找到,但由于这些图片标签相对独立,缺乏相关性,仅依托标签检索还无法达到较高的检索精度[1]。想要快速找到目标图片,需要对图片标签建立联系,并对它们之间的关系进行描绘,如此才能对检索需求进行智能推理和挖掘,近年来兴起的知识图谱技术能够很好地解决该问题。
 
  (七)知识图谱
 
  知识图谱可通过结构化的数据知识库描绘出各数据的内在关系,构建网状的知识关系结构,使其具备从关系层面入手推理问题的能力,其本质是一种基于图的数据结构。区别于传统的基于关键词搜索的搜索引擎,知识图谱能更好地检索出信息的关联信息,并从语义层面更好地理解用户的意图,提高检索结果质量。近年来,百度、搜狗等检索领域的公司加大了利用知识图谱技术优化搜索结果的研究[2]。例如,用户搜索中央气象台时,搜索页面呈现的内容包括单位的地址、相关活动等信息。当然,知识图谱的建立本身是一个庞大的工程,需要长期进行知识图谱模式层的构建,需要采用不同抽取算法从数据源中抽取出实体内容、属性等。在获取新知识时,需要消除歧义及矛盾,需要对一个名词对应多种实体的情况进行整合,再通过质量评估甚至人工甄别,将合格的数据知识加入原知识库中,从而在不断丰富图谱的基础上保证库的质量。
 
  四、系统构成
 
  图片智能标签系统主要由AI训练系统和AI识别系统组成,同时提供API接口供其他采编系统及数据资产系统使用。
 
  (一)AI训练系统
 
  AI训练系统是一套深度学习平台,提供图片分类模型训练,可通过样本数据管理、算法训练管理、算法效果评估、算法仓库管理实现与后端识别系统的对接,进而完成智能识别能力的训练。对简单易用的样本数据人工标注以及样本数据智能标注,可以提升样本数据标准的效率和质量。采用对样本数据的智能仿真生产技术可以解决复杂场景下无法获取样本数据的难题。AI训练系统支持多平台、多语言(Java、Python、Scala等)的可视化及在线模型训练,在搭建多样化的模型训练平台下,可降低模型训练门槛,支持动态分析模型训练,支持实时掌握训练参数和效果。
 
  1.样本数据管理
 
  样本数据管理主要用于对训练样本的管理,气象图片具有行业特点,需要形成一个具有一定规模的训练数据集,该训练数据集可作为图片识别和检测的一个基准。目前,我们的样本数据已超过10万,包括各类云图、百叶箱、天气雷达、温湿度仪等的数据,满足准确识别气象现象、装备等的数据。同时,样本数据还承担着标注库的管理功能,需对初始的100多类分类标签进行管理。
 
  2.算法训练管理
 
  图像识别任务面对着很多挑战,图片中视角变化、比例变换、物体遮挡、背景杂波等都需要考虑。因此,我们设计了一个学习算法,向系统提供每一个类别的许多例子。算法对这些例子的学习,然后得到每一个类别的视觉外观和特点,前面提到的样本数据在这里发挥了很大的作用。通过样本的配合,不同算法的训练形成不同类别的分类器或者学习模型,进而提升识别的准确程度。
 
  3.算法效果评估
 
  为了使系统达到满意的使用效果,需要对前面每一类型的算法结果进行评估,对没有达到识别标准的算法进行优化和再训练,直到达标。对成熟的算法进行评估后,算法经签审进入后端识别系统开始业务化运行。
 
  4.算法仓库管理
 
  系统建立了算法仓库,方便管理员管理,同时支持算法的下载、共享及其他同类智能系统的多次使用。
 
  (二)AI识别系统
 
  AI识别系统提供面向用户的互动操作界面,可通过智能分类、结果分析、任务管理、信息配置、过程监控等程序完成图片的录入、分类识别、标识关键词,并实现对图片的入库和管理,同时支持图片智能检索。
 
  1.智能分类
 
  支持手工上传、手工拖入、自动上传图片,图片完成上传后,系统可自动调用后端算法进行识别,识别结果自动入库,同时保存上传记录,支持批量导出识别结果。
 
  2.结果分析
 
  系统通过主体识别服务,可完成图片特定场景、主体标签、OCR的识别;通过分析识别结果,可进行识别阈值的配置,从而达到满意的识别效果。
 
  3.任务管理及过程监控
 
  系统支持多任务管理和自动化任务分配,可进行全流程的识别任务过程监控,能满足任务优先级的设定,并能在系统资源闲置时进行日常业务的计算。
 
  4.信息配置
 
  系统通过信息配置,可将智能算法封装为编程接口,便于二次开发或第三方系统的调用。
 
  五、结语
 
  本文综合阐述了中国气象报社在图片管理方面的探索与实践,探索组合使用多种人工智能技术解决图片管理中图片多、人员少的矛盾。同时,探索利用多模检索技术提高图片检索精度和便捷性,以期使数字时代海量图片数据产生更大的效益,为更好地挖掘图片价值提供一种新的思路。
 
  【参考文献】
 
  [1]张皓,吴建鑫.基于深度特征的无监督图像检索研究综述[J].计算机研究与发展,2018(9).
 
  [2]王昊奋漆桂林,陈华钧.知识图谱:方法、实践与应用[J].自幼化博览,2020(1).
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
 

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/44651.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml