SCI论文(www.lunwensci.com):
摘要:人工智能是科学技术,对其开源是加速技术迭代、升级,提高应用率的一种重要方式。人工智能作为一个集深度学习、语音技术、自然语言理解、算法等技术于一体的科学技术,已成为世界的主要发展趋势。技术人员对相关项目进行开源,能够提高人工智能技术创新应用效率,加速人工智能技术的发展和在社会生活中的使用。因此,本文论述了已经对外开源的人工智能应用实践案例,明确了开源项目中存在的知识产权、信息安全等风险,并在此基础上提出了相关发展建议。
关键词:人工智能;开源;AI应用
A Survey of Artificial Intelligence Applications in Open Source Projects
Zhang Honghe
(Zhongguancun Audio-Visual Industry Technology Innovation Alliance,Beijing,100080)
Abstract:For the advanced science and technology of artificial intelligence,its open source is an important way to accelerate technology iteration,upgrade,and improve the application rate.As a science and technology that integrates deep learning,speech technology,natural language understanding,and algorithms,artificial intelligence has become a major development trend in the world.Open source related projects can improve the efficiency of artificial intelligence technology innovation and application,and accelerate the development and use of artificial intelligence technology in social life.Therefore,this paperfirst discusses the practical cases of artificial intelligence applications that have been open sourced to the outside world,identifies the risks of intellectual property rights and information security in open source projects,and puts forward relevant development suggestions on this basis.
Key words:artificial intelligence;open source;AI application
开源源于软件行业中的开源软件,被倡导“自由精神”的理查德·斯托曼命名为“自由软件”。理查德·斯托曼于1985年创立了自由软件基金会,并发布了带有哲学色彩的GLP许可证。该名称难以获得商业界认可,因此,1998年,埃里克·雷蒙德等人于美国加州举办推广开源促进会,正式引入“开源”一词。
随着时代发展向信息化、数字化、智能化转变,开源在大数据、人工智能、物联网等领域的作用越发凸显。2017年,我国印发了《新一代人工智能发展规划》,并将开源开放作为一项基本原则,倡导人工智能开放共享,积极参与全球化资源配置。2021年3月,我国首次将“开源”列入“十四五”规划,鼓励企业开放软件源代码、硬件设计和应用服务。通过开放源代码、开放数据、开放服务等方式,人工智能不仅可以降低研发投入成本,还可以加速项目技术创新和优化迭代,促进开源生态和人工智能生态融合建设。
学术领域对基于开源的管理体系、实验设计、实证研究等方面进行了丰富的研究[1-3],对人工智能在医疗、教育、汽车、金融等领域的技术应用也进行了诸多论述,但对基于开源项目的人工智能应用的发展分析较少。发展人工智能是世界发展的大趋势。开源能够带来广泛且多样化的信息资源,并能将开发者、企业及各行各业程序员联合起来,推动人工智能在实际生活中的应用。研究人员系统分析基于开源项目的人工智能在生活中的应用实践,有助于相关人员了解开源的人工智能应用发展现状及不足。智能医疗、智能家居、智能驾驶和智能机器人是近年的热门话题,也是人工智能的重点布局领域。本文以这几个方面的应用作为分析重点,为其他领域的人工智能应用提供发展思路及技术突破点。
一、人工智能开源应用实践
(一)基于开源的智能医疗实践
人脑处理数据能力有限,依靠人工智能技术可以提高医生的诊断能力,帮助医生快速诊断病人的病情。因此,智能医疗越来越受到国内发展战略的重视。2016年以来,国内出台了许多政策支持智能医疗技术与智慧医院建设。2018年,卫健委发布《关于深入开展“互联网+医疗健康”便民惠民活动的通知》,重点提出要加快智慧医院建设、推进智能医学影像识别等医疗健康场景下的智能语音技术应用。在政策鼓励和时代大潮的推动下,科技企业不断深入探索AI医疗技术,推动资源的合理分配。下面以开源的医疗影像项目为例进行分析。
开源智能医疗影像项目对社会医疗资源分配、疾病诊断、缓解突发性疾病有积极的作用。医疗影像领域的数据内容相对杂乱、非结构化数据较多,且专业性强、标注困难,需要专业医学人员才能正确标注[4]。目前,ImageNet是世界上数据量规模最大的数据集,而医疗领域数据量规模难以达到ImageNet要求。因此,医疗领域需要先构建预训练模型,再对真实的医疗数据进行微调,以获得高性能。但是,该预训练模型暂时没有开源。
2019年,腾讯沿袭ImageNet医疗影像数据集构建思路,依托优图实验室开源智能医疗项目——深度学习预训练模型MedicalNet。该模型是一款利用深度学习框架,面向3D医疗影像开发的应用,能通过MedicalNet模型进行迁移学习。即便新应用中的数据量较小,用户也可以训练出模型。从深度和数量级角度来看,该预训练模型的覆盖范围较广,尤其适用于数据集较小的医疗影像。同时,该技术可以向其他医疗影像AI应用迁移,现已能够实现对宫颈癌、肺癌等癌症的筛查,并部署于国内多家三甲医院。例如,连心医疗研发的CT影像分析模型通过百度飞桨深度开发学习平台开源到全国各地的医院,释放了本就不足的医院资源,加快了疾病的诊断速度,帮助更多患者得到了积极有效的治疗[5]。
(二)基于开源的智能家居实践
中国经济正在从高速发展向高质量发展转变,人民生活水平也在不断提高。近年来,人们不断追求生活质量的提升和精神世界的升华。智能家居的发展为人们的生活带来了便捷的生活方式,优化了人们的居住环境。智能家居是在传统家居的设计上引入并应用现代科技手段和先进制造技术,如网络通信技术、布线技术、智能语音技术、人脸识别技术和智能控制技术等。智能家居的正常运行需要依靠智能家居系统,理论研究中包括利用CMS复合总线、国产单片机和WIFI模块、ZigBee安全通信等方式,可以实现统一、顺畅且相对完善的智能控制。但是,在实际应用中,智能家居必须考虑设备通讯协议在不同设备之间的互联互通。下面以小米的智能家居应用为例进行分析。
小米以智能家居、可穿戴设备等应用场景为立足点,建设了Vela嵌入式物联网软件平台。该平台基于开源实时操作系统NuttX,可以支持对上层所有物联网的应用,并实现对影音娱乐、家庭安防、智能卫浴、智能照明等多场景的控制。NuttX拥有兼容性高、完成度高、代码精简等优势,作为物联网的下层架构,常用设备的三种通信协议,即WIFI、ZigBee和蓝牙可以支持多模网关,实现同网关下不同协议设备的本地化运行。多模网关作为智能开关插座的“大脑”,相当于一个总控台。总控台可以对屋内环境信息进行判断,然后智能操作门窗、摄像头、净化器、空调等各种设备的开闭。智能照明、门窗探测器、加湿器、小爱同学等小米产品均可以接收总控台指令。用户可以通过移动端APP、笔记本电脑对终端进行控制,实现跨设备的全家居控制,打破设备与系统间的物理界限。
(三)基于开源的智能驾驶实践
2021年11月,交通运输部发布《关于组织开展自动驾驶和智能航运先导应用试点的通知》,要求开展自动驾驶和智能航运的相关试点工作,鼓励产、学、研、用协同开展试点,推进新一代信息技术与交通运输产业融合发展。自动驾驶是人工智能、物联网等多种新一代信息技术融合发展的产物,涉及感知、分析、决策等多项技术。当前尚未实现完全的自动驾驶,而需要利用人工智能技术完成智能化驾驶。技术人员对智能驾驶核心模块进行开源,能有效加速技术发展,完善技术漏洞。下面以百度Apollo平台为例进行分析。
百度的自动驾驶平台通过开放源代码、开放硬件架构、开放数据和开放测试场地,提出了一套覆盖车辆、硬件、软件和云端服务的系统级解决方案。百度开放的模块包括障碍物感知、决策规划、高精地图等;开放的数据包括仿真场景、场景运行、智能判别、可视化等。同时,百度与银川市、重庆市、苏州市吴江区等各级政府开展战略合作,与山西交控、中国移动等企业开展技术合作,全力推进智能驾驶测试和技术研发。2021年,依托“萝卜快跑”平台,百度Apollo完成自动驾驶商业化试点首单订单,目前,该平台已在北京、上海、广州等5个城市开放常态化运营。
(四)基于开源的智能机器人
智能机器人的本质是拥有感知、运算、逻辑分析等功能的可以模拟人的机器系统,在工业、服务业及个人生活中具有广泛的应用空间。工业机器人可以大幅缩短工业领域制作时间,提高工作效率和精确度;服务机器人可以最大限度地减少人力成本,提高服务质量。但这些智能机器人只是智能化的机器,只有拥有与人类一样的表达、情感与行为,机器才更倾向于机器“人”。目前,很多科技工作者及开发人员已利用各类开源技术开展研究,探索开发拥有情感的机器人。下面以爱瑟尔和萝卜狗为例进行分析。
情感智能机器人拥有类似人类或动物的基本能力,并具备真实生命不具有的科学技术能力。爱瑟尔是一款主打情感伙伴的仿人机器人,能够与人开展一定程度的交互活动,同时具备多种功能,如琴棋书画、运动操作能力等,能像人一样观察、倾听和表达,现已成为浙江省的重点支持项目。萝卜狗是一款多功能宠物机器狗,除了可以完成和宠物狗一样的蹲起、行走、跳跃等动作,还拥有特殊的科技能力,如构建地图、自主导航、视频实时回传等,不仅能用于陪伴、找人,还可以用于场地巡检、教学娱乐等方面。以上两款智能机器人的部分算法已经在情感智能机器人实验室开源,并致力于技术升级与功能多样研究,使其真正成为人类的伙伴。
二、存在的风险
(一)许可证及知识产权风险
开源项目存在许可协议兼容性与侵权风险。众所周知,开源软件和开源学习框架的修改、发行虽然免费,但必须遵守相应的许可协议,如GPL、Apache、MIT、BSD等。不同许可协议的约束条件不同,GPL具有高传染性,如果使用了GPL协议下的部分代码,那么整个软件或框架都要遵守GPL规则,属于著作权强制许可;Apache鼓励代码开源,也尊重原作者的著作权;MIT、BSD属于宽松许可证,限制较少,使用率较高。小米NuttX使用的是Apache2.0许可协议,在符合一定条件的情况下可以向用户收取专利许可费。腾讯MedicalNet框架使用的是MIT许可证,也就是说,使用MedicalNet框架源代码的开发者可以自由选择新的许可证,但其间可能出现许可证兼容问题。同时,该许可证没有明确的专利授权条款,潜藏着一定的知识产权侵权风险。
(二)安全风险
开源项目缺少对安全风险的修复和响应机制。开发者将开源项目的代码共享到社区或代码共享平台,使用者越多,开源代码的复用度就越高。开源代码本身存在一些漏洞,《2021中国软件供应链安全分析报告》显示,平均每个软件项目存在66个已知开源软件漏洞。随着开源代码使用率的提高,软件会不断出现新的安全漏洞,而这些漏洞缺乏完善的修复机制,在代码的使用过程中也没有健全的安全审查机制,易造成漏洞传染,最终影响相关产品的使用。例如,MedicalNet缺少安全文档,使用者在使用中产生的漏洞缺少有效的修复和响应机制。此外,也存在黑客利用漏洞攻击开源项目的风险。
三、发展建议
我国人工智能技术正处于飞速发展时期,依靠深度学习框架、自然语言理解等核心技术能不断与其他产业融合,并逐步应用于生活中的各种场景。开源的人工智能应用正不断完善其技术框架,在智能医疗、智能家居、智能驾驶、智能机器人等领域中得到了一定程度的实践应用,但这些应用实践仍然存在一些技术问题。因此,我国下一步应该在完善处理现有技术问题的基础上进行以下探索:第一,探索避免恶意使用基于开源项目的人工智能应用的措施,维护智能时代信息资源知识产权安全,并探究各类协议的融合发展路径;第二,思考引导开发者维持优秀的开源人工智能项目的迭代和更新,以及减少漏洞传染的方法;第三,探索随着信息技术加速发展,如何尽快完善人工智能相关法律法规建设,在产业融合发展、产业边界逐渐模糊的时代大潮中规范行业标准,提高产品质量。
【参考文献】
[1]薛润生,宋沛林.基于开源WebGIS的河道设备管理系统开发[J].水利技术监督,2021(12):.
[2]刘刚,田玉敏,万波,吴自力,王宗武.基于开源软件的数字电路与逻辑设计虚拟实验室设计[J].电子技术与软件工程,2021(21).
[3]王玲,董振伟,张庆芝.开源软件项目发起人个体特征对项目绩效的影响——基于GitHub的实证研究[J].科技管理研究,2021(20).
[4]吴骋,秦婴逸,李冬冬,王志勇.迁移学习技术及其在医疗领域中的应用[J].中国医疗设备,2020(09).
[5]脑极体.从百度飞桨助力开源肺炎CT影像分析模型,看开发者的“无声抗疫”[J].大数据时代,2020(03).
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/47460.html