Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 理工论文 > 正文

一种基于机器视觉的阅读姿态矫正系统论文

发布时间:2022-11-17 09:58:59 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
  摘要:为了正确培养青少年的阅读习惯,保护眼睛视力与健康,完成了一种基于机器视觉的阅读姿态矫正阅读支架。该阅读支架采用独特的结构设计,保证占用面积小,并采用伸缩夹书机构,满足日常看书和翻书需求。采用WS2812灯环和光敏电阻传感器组成自适应台灯,采用8Ω欧扬声器音频模块、Micro SD卡模块等电子元件组成语音播放模块实现台灯自适应调光、放置不同大小厚度的书籍、播放眼保健操等多功能的阅读支架。视觉部分采用Google开发的机器学习框架MediaPipe,配合机器视觉模型将坐姿分为6类:正常坐姿、左倾、右倾、前倾、后仰、托手。使用树莓派控制板以及USB摄像头实现阅读姿态识别以及通过语音播放模块进行姿态矫正。实验结果表明,该多功能阅读支架可放置不同大小厚度的书籍,满足大部分使用者的阅读需求,阅读姿态识别也能达到理想效果。

  关键词:坐姿识别;自适应台灯;多功能阅读支架

 

  Design of Reading Posture Correction System Based on Machine Vision

  Zhu Jialin,Zhang Jiayu,Deng Jun※,Tan Kaiyuan,Sun Zhenzhong

  (School of Mechanical Engineering,Dongguan University of Technology,Dongguan,Guangdong 523000,China)


  Abstract:In order to correctly cultivate the reading habits of young people,protect the eyesight and health,a machine vision-based reading posture correction reading stand was completed.The reading stand adoptd a unique structural design to ensure a small footprint,and adoptd a telescopic book-holding mechanism to meet daily reading and flipping needs.WS2812 lamp ring and photoresistance sensor were used to form

  an adaptive desk lamp,and an 8Ωspeaker audio module,Micro SD card module and other electronic components were used to form a voice playback module to realize self-adaptive dimming of the desk lamp,placing books of different sizes and thicknesses,and playing eye exercises,etc.multifunctional reading stand.The vision part adoped the machine learning framework Media Pipe developed by Google,and cooperated with the machine vision model to divide the sitting posture into six categories-normal sitting posture,left leaning,right leaning,forward leaning,backward leaning,and supporting hands.Raspberry Pi control board and USB camera were used to realize reading posture recognition and posture correction through voice playback module.The experimental results show that the multifunctional reading stand designed can hold books of different sizes and thicknesses,which can meet the reading needs of most users,and the reading posture recognition can also achieve the desired effect.

  Key words:sitting position recognition;adaptive desk lamp;multifunctional reading stand


  0引言

  近些年来青少年近视问题越来越严重,据国家卫健委最新数据,2020年我国儿童青少年总体近视率是52.7%,幼儿园近视率达14.3%,小学阶段35.6%,初中阶段71.1%,而高中阶段达80.5%[1]。阅读时姿势不正确是引起青少年近视的原因之一,而成年人则可能因为懒散而没有保持正确坐姿,这些习惯会对身体健康造成长期损害,例如引起驼背、颈痛、斜视、扰乱睡眠、背疼等问题[2]。

\

  针对不良读书坐姿问题,目前国内外的研究方向多为穿戴式矫正方式[3-4],如以压力传感器的方式[5]对坐姿分类识别,并未能将寿命更长,成本更低的机器视觉技术与产品结合。目前有关机器视觉坐姿识别算法的研究可归纳为两类:单摄像头的方法[6-7]和多摄像头的方法,单摄像头的模型大多数要求整个人在画面中可见,这为在阅读支架上的使用增加了难度。若能使用单一摄像头识别出使用者的坐姿,将更加节省成本[8]。因此如果设计一款纠正不良坐姿的单一USB摄像头阅读支架,将有助于解决上述问题。

  该款阅读支架基于树莓派平台,使用由Google Re‐search开发并开源的多媒体机器学习模型应用框架进行坐姿识别,并搭载WS2812彩灯、8欧扬声器音频模块和光敏电阻传感器模块等,除了实现主要功能分类矫正坐姿外,还能实现台灯自适应调光、放置不同大小厚度的书籍、播放眼保健操等功能[9]。

  1结构设计

  本文设计的阅读支架是一种置于卧室书桌上便于轻松阅读大、中、小各种规格的书籍的支架,它由箱底座、LED灯、伸缩机构等模块组成,各模块大小合理,工作协调,为使用者提供一个舒适的阅读体验。

  本设计的阅读支架除了实现矫正坐姿的主要功能外,也满足了作为阅读支架的基本功能[10]。设计了实现挡位自由调节的机构,可选择合适自己的阅读角度;独特的伸缩夹书机构,可放置不同大小,不同厚度的书籍,同时也能轻松翻书,提高效率;结构模型如图1所示。

\

  1.1整体结构

  箱底座主要由6块亚克力板组合而成,考虑到该阅读支架的语音提示功能,前面的亚克力板镂空安装一个扬声器,为了更好地检测使用者周围的光线亮度,在前面的亚克力板安装一个光敏电阻传感器;底部的亚克力板与桌面接触,添加4个橡胶片,增大摩擦,使阅读支架更加稳定的摆放;后面的亚克力板设计了与蛇形管连接的端口,以及留了几个散热口;上方的亚克力板则设计了几个纵向整齐排列的突起结构,与支持件共同工作,使阅读支架可在不同挡位调整高度。箱底座内部用于放置树莓派、Arduino Mega2560控制板、电池、Micro SD卡模块各种电子元器件,同时起到保护作用。

  底座后部伸出一根蛇形管,上端连接一个圆环led灯模块,可以调整蛇形管改变led灯的照射方向、照射高度,同时蛇形管也可有效地保护电线不被破环。

  1.2伸缩夹书机构

  考虑到阅读支架的放置范围为书桌等位置,占用面积不会太大,但是又考虑到书籍的大小有不同规格,因此设计体积较小且可夹持不同大小书籍的伸缩机构,使用者可以通过调节伸缩机构,放置自己想读的书籍,可以灵活调节,适应性强。伸缩机构由10个伸缩构件组装而成,中间两个伸缩构件通过一颗螺丝与亚克力板安装在一起,其他伸缩构件通过M5螺栓连接,再通过引导槽限制其上下移动,使伸缩结构只能左右伸缩。图书夹用于夹持书籍,同时不会遮挡到书籍内容,可靠实用。

  2系统设计

  2.1控制系统

  上位机采用树莓派4B平台,树莓派4B的BCM2711芯片采用四核Cortex A72架构,28 nm工艺,主频1.5 GHz,GPU 500 MHz,是一台计算能力强大的嵌入式微型工控机。下位机采用Arduino Mega 2560单片机,Ar‐duino Mega 2560是基于ATmega2560的微控制板,有54路数字输入/输出端口(其中15个可以作为PWM输出),16路模拟输入端口,4路UART串口,16 MHz的晶振,USB连接口,电池接口,ICSP头和复位按钮。简单地用USB连接电脑或者用交直流变压器就能使用。其没用FT‐DI USB-to-serial驱动芯片,而是用ATmega16U2编程作为USB-to-serial传输器(V1版本使用8U2)[11]。上位机树莓派接收摄像头传来数据后输送给下位机Arduino,实现相应功能。

  系统启动后,树莓派运行OpenCV调用摄像头开始收集图像数据,如果画面中检测不到人物,台灯及其他元件保持关闭状态。人物图像数据经过Media Pipe处理后得到姿势地标模型数据,数据经过机器学习模型后得到相应的坐姿类别,最后使用语音模块提醒矫正。整个阅读支架运行算法系统流程如图2所示。

\

  2.2自适应台灯装置

  台灯装置包括WS2812灯环和光敏电阻传感器两部分。通过光敏电阻传感器采集光照亮度后输出的PWM脉冲宽度经过Arduino单片机数据转换,由WS2812模块运用Fast LED库控制台灯亮度的变化,实现根据环境光照的强度自动调节台灯的亮度[12]。同时根据摄像头判断如若当前区域无人,自动关闭台灯装置。起到环保以及保护眼睛的作用。

  Fast LED是一款功能强大、快速高效、简单易用的控制WS2812、LPD8806、Neopixel等LED光带的实用工具。此外,Fast LED还支持完整的HSV颜色模型和经典的RGB颜色系统,以高效的计算效率实现对LED灯的控制。

  光敏传感器(电路图如图3所示)的原理是随着光照强度的升高,电阻值迅速降低,由于光照产生的载流子都参与导电,在外电场的作用下作漂移运动,电子奔向电源的正极,空穴奔向电源的负极,从而使光敏电阻器的阻值迅速下降。其在无光照时,几乎呈高阻状态,暗电阻很大。''

\
 

  2.3语音播放装置

  语音装置包括8欧扬声器音频模块、Micro SD卡模块、SD卡、BD139三极管和100μF电解电容。Micro SD卡模块可以将SD卡中已经转换好的WAV格式的PCM音频输入到单片机中,经过100μF电容后在8欧扬声器模块输出。实现错误坐姿提醒和播放眼保健操。

  BD139三极管主要用来控制电流的大小,起到电流放大作用。其实质是能以基极电流微小的变化量来控制集电极电流较大的变化量。集电极电流随基极电流的变化而变化,并且基极电流很小的变化可以引起集电极电流很大的变化。

  2.4坐姿识别

  坐姿识别方案是一种基于Media Pipe的机器视觉模型,与大多数的坐姿识别模型不同,该方案无需要求整体可见,适合在阅读支架上使用。

  Media Pipe的核心框架由C++实现,并提供Java以及Objective C等语言的支持。Media Pipe的主要概念包括数据包、数据流、计算单元、图以及子图。数据包是最基础的数据单位,一个数据包代表了在某一特定时间节点的数据,例如一帧图像或一小段音频信号;数据流是由按时间顺序升序排列的多个数据包组成,一个数据流的某一特定时间戳只允许至多一个数据包的存在;而数据流则是在多个计算单元构成的图中流动。Media Pipe图是有向的——数据包从数据源流入图直至在汇聚结点离开[13]。

  具体方案为采用OpenCV调取USB摄像头采集姿势地标模型数据,将采集到的22种数据和66个数据特征在树莓派中逐一进行分类整合。一旦图形已经被初始化,就可以开始处理数据,并且可以处理分组的流,直到每个流是封闭的或图形被取消。然后图形可以被销毁或重新启动。之后针对坐姿分为6类:正常坐姿、左倾、右倾、前倾、后仰、托手。使用USB摄像头实时检测用户坐姿如图4所示,并通过语音播放装置提醒。

\

  模型使用了检测器,管道首先在帧内定位人/姿势感兴趣区域(ROI)。跟踪器随后使用ROI裁剪帧作为输入来预测ROI内的姿势标志和分割掩码。处理发生在一个图中,它定义了节点之间的数据包流路径。图可以有任意数量的输入和输出,数据流可以分支和合并。通常数据向前流动,但反向循环也是可能的[14]。

  3实验结果

  为了验证该阅读支架的实际使用效果,项目团队制作了实物(图5),并选择中午12点和晚上9点两个时间点在不同房间以及对不同使用者进行实验。此外,还在实验中增加了一些额外因素,例如多人出现在镜头前方、光线不足等情况。
\

  经过多次实验验证,阅读支架矫正坐姿的准确率能达到理想要求,某一位使用者的姿势地标数据如图6所示。除此之外,本样品也能满足大部分使用者的阅读需求,可放置不同大小厚度的书籍。对于光线不足的情况,LED灯自动调节的亮度能够满足阅读需求。

\
 

  4结束语

  本文主要完成了一种基于机器视觉的阅读姿态矫正系统的总体功能设计,在结构设计上满足了阅读支架的基本需求,并通过树莓派与USB摄像头连接后实时检测当前区域人物的姿势地标数据,经过机器视觉模型分类后由语音播放模块提醒矫正。经过实验验证,该阅读支架具有较高的坐姿分类准确率和较好的读书使用体验,在结构上需要继续优化设计,往成本更低,占用面积更小方向研究发展。

  在当今社会,保持日常阅读习惯有助于身心健康发展。该作品将坐姿识别技术与阅读支架结合,能够满足人们对阅读习惯培养的需要,具有实际的效益。

  参考文献:

  [1]张曼玉.2020年我国儿童青少年总体近视率为52.7%,幼儿园小学是防控重点年龄段[N].中国青年网,2021-7-13.

  [2]Yong Min Kim,Youngdoo Son,Wonjoon Kim.Classification of Children's Sitting Postures Using Machine Learning Algorithm[J].Applied Sciences,2018,8(8):1-20.

  [3]陈玉瑜,乔生红,陆宇辉.一种触碰报警坐姿矫正器的设计[J].机电工程技术,2021,50(6):161-162.

  [4]孙明扬.坐姿监测机器人研究与设计[D].邯郸:河北工程大学,2020.

  [5]关盼盼.基于压力传感器的坐姿识别系统的设计与实现[D].武汉:华中师范大学,2017.

  [6]陈胜娣,魏维,何冰倩.基于改进的深度卷积神经网络的人体动作识别方法[J].计算机应用研究,2019,36(4):1-7.

  [7]张宇.基于人脸检测与肤色统计的坐姿行为监测[J].计算机与网络,2017,43(7):72-75.

  [8]贾若辰.基于机器视觉技术的人体坐姿特征提取及识别算法研究[D].哈尔滨:哈尔滨理工大学,2015.

  [9]陈榕福,何彬林,荣剑.基于机器视觉的智能读书架[J].现代信息科技,2018,2(5):181-185.

  [10]卫静婷,陈利伟,黎斌.基于单片机的智能儿童书桌的设计[J].电子制作,2019(15):28-29.

  [11]刘光乾,陈丹,马兴茹.智慧环境监测设计与应用[N].电子报制作与开发,2020-02-16(7).

  [12]陈炳飞,周朝霞,邱义.亮度自适应的智能台灯设计[J].物联网技术,2018,8(7):98-101.

  [13]MediaPipe团队.MediaPipe:Google Research开源的跨平台多媒体机器学习模型应用框架[EB/OL].(2019-09-15).https://www.163.com/dy/article/EP3T9V820511K58A.html.

  [14]人工智能研究所.利用机器学习,进行人体33个2D姿态检测与评估[EB/OL].(2021-05-04).https://zhuanlan.zhihu.com/p/369764080.
 
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/ligonglunwen/46601.html

相关内容

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml