SCI论文(www.lunwensci.com)
摘要: 如今,随着信息科技的快速发展,我国已经进入大数据时代。在此背景下,数据融合存储与分析 应用的需求也随之增加。为了从海量数据中提取高价值的数据信息,各领域越发重视对大数据的可视化 技术的研究与应用。该技术能直观明了地向人们展示最精确、最有效的信息。因此, 在大数据时代背景下, 开展数据可视化技术研究、促进数据可视化技术的创新与发展具有重要意义。本文从大数据的特征及其 应用需求出发,结合数据可视化的研究现状,着重介绍基于大数据的数据可视化技术和发展趋势,并分析 在大数据环境下数据可视化需解决的重要问题。
关键词:大数据;数据可视化;可视化应用
Research and application of big data visualization technology
Ye Jianjun, Ma Quanlei
(the 28th Research Institute of China Electronics Technology Corporation, Nanjing Jiangsu, 210000)
Abstract: Nowadays, with the development of information technology, China has entered the era of big data. In this context, the demand for data fusion storage and analysis applications is also increasing. In order to extract high-value data information from massive data, many fields attach importance to the research and application of big data visualization technology. This technology can intuitively and clearly show people the most accurate and effective reference information. Therefore, under the background of big data era, it is of great significance to study data visualization technology and promote the innovation and development of data visualization technology. Starting from the characteristics and application requirements of big data, combined with the research status of data visualization, this paper introduces the data visualization technology and development trend based on big data, and analyzes the important problems to be solved by data visualization in the big data environment.
Key words: big data; data visualization; visual application
一、数据可视化的作用
如今,在大数据时代下,有效处理大量信息数 据,对各领域而言都非常重要。数据可视化分析是 一条有效的途径,能充分发挥数据的价值,促进相 关行业领域的快速发展。数据可视化技术是一种通 过应用计算机视觉和图像处理等技术手段,将一些 网页、地图和图表等多元异构的数据内容变得更加 容易被人接受的技术。借助大数据的可视化技术, 一些多维、复杂的数据能以可视化的方式呈现,并 通过简洁明了的视觉形式,提高人们对数据的接受 度。数据可视化交互技术可对大量数据进行采集、 开发、分析,然后将多元、抽象的信息以可视化的 方式展示出来,为用户提供直观、便捷的人机交互 环境,对人们挖掘信息的价值具有重要意义 [1]。
二、基于大数据的数据可视化技术
(一)时序信息的可视化
当前,对大数据信息视觉可视化技术来说, 时序信息的可视化是一个尚未完美解决的问题。 造成该现象的主要原因是时间信息和其他类型的 信息数据在本质上存在差异,且差异度很大。时序信息最主要的基本特征是具有不能更改的顺序 性 [2] 。2000 年, 外国学者 Susan Hanre 曾设计过 时序信息方面的可视化技术,将河流作为模型来 打造 Theme River 模型,以此展示时序信息随着 时间变化及数据同步变化所产生的可视化计算方 法。这种类型算法的最大优点是能够展示多个类 型的时序信息的整体变化过程,但此算法也有显 著的缺点,即用户不能直接在图像观察中得到时 序信息的实际数据及数据的相关属性。2007 年, Johansson 以 此 技 术 为 基 础, 设 计 了 Temporal Density Parallel Coordinates 算法与 Depth Cue Parallel Coordinates 算法, 这两种算法主要采 用转化函数来获得具体的绘图颜色,在平行坐标系 中运用多边形来代替折线展示数据随着时间增长而 出现的变化。这种算法和可视化技术可以在观测信 息数据时展示发生变化的位置,但该算法有数据遮 挡等比较明显的缺点。随后,我国有学者对时序信 息可视化进行深入研究及创新,并提出多变元时序 数据可视化方法。此可视化技术的基本流程是通过 时间维度进行分段,以及通过视觉聚类采用恰当的颜色进行绘制,以此完成时序信息数据的可视化处 理 [3] 。通过该技术,用户可以明确观测到信息数 据的变化趋势和产生突变的具体时间,可有效解决 数据遮挡问题。
(二)多维度信息可视化
多维度信息可视化算法涉及 Inselberg 提出的 平行坐标技术等。该算法能将高维度数据转化为二 维或三维空间数据,但是该算法的整体难度较高, 需耗费大量的时间,且没有足够的实用性,因此无 法满足大数据可视化的应用需求 [4] 。近年来,国 内外诸多学者对多维度信息可视化方式展开大量研 究。部分学者尝试将数据集中在平行坐标上进行可 视化处理,这种方式能对较大的数据进行聚类处理, 然后对类区间的宽度进行划分,按照自身的权重大 小进行顺序排列,最后作图。与平行坐标可视化技 术相比,以类区间为基础的平行坐标可视化技术能 有效解决比较烦琐的数据线段问题,让数据线段的 布局更加清晰,使用户能够全面了解数据,为多维 度信息可视化技术的应用提供更多便利条件。
(三)层次信息可视化
在大数据时代下,层次信息是常见的一种结构 信息,如计算机文件系统、系谱图等。在层次信息 可视化中,最常见的方法是 Johnason 设计的树图 布局算法。不过在大数据层次信息中,此类型的可 视化展示方式存在较多漏洞,如横向层次节点数和 纵向树深层数的扩展比例失衡、分支比较拥挤等, 这些问题造成层次结构的展示比较模糊。为了解决 该问题,有学者设计了新型的可视化技术,即多维 度坐标 MCT 技术。此技术以 Surip 与 Squrified 布 局算法为基础算法,将树图节点四条边设定成 4 条 属性轴,然后根据其属性值进行计算,接着把计算 结果反映在属性轴中,完成首尾间的依次连接与曲 线拟合。这样做可以让层次信息在每个区域都能实 现可视化,预防树形结构比例不均衡的情况,并将 层次信息更加清晰地展示给用户。此外,还有部分 学者设计了大众标记层次可视化算法,虽然该方法 能够最大化地提升空间的利用率,但依旧不能解决 跨层次与多个层次的数据问题。
(四) Web 数据的可视化
在Web 数据的可视化过程中, 首先要挖掘数据、 简化数据处理、解决数据相关的复杂性问题,所提 问题应以数据本身为基础,而非基于人的主观意识 进行设计 [5] 。其次要进行数据规律分析,在海量 且繁杂的数据中寻找相应领域密切相关的有价值的 数据,并以相关数据信息作为可视化前提。但要在 海量、多类的数据中精确寻找目标数据并非易事, 因此,可基于可视化技术要求,优化设计智能分析挖掘技术,高效筛选数据,进而基于相关数据实现 再加工和展示。最后是数据展示。数据展示并非单 一呈现不同类型数据间的关系或某种数据发展趋 势,而是要在精确设计的基础上,以能够让用户一 目了然且符合其信息了解需求的方式呈现出来,具 体可通过统计图表或 Web 报表的形式为用户展示不 同类型的数据,使数据表示更加直观易懂。
Web 数据可视化主要采用前后端分离的策略, 前端着重于可视化渲染、可视化交互和可视化分析, 后端着重于服务计算 [6] 。要想以可视化的形式展 示 Web 数据,并使用户简单、便捷地理解可视化数 据结果,必须选择合适的可视化展示方式,如以视 觉冲击的方式重点突出某一方面的内容。通常来说, Web 数据的可视化呈现方式分为以下几种。
第一,色彩。以不同色彩的方式呈现可视化数 据结果,能使用户在观看数据结果时获得赏心悦目 的感受,并通过对比强烈的冷暖色调使用户更便捷 地读取可视化结果。第二,时间轴。以时间轴的方 式展示随着时间不断推移而改变的数据,能使用户 更清晰地了解某种数据在某一时间范围内的变化及 相关数据的关联特征,为用户作出相关决策提供依 据。目前,这种呈现方式非常普遍。第三,位置。 部分软件需要根据用户位置的改变进行同步调整, 或作出预测。目前,以位置改变为基础的可视化呈 现方式广为流行。此方式能在地图和有关数据间建 立关联,以可视化方式展示某种虚拟地址及相关位 置数据等。第四,尺寸。在对比展示数据信息的过 程中,可基于不同对象差异化的尺寸大小来凸显对 象间的关联性或重要性,以此使用户直观地根据尺 寸大小的展示迅速辨别不同 Web 数据间的关联性及 其对决策的重要性。这种展示方式简洁易懂,因此 应用也非常广泛。
三、数据可视化技术的发展趋势
(一)实时数据之间的关联
数据可视化不仅可以反映数据的状态,还可找 出若干具有关联的数据之间存在的关系,从而直观 呈现出该数据的发展趋势。比如,目前,人们经常 使用的各类电子钱包,能够自动记录消费者在当月 的每一笔消费记录,并不断汇总,最后在月末进行 总结,生成该用户的具体消费数据,其中包括每笔 消费金额及各种消费占比。相关企业可通过用户的 实时消费数据来及时调整和规划生产与营销方案, 以满足不同用户的需求。总之,实施数据的可视化 能够及时为用户提供数据关联分析的可视化服务, 助力用户更加方便地找出数据之间存在的关联性。
(二)多维度数据叠加
多维度数据叠加可视化是指通过技术手段将高维数据展示在二维平面中的技术。该技术在进行探 索性数据分析及在分类、聚类问题的验证中有着 重要的应用价值。在具体应用中,多维度数据叠加 表现为社交网络或生活类数据与数字地图之间的叠 加。以数字地图为基础的相关网络数据信息共享和 发散,具有一定的直观性和互动性 [7] 。比如,基 于多维度可视分析方法建立的全国疫情地图,图中 用不同的颜色及颜色深浅来可视化呈现不同地区的 疫情严重程度。点击其中某个省份,可关联弹出该 省份的昨日新增确诊、新增无症状、新增疑似病例 及本轮累计确认、累计无症状病例等数据。通过多 维度数据叠加的可视化方式对新冠疫情各类数据进 行基于数字地图的直观展示,可挖掘数据价值,辅 助分析决策。
四、结语
我国已经进入大数据时代,如何对大数据进行 更深层次的分析和发掘已成为当今人们共同关注的 问题。可视化技术的研究与应用可以让海量数据的 可视化具有一定的可行性,满足人们掌握数据全局 和最关切信息等需求。对较大规模的数据进行聚类 展示,能使用户在极短时间内发现数据中的关键价值。
【参考文献】
[1] 俞剑,张伯生,钱国栋 . 数据可视化交互技术在雷达信号记录仪中的应用 [J]. 指挥信息系统与技 术,2013(6).
[2] 史国举 . 数据可视化技术在大数据分析领域的 应用及发展研究 [J]. 无线互联科技,2021(18).
[3] 罗仁芝 .基于大数据时代下的可视化方法分析 [J]. 信息通信,2020(3).
[4] 沈恩亚 . 大数据可视化技术及应用 [J]. 科技导 报,2020(3).
[5] 罗敏刚 . 探析大数据可视化技术与工具 [J]. 科技 视界,2020(9).
[6] 李亚钊 ,郭婉,李彭伟,黄翔 . 基于 Web 的目 标态势可视化设计与实现 [J]. 指挥信息系统与技 术,2020(2).
[7] 刘滨,刘增杰,刘宇,李子文,陈莉,孙中贤,王 莹,张一辉,赵佳盛,张红斌,刘青 . 数据可视化研 究综述 [J]. 河北科技大学学报,2021(6).
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网 文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/44291.html