SCI论文(www.lunwensci.com):
摘 要:本文对计算机技术的主要形式进行介绍,然后阐述大数据环境下计算机技术的应用策略,包括 LRFU 调度策略、 LIRS 调度策略、RDF 数据索引与存储策略等,最后结合实际案例,重点研究计算机挖掘与处理技术的应用措施。主要体现在数据采集、分类、传输等方面。力求通过本文研究,使计算机应用技术优势得以充分发挥,实现信息安全高效管理目标。
关键词:大数据 ;计算机技术 ;信息安全 ;调度策略
Research on Computer Application Technology Based on Big Data Environment
【Abstract】: In this paper, the main forms of computer technology are introduced, and then the application strategy of computer technology in the big data environment is described, including LRFU scheduling strategy, LIRS scheduling strategy, RDF data index and storage strategy, and so on. Finally, combining with practical cases, the application measures of computer mining and processing technology are mainly studied. Mainly reflected in the data collection, classification, transmission and other aspects. Through this study, the advantages of computer application technology can be given full play to achieve the goal of information security and efficient management.
【Key words】: big data;computer technology;information security;scheduling policy
当前,计算机应用技术在各行业逐渐普及,越来越多人开始用计算机开展工作,这不但对计算机技术提出较高要求,还会在无形中产生海量数据,推动社会进入到大数据时代。在此环境下,传统计算机技术很难深入挖掘资源,且难以满足大数据的创新需求,需要充分发挥虚拟应用技术、信息安全技术等新兴科技力量,使智能 管理与计算机应用技术联动,才能跟上时代发展步伐。
1 大数据环境下计算机技术的主要形式
1.1 虚拟应用技术
该项技术在大数据基础上, 对各类数据分配进行针对 性处理,促进信息挖掘、加工与处理等技术发展。通常情 况下,该技术以应用程序形式表现出来,利用虚拟化技术 执行多种类型软件,使程序所占空间被简化,用户整体应用体验感提升。按照工作需求,用户还可对服务器应用程序优化处理,无需更新完善,便可使相应工作需求得到满 足,为用户提供所需解决的各类服务。此外,该项技术还适用于信息深层处理,对复杂信息分门别类,使其成为多个逻辑资源,促进信息安全与资源配置率的提升。
1.2 信息安全技术
在大数据环境下,互联网现已成为企业成长的主要 影响因素,主要因该项技术具有开放性、匿名性特征, 在使用中很容易受到不法分子的入侵,对企业数据安全 构成威胁,阻碍其健康成长。在计算机技术支持下,黑 客、病毒等利用企业系统中软硬件的漏洞,对关键数据 或者商业机密进行篡改、窃取等。当前,信息安全技术 作为计算机应用技术之一,在应用中网络安全协议、防 御等技术逐渐成熟,在大数据环境下能够综合分析企业 发展速度与质量,由管理部门、信息部门一同确保企业 信息安全系统运行,从根源上预防网络安全风险产生, 为企业后期发展起到防护作用 [1]。
1.3 云技术
该项技术由云存储、云计算等内容构成, 在云存储技术应用中,依靠多个线上存储设备,与分布式网络、 多站点交互等功能相结合,使用户可随时随地享受存 储服务。在大数据视域下,该技术可用于海量信息的处 理,以信息管理系统为例,在云存储技术应用后,用户 对批量信息的存储难度明显降低,还可精准定位每个数 据,便于后续查阅。在云计算技术中,依靠云端互联完 成信息处理工作,并同步运算,主导逻辑控制系统,现 已应用到药品开发、智能驾驶等领域,以智能驾驶为 例,可结合用户需求,发挥自动控制系统的作用,在逻 辑运算支撑下实现无人干预的自动驾驶 [2]。
2 大数据环境下计算机处理技术的应用策略
2.1 LRFU 调度策略
在信息技术飞速更新下,该领域内数据开始爆炸式 增长,大数据的社会价值逐渐增高,在此背景下,计算 机应用技术在大数据分层式存储系统的支持下,将发 挥缓存调度策略,使数据处理效率得以提升。该策略 是 LRU 与 LFU 策略的结合体,在数据处理中出现替 换情况时,LRFU 将最小 CRF 数据替换下去,CRF 与 各个数据块相互关联,其作用在于展示数据块可能被访 问的概率值。对于缓存调度策略来说,在实际应用中需 要在 Alluxio 系统内增设两个参数属性,具有可调节功 能,有助于用户完成参数调整后进行 LRFU 控制,还可 节约成本投入。对于任意时间戳来说,都要依托 CRF 变 化才能发生改变,反之会致使 CRF 的成本提升。在应用 期间,可采用以下技术使 CRF 值发生改变。一种是在数 据块已经被访问或者提交的情况下,可对其对应的 CRF 值与时间戳给予调整,在初始 CRF 基础上,获得更改后 的 CRF 值 ;另一种是在首次替换操作后,需要对全部 数据块 CRF 值予以调节。究其原因,对于任意数据块 来说,都要以更新后的 CRF 为参考排列顺序,经过比 较计算出数据块内最小值。在理论层面上看, LRFU 可 在 Frequency-friendly 模式中取得理想应用效果。在 LRFU 中的全部数据块访问顺序均超过预定界限,如若 访问频率相同,便会对数据块随机调整。当处于 Loop 模式时, LRFU 中的部分数据块在内存中未充分替换, 只是具有一定的替换概率。可见,只有在后一种模式 下, LRFU 性能才可达到最佳。在计算机应用中,应结 合用户实际需求,使 LRFU 参数得到科学设定,才可使 实际效果最大限度的接近于预期。
2.2 LIRS 调度策略
在 Alluxio 模式内,此种调度策略的应用要点如下。 首先是明确数据块处理程序,在某数据块提交后,如 若 LIR 仍有充足空间,可将其设定为 LIR_RESIDENT状态,再将其存储到 T1 栈顶,也可将数据块设定为 HIR_RESIDENT 状态, 再存储到 T2 栈顶 ;其次是针 对存储层内的数据块展开处理。该层内数据块处于不断 移动状态,且状态会发生改变,变成 HIR_MOVED 形 态,并自动存储到 T2 栈顶。此时需要对其加强重视, 如若某个数据块没有完全存储到内存中,但却被访问, 则 Access 行为便会被开启,当数据块转移到存储层后, 并受到访问,即便没有 HIR_MOVED 状态, Move 行 为也会被启动,此时数据块状态便会再次发生改变,变 成 HIR_RESIDENT, 在 Access 行为启动后, 块才会 变为初始状态。可见,即便数据块没有被访问,仍会占 据一定的存储空间,需要在首次移动的数据块新增中间 状态,使经过访问和替换的数据块均能得到妥善处理。
2.3 RDF 数据索引与存储策略
2.3.1 查询空间
一般情况下, RDF 三元数据库在存储期间会采用索引技术,使数据查询时三元组配成功率得以提升。在数 据库设计的索引方案中,均参考标准数据库实现设计, 将重心放在 RDF 数据间的关联性、结构特性上。以 3 个应用最频繁的三元组查询为依据,形成更为高效的 索引机制,使数据查询与处理速度得到进一步提升, 确保大多数 SPARQL 查询都能够快速响应,并取得理 想成果。
2.3.2 索引策略
RDF 三元组成分以字符串为基础,表现格式完整, 字符串一般较长。为了尽量缩小数据存储所用空间,可 在 Rainbow 系统内将三元组成分展示出来,以哈希表 形式进行索引,完成维护管理工作,该项技术与标准 数据库基本相同。在编码压缩后,与以往相比存储空间 会明显压缩,还会空余许多磁盘与内存空间,以免中间 结果使数据存储量提升。在查询期间,中间结果受网络 传输的影响较大,结果集明显缩小,还可减少传输数据 量,促进整体查询性能提升 [3]。
2.3.3 数据存储管理
当前 Hadoop 计算机处理技术应用范围逐渐扩大, 现已成为大数据存储管理的关键指标,在应用过程中许 多分布式 RDF 数据库都将 HBase 系统作为底层大规模 RDF 数据存储平台,使该系统的容错性、可拓展性充 分展现出来,在分布式层次化基础上,创建索引存储机 制,使 RDF 数据得到良好存储。在数据访问中,需要 综合分析实验环境、访问模式以及大数据应用性能,采 用 Loop 测试对最佳命中率进行检验,预防存储数据被 病毒入侵,使数据库安全得到保障。
3 大数据环境下计算机挖掘与处理技术的实际应用
3.1 基本情况
在某档案馆运行中,因社会群体需求逐渐增加,档 案管理面对的受众群体更加多元化,传统档案管理模式 的弊端逐渐显现,难以满足日益增长的社会需求,通过 计算机挖掘与处理技术的应用,促进档案数据库建设, 使海量数据能够妥善存储,切实解决馆内资源存储需求 高、难度大等问题。
3.2 技术应用
(1) 数据收集。首先借助计算机挖掘技术, 创建与 档案信息相匹配的数据模型,将其与模型样本对比,寻 找二者差异,便于数据准确分类处理。在测试样本模型 基础上,面向档案信息全面挖掘,确保库内数据准确度 与全面性,也可对现有数据模型深度细化,将其与测 试样本对比,在每个模型测试通过后,便可将其采集到 档案管理内,由此提高管理效率。在数据分类基础上创 建的档案数据模型,可根据档案内容进行差异对比和分 类,寻找相同事件中不同档案的记载,将其汇总起来, 使档案信息更加充实完整,此举有助于档案信息的分 类、整理与筛选,还可对档案内容准确度进行鉴证。
(2) 数据分类。档案管理内容众多, 从业者先要根 据类型不同进行档案数据分类,但传统人工分类方式需 要花费诸多人力与时间,且出错率较高,工作效率较 低。在计算机技术应用后,可创建决策树算法,依据特 定规则开展数据分类和整理,便可在短期内高效完成档 案分类工作,促进工作效率提升。在计算机技术应用 中,以海量、不同类数据为对象,将其整合成训练集, 纳入到未分类档案中,将带有不同属性的档案分类整理 后连接起来。此举可帮助借阅者更快找到所需内容,准 确调取。在借阅者调取任意档案内容后,还会自动弹出 与之相关的推荐内容,也就是类似的档案集,达到智能 信息推荐的目的。上述数据分类可帮助用户尽快找到自 己所需信息,不但节约了时间,还可提高效率,促进档 案价值的充分发挥 [4]。
(3) 数据传输。在大数据基础上, 计算机挖掘技术 不但可用于数据挖掘,还可使传输中常见的不统一、不 完整等问题得以解决,通过创建统一的数据信息网,可 使档案馆内信息实现高速传输,确保全国各地用户都可 在登录该档案馆平台后,随时随地调取所需信息,真正 实现了档案数据互联互通,使信息调取更加轻松自如, 数据应用更加便捷高效。此环节是在决策树结构的支持 下开展,该结构是根据不同指令要求的箭头,为数据传 输指明方向,用户在输入所需查询信息的关键词后,在关键词的引导下可使档案管理资源传输到相应地点。
(4) 数据检索。该环节的主要流程如下 :首先,创建 数据库,将档案资源汇总到数据库内 ;然后,由档案管理 者检索所需调取的信息,并寻找最终答案,依靠相应数据 分析计算,将搜索结果按照使用频率排列 ;最后实施针对 性的挖掘、归纳、整理,选出与调取需求相符合的数据。 还可采用遗传性检索方式,将其与大数据技术结合起 来,使档案信息得到精准获取。在实际应用中,将遗传 性数据特征作为筛选条件,明确资料的差异性,在大数 据遗传算法的支持下,使档案数据得到科学管控和有效 开发,做到长期稳定信息检索,且可随时升级使用。
3.3 应用效果
在大数据视域下,计算机应用技术引入档案管理 后,使档案馆的信息管理效率明显提升,档案调取过程 更加顺畅,支持档案资源的高速重复调取,能够更加迅 速、便捷地获取档案。在数据挖掘技术应用中,为档案 提取、筛选、分类与存储提供了更为科学有效的方式, 档案资源安全也能够得到保障,切实解决了海量档案数 据的安全存储问题。此外,计算机技术挖掘与处理技术 的应用还可使档案信息服务性得以提升,档案管理作为 服务类工作,如何提高服务质量始终是首要课题,加上 档案自身具有机密性,需要登记借阅人员信息,而计算 机技术、大数据技术的应用可使档案数据在全国范围内 调取,并随时查看借阅人员的登记信息,在保障档案安 全的同时,还可提高服务质量。
4 结语
综上所述,当前全球人民处于大数据平台中, 计算 机应用技术日益更新,逐渐渗透到各行各业,开始与信 息化智能管理联动,在满足群众新需求的同时,还应结 合行业特点,选择相应的数据调度与存储策略,使计算 机技术优势在数据采集、分类、传输等方面充分发挥, 为数据挖掘和安全存储提供技术支持。在未来发展中, 该项技术将更加智能,且在更多领域中发挥价值。
参考文献
[1] 姚志添.大数据环境下计算机应用技术和信息管理的整合 [J].电脑编程技巧与维护,2020(10):85-87.
[2] 张永健.大数据背景下计算机应用技术专业实验教学研究 [J].电脑知识与技术,2020,16(3):174-175.
[3] 赖伟良.大数据环境下计算机应用技术的分析及探讨[J].技 术与市场,2020,27(6):100-101.
[4] 田啸.大数据环境下计算机应用技术研究[J].电脑知识与技 术,2019,15(14):246-247.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/63355.html