Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 计算机论文 > 正文

基于HTML结构的水印方法研究论文

发布时间:2022-12-21 14:57:03 文章来源:SCI论文网 我要评论














SCI论文(www.lunwensci.com):
 
   摘要:网页水印是网页版权保护中的一种重要方式,现有的网页水印技术大多数是基于网页代码中的格式变换达到隐藏水印信息的目的,水印信息的隐蔽性差,抗攻击能力不强。提出一种新的基于HTML结构的网页水印嵌入方法,预处理后的水印信息与定义好的HTML结构映射,实现水印的嵌入。对网页代码的格式和内容不做任何修改,具有良好的隐蔽性,鲁棒性强,同时有较高的水印容量。
 
  关键词:网页水印;版权保护;预处理;映射
 
  Research on Watermarking Method Based on Div Structure of HTML
 
  YANG Fangxing1,LU Qiuru2
 
  (1.Guangzhou Huizhi Communication Technology Co.,Ltd.Nanjing Branch,Nanjing Jiangsu 210019;2.Jiangsu Electronic Information Product Quality Supervision and Inspection Research Institute(Jiangsu Information Security Evaluation Center),Wuxi Jiangsu 214073)
 
  【Abstract】:Web page watermarking is an important way to protect web page copyright.Most of the existing web page watermarking technologies are based on the format transformation in web page code to embed the watermark information.The concealment of watermark information is poor and the anti-attack ability is not strong.A new web page watermark embedding method based on HTML structure is proposed.The preprocessed watermark information is mapped with the defined HTML structure of web page to achieve the watermark embedding.The format and content of the web page code are not modified,which has good concealment,strong robustness and good watermark capacity.
 
  【Key words】:web page watermarking;copyright protection;preprocess;mapping
 
  0引言
 
  随着互联网的普及发展,网页作为互联网的信息载体,逐渐被广泛应用。互联网信息以明文形式在互联网中传输,网页中重要信息被非法复制、分发、篡改和认证,知识产权保护变得非常困难。网页水印是通过某种规则把水印信息隐藏在网页中,隐蔽性较强,在网页遭到非法复制时可以提取水印验证网页版权归属。因此,研究网页水印对网页版权保护具有重要意义[1]。

\
 
 
  1网页水印研究现状
 
  网页水印技术研究较少,网页中冗余度少,常见的图像水印技术和音频视频水印技术不适用于网页水印,因此在网页中嵌入水印信息有较大的难度[2]。目前已知的网页水印技术存在明显的不足。改变大小写[3]或者空格数[4]的方法都会改变HTML代码的内容,很容易被察觉,水印的隐蔽性差,简单的格式变换或者大小写转换就可以去除水印信息,鲁棒性较差;定义不存在的标签[5]容易被识别,隐蔽性和抗攻击能力不好;使用不同的代码格式[6]虽然隐蔽性较好,但是水印容量小,缺乏足够的水印嵌入点。
 
  为了解决上述问题,本文提出一种新的基于HTML结构的网页水印嵌入方法,预处理后的水印信息与定义好的HTML结构映射,实现水印的嵌入。网页代码的格式和内容不做任何修改,具有良好的隐蔽性,鲁棒性强,同时有较高的水印容量[7]。
 
  2方法的描述
 
  2.1 HTML结构
 
  HTML的结构包括头部(Head)、主体(Body)及多种属性标签、样式标签组成。Head、Body等部分标签是固定不变的,不适合作为水印嵌入点。而像<div>、<span>与class、style等属性组合变化较多,因此,我们考虑提取属性与标签的结构组合,通过一定的映射规则将水印信息隐藏在属性和标签的变化结构中[8]。
 
  2.2水印信息预处理
 
  在水印算法中,如果直接嵌入原始的中文水印信息很容易被识别,传统的水印技术将中文转换为由0和1表示的二进制字符串。为进一步提高水印容量,本文采用四元Huffman编码对水印信息压缩,比如“版权保护”四个中文汉字,其二进制有60位,压缩后的编码缩短为42位,有效提高了水印容量。
 
  2.3 HTML结构位置提取
 
  HTML标签div、span和属性class、style的搭配使用频率非常高,因此考虑提取四种组合结构的位置信息分别对应压缩后的四元Huffman编码,如表1所示。

\
 
  以如图1所示为例,讲解HTML结构的位置信息提取过程。

\
 
  图1HTML结构示例中展示了标签的层级结构,以提取<div class=''>结构为例,最外层定义为第1层,依次往下为第2层等,将第1层所有的DIV取出,记录class是当前第i个DIV中第j个属性,<div class='s-skin-container'>为第1层结构中第1个div,div中第1个属性为class,位置信息记录为D111,<span class="c-font-normal">为第1层结构中第1个span,位置信息记录为S111。重复上述过程,取出HTML中所有的四种结构的位置信息,分别存入四个集合,用类似表达式(1)来记录位置信息,其中Cn(n=0,1,2,3)表示码元n对应的位置信息集合,D表示每个标签属性的位置[9]。
 
  C0={D111,…,D1ij}          (1)
 
  3实现步骤
 
  3.1水印的嵌入
 
  通过水印信息和HTML结构的位置信息映射完成水印的嵌入。首先提取四种HTML映射结构的位置信息,选取的四种位置信息存储在四个集合C0、C1、C2、C3中。然后对水印信息进行Huffman压缩,水印信息预处理后得到由0、1、2、3构成的信息串。最后将得到的四种码元0、1、2、3与四种映射结构类型一一对应。逐个取出水印信息串中的码元,如取出的码元为0,则将其与集合C0中的一个位置信息相映射;如取出的码元为1,则将其与集合C1中的一个位置信息相映射;以此类推。将每个码元映射的位置信息读出,依次存放于一文件中。重复上述过程,将水印信息串中的所有码元均映射为四个集合中的一个位置信息。映射完成即实现了水印的嵌入,最终得到一个存储了四种HTML结构位置信息的文件。为了增加水印映射位置的全局分布性,四种HTML结构集合中的位置信息采用随机选取的方式。如图2所示直观展示了水印信息的映射过程。

\
 
 
  3.2水印的提取
 
  提取水印是根据嵌入水印时得到的位置信息,找到HTML中对应位置的结构信息,根据四种映射结构与水印信息码元(0、1、2、3)的对应关系,反向映射(或称译码)得到水印信息的过程。如果结构为<div class=''>,则译码为0;如果结构为<div id=''>,则译码为1;如果结构为<span class=''>,则译码为2;如果结构为<span id=''>,则译码为3。直到所有的位置信息全部反向映射完毕,即得到嵌入的水印信息串,过程如图3所示,最后进行Huffman解码,得到原始的水印信息。

\
 
 
  4算法的性能
 
  上述水印方法对HTML内容不做任何修改,对网页信息的样式不会产生任何影响。水印信息隐藏在HTML结构中,没有任何痕迹,不易被察觉,具有很好的隐蔽性,增强了算法的鲁棒性。对于大小写转换、空格变化的等格式上的攻击,不会对水印的正常提取产生影响。

\
 
  水印信息隐藏在HTML的结构中,插入、删除等非法操作只要不涉及针对样式的改动,也不会对水印的完整提取产生影响[10,11]。
 
  5结语
 
  互联网时代,网页承担着传播信息的重要责任,网页水印技术作为一种保护网页版权、防止网页被仿冒篡改的重要手段,具有重要的研究和应用价值。本文基于对HTML结构的研究,提出一种HTML结构映射嵌入水印的方法,水印具有很好的隐蔽性和抗攻击性,同时具有较大的水印嵌入空间。与现有的网页水印方法相比,本文提出的方法具有较大的优越性。下一步将在本文所提方法的基础上,进一步研究提高网页水印的鲁棒性。
 
  参考文献
 
  [1]张鑫,闪永强.一种新型网页防篡改策略的研究与部署[J].河南师范大学学报(自然科学版),2011,39(5):157-160.
 
  [2]丁伟.基于Web网页的文本水印技术的研究[D].武汉:武汉理工大学,2012.
 
  [3]万唯一.基于数字水印的网页防篡改技术研究[D].成都:西南交通大学,2012.
 
  [4]ZHANG Z,PENG H,LONG X.A Fragile Watermarking Scheme Based on Hash Function for Web Pages[C]//International Conference on Network Computing&Information Security.IEEE Computer Society,2011:417-420.
 
  [5]陈韦旭,陈建平,文万志,等.基于空样式的网页水印方法[J].计算机科学,2018,45(S2):338-341.
 
  [6]CHOU Y C,LIAO H C.A Webpage Data Hiding Method by Using Tag and CSS Attribute Setting[C]//2014 Tenth Intertional Conference on Intelligent Information Hiding and Multi-media Signal Processing.Kitakyushu,2014:122-125.
 
  [7]RAFAT K F,SHER M.Innocuous Communication Via HTML Hiding Data in Plain Sight[J].Arabian Journal for Science&Engineering,2014,39(2):783-798.
 
  [8]杜耀刚,薛飞.一种基于类名的大容量网页信息隐藏算法[J].密码学报,2017,4(1):29-37.
 
  [9]陈丽.基于XML文档的文本数字水印技术研究[D].北京:北京印刷学院,2015.
 
  [10]张玉梅,和红杰,陈帆.浏览器端定位篡改的网页脆弱水印算法[J].计算机研究与发展,2014,51(12):2604-2613.
 
  [11]曾凡涛.一种基于特殊字符串的网页防篡改方法[J].计算机安全,2012(2):40-41+44.

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!

文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/48698.html

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 鄂ICP备2022005580号-2 | 网站地图xml | 百度地图xml