基于深度学习的Web站点指纹攻击技术

 2022-05-19 10:05

论文总字数:30681字

摘 要

深度学习已经在计算机视觉以及自然语言处理等领域中大获成功,而通过对抗样本和对抗学习等崭新的概念,Ian Goodfellow等学者已经将深度学习的应用拓展到安全领域。

先前的一些研究表明,通过洋葱路由器访问网站所产生的网络流量通过数据包的时间和大小揭示了网站特有的信息。通过捕获用户与其洋葱路由器入口防护之间的流量踪迹,网络窃听者可以利用此元数据来揭示洋葱路由器的用户正在访问哪个网站。本实验展示了攻击者可以自动化特征工程过程,从而通过应用基于深度学习的新方法自动对洋葱路由器流量进行去匿名化。从实验结果中可以得出,自动构建最相关的流量特征并执行准确的流量识别的能力使基于深度学习的攻击成为网站指纹识别的高效,灵活和强大的技术。

在成功地将深度学习应用到网站指纹识别攻击后,本文探索了两种不同的数据修改方式以寻找出有效的防御策略。在实际场景中,运用添加上行空数据包的方式能够有效的削弱深层神经网络的表现,以此防御基于深度学习的网站指纹识别攻击。

关键词:深度学习,网络安全,网站指纹识别,洋葱路由器,对抗样本

ABSTRACT

Deep learning has been very successful in areas such as computer vision and natural language processing. By introducing new concepts, such as adversarial example and adversarial learning, Ian Goodfellow and other scholars have extended the application of deep learning to the field of security.

Several studies have shown that the network traffic that is generated by a visit to a website over Tor reveals information specific to the website through the timing and sizes of network packets. By capturing traffic traces between users and their Tor entry guard, a network eavesdropper can leverage this meta-data to reveal which website Tor users are visiting. In this paper, I show that an adversary can automate the feature engineering process, and thus automatically deanonymize Tor traffic by applying our novel method based on deep learning. It is concluded that the ability to automatically construct the most relevant traffic features and perform accurate traffic recognition makes our deep learning based approach an efficient, flexible and robust technique for website fingerprinting.

After successfully applying deep learning to website fingerprinting attacks, I explored two defensive strategies. In reality, so as to defense the website fingerprinting attack based on deep learning.

KEY WORDS: Deep Learning, Cybersecurity, Website Fingerprinting, The Onion Router, Adversarial Examples

目 录

摘 要 I

ABSTRACT II

第一章 绪论 1

1.1研究背景 1

1.2研究现状 1

1.2.1 基于朴素贝叶斯的网站指纹识别攻击 1

1.2.2 基于支持向量机的网站指纹识别攻击 2

1.2.3 基于CUMUL的网站指纹识别攻击 2

1.2.4 基于深度学习的网站指纹识别攻击的首次应用 2

1.3研究目标和内容 3

1.4论文组织结构 3

第二章 技术背景 5

2.1洋葱路由器(The Onion Router, Tor) 5

2.2深度学习(Deep Learning) 5

2.2.1 多层降噪自动编码器(Stacked Denoising Autoencoders SDAE) 6

2.2.2 卷积神经网络(Convolutional Neural Network, CNN) 6

2.2.3 长短期记忆网络(Long Short-term Memory, LSTM) 6

2.3 对抗样本(Adversarial Examples) 6

2.4 本章小结 7

第三章 基于深度学习的网站指纹识别攻击技术 8

3.1 方案设计 8

3.2 数据处理 9

3.2.1 数据表示形式 9

3.2.2 数据预处理 10

3.3 深度学习环境搭建 11

3.4神经网络的搭建 11

3.4.1 SDAE模型的搭建 11

3.4.2 CNN模型的搭建 12

3.4.3 LSTM模型的搭建 13

3.5 本章小结 14

第四章 实验验证和防御策略 15

4.1 数据集划分规则 15

4.1.1封闭世界数据集: 15

4.1.2随时间推移重新访问数据集: 15

4.1.3开放世界数据集: 15

4.2神经网络模型训练 16

4.3超参数调整和选择 16

4.4实验评估 17

4.4.1封闭世界评估 17

4.4.2 概念漂移评估 19

4.4.3开放世界评估 21

4.5 应对网站指纹识别的防御策略 23

4.5.1 基于快速梯度符号方法生成对抗样本的防御策略 23

4.5.2 基于添加Tor信元的防御策略 24

4.6 本章小结 29

第五章 总结与展望 30

5.1 结论 30

5.2 展望 31

参考文献 32

致 谢 35

绪论

1.1研究背景

互联网中的隐私保护问题一直广受关注,而洋葱路由器则作为实现匿名通信软件,是互联网上用于保护隐私的最有力的一项工具。每年有近5000万人次下载洋葱路由器,迅速增加的用户群体也为洋葱路由器带来更多的功能。比如,2013年,正是斯诺登将“棱镜门”事件的信息通过洋葱路由器发布在暗网上,以此躲避美国政府的追捕。美剧《纸牌屋》更是将洋葱路由器比作一把打开通往“暗网”世界大门的钥匙。

剩余内容已隐藏,请支付后下载全文,论文总字数:30681字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;