닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

국내 논문지

홈 홈 > 연구문헌 > 국내 논문지 > 전자공학회 논문지 (Journal of The Institute of Electronics and Information Engineers)

전자공학회 논문지 (Journal of The Institute of Electronics and Information Engineers)

Current Result Document : 7 / 8

한글제목(Korean Title) 토르 웹사이트 핑거프린팅을 위한 트래픽 시퀀스의 벡터화와 앙상블 알고리즘 분류
영문제목(English Title) Traffic Sequence Vectorization and Ensemble Algorithm Classification for Tor Website Fingerprinting
저자(Author) 오형석   황두성   김원겸   Hyoungseok Oh   Doosung Hwang   Wongyum Kim  
원문수록처(Citation) VOL 57 NO. 05 PP. 0290 ~ 0298 (2020. 05)
한글내용
(Korean Abstract)
토르 네트워크는 다수의 릴레이 노드를 통해 암호화를 진행하여 익명성을 보장한다. 웹사이트 핑거프린팅은 사용자와 엔트리 노드 사이에서 발생한 트래픽 데이터를 분석하여 웹사이트 식별을 목표로 한다. 본 논문은 시간 변화에 따른 웹사이트 핑거프린팅 방법을 제안한다. 선정된 웹 카테고리 내 웹 사이트에 대해 임의 접근 시간을 반영하여 여러 번 접근하여 트래픽 데이터를 수집하며, 전처리와 특징추출 단계를 통해 훈련 데이터를 준비한다. 네트워크 성능과 프로토콜로부터 발생되는 트래픽 시퀀스의 송수신 시간 간격, 패킷 길이, 버스트 등 특징을 추출하여 훈련벡터를 구성한다. 이를 트리 앙상블 알고리즘 학습에 사용하여 시간상 웹사이트 핑거프린팅의 분류 성능의 변화를 비교 한다. 앙상블 모델의 평균 탐지율은 90.0% 이상이며 엑스트라 트리 알고리즘이 93.0%로 높은 성능을 보인다. 최초의 학습모델과 30일 동안 지속적으로 학습된 데이터를 비교했을 경우 10.0%가 감소하였다. 그러므로 기계학습을 이용한 웹사이트 핑거프린팅은 정기적 모델 학습 전략이 요구된다.
영문내용
(English Abstract)
Tor network processes encryption through a variety of relay nodes to ensure anonymity. Website fingerprinting aims to identify the visiting website by analyzing the traffic sequence that arises between the user and the entry node. This paper suggests an effective website fingerprinting method over time. The traffic data is collected by accessing the web site within the selected web category at random times to reflect the random access time, and the training data is prepared through the preprocessing and feature extraction steps. The training vector is consist of features such as incoming/outgoing time interval, packet length and burst from traffic sequence according to network performance and protocols. The tree ensemble algorithms is applied to compare the classification performance of website fingerprinting over time. The average detection rate of the ensemble model is over 90.0% and the extra tree algorithm shows high performance of 93.0%. The comparison of the original learning model with data trained continuously over 30 days reduced 10.0%. Therefore, a website fingerprinting method that is based on a machine learning approach requires a regular model learning strategy.
키워드(Keyword) Tor   Websitefingerprinting   Ensemble algorithm  
원문 PDF 다운로드