닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

국내 논문지

홈 홈 > 연구문헌 > 국내 논문지 > 한국정보과학회 논문지 > 정보과학회 논문지 B : 소프트웨어 및 응용

정보과학회 논문지 B : 소프트웨어 및 응용

Current Result Document : 5 / 10 이전건 이전건   다음건 다음건

한글제목(Korean Title) 웹 마이닝을 위한 입력 데이타의 전처리과정에서 사용자구분과 세션보정
영문제목(English Title) User Identification and Session completion in Input Data Preprocessing for Web Mining
저자(Author) 최영환   이상용  
원문수록처(Citation) VOL 30 NO. 09 PP. 0843 ~ 0849 (2003. 10)
한글내용
(Korean Abstract)
웹 이용 마이닝은 거대한 웹 로그들을 이용하여 웹 사용자의 이용 패턴을 분석하는 데이타 마이닝 기술이다. 이러한 웹 이용 마이닝 기술을 사용하기 위해서는 전처리 과정 중의 사용자와 세션을 정확하게 구분해야 하는데, 표준 웹 로그 형식의 로그 파일만으로는 완전히 구분할 수 없다. 사용자와 세션을 구분하기 위해서는 로컬캐시, 방화벽, ISP, 사용자 프라이버시, 쿠키 등과 같은 많은 문제들이 있지만, 이 문제를 해결하기 위한 명확한 방법은 아직 없다. 특히, 로컬캐시 문제는 웹 마이닝 시스템의 입력으로 사용되는 사용자 세션을 구분하는데 가장 어려운 문제이다. 
본 연구에서는 참조 로그와 에이전트 로그, 그리고 액세스 로그 등의 서버측 클릭스트림 데이타만을 이용하여 로컬캐시 문제를 해결하고, 사용자 세션을 구분하고 세션을 보정하는 휴리스틱 방법을 제안한다.
영문내용
(English Abstract)
Web usage mining is the technique of data mining that analyzes web users´ usage patterns by large web log. To use the web usage mining technique, we have to classify correctly users and users session in preprocessing, but can´t classify them completely by only log files with standard web log format. To classify users and user session there are many problems like local cache, firewall, ISP, user privacy, cookey etc., but there isn´t any definite method to solve the problems now. Especially local cache problem is the most difficult problem to classify user session which is used as input in web mining systems. 
In this paper we propose a heuristic method which solves local cache problem by using only click stream data of server side like referrer log, agent log and access log, classifies user sessions and completes session.
키워드(Keyword) 웹 이용 마이닝   데이타 전처리   사용자 세션   세션구분   세션보정   휴리스틱  
원문 PDF 다운로드