닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

국내 논문지

홈 홈 > 연구문헌 > 국내 논문지 > 한국정보과학회 논문지 > 정보과학회논문지 (Journal of KIISE)

정보과학회논문지 (Journal of KIISE)

Current Result Document : 10 / 14 이전건 이전건   다음건 다음건

한글제목(Korean Title) 문서 분석을 위한 무한 잠재 주제 모형
영문제목(English Title) Infinite Latent Topic Models for Document Analysis
저자(Author) 신봉기   Bong-Kee Sin  
원문수록처(Citation) VOL 45 NO. 07 PP. 0701 ~ 0707 (2018. 07)
한글내용
(Korean Abstract)
토픽의 개념은 매우 추상적이기 때문에 텍스트의 토픽 표현을 정의하기는 매우 어렵다. 문제의 맥락이나 필요에 따라 다양한 수준에서 토픽을 구분할 수 있는데 이 때문에 문서 분석을 자동화하기가 어렵게 된다. 본 논문에서는 널리 알려진 Latent Dirichlet Allocation (LDA) 모형을 무한 토픽 모형으로 확장하는 방법으로 무한 잠재 디리슐레 토픽 모형과 무한 잠재 마르코프 토픽 모형을 제안한다. 첫째 모형은 디리슐레 과정(Dirichlet process)을 이용하여 LDA에서 토픽의 고정된 개수 제한을 푸는 방법이다. 둘째 모형은 여기에 마르코프의 동적 연쇄 특징을 추가하여 텍스트 토픽의 순차적 변화 구조를 포착하는 방법이다. 제안 모델은 모두 문서를 적절한 수준의 토픽에서 구성을 분석할 수 있어서 이론적 엄밀성과 구조적 유연성을 제공한다. 일련의 실험을 통하여 관찰된 분석 결과로 기존의 LDA와 변분법 추론에 기반한 동일 모형과 비교하였을 때 보다 직관적이며 국소적 토픽 정상성(topic-stationarity)을 잘 보여주는 것을 확인해 주었다.
영문내용
(English Abstract)
Since the concept of the topic is highly abstract, the characterization of the topics of a text is not clearly defined. Depending on the problem’s context or needs, various levels of detail may be provided, which could make it difficult to automatically analyze documents. This paper presents infinite topic extensions to the well-known model of Latent Dirichlet Allocation (LDA) i.e., the infinite Latent Dirichlet Topic model and the infinite Latent Markov Topic model. The first model simply relaxes the constraint of fixed known number of topics in LDA using the method of the Dirichlet process. The second model further extends it by including Markov dynamics that captures the sequential evolution of topics in a text. Both models are theoretically rigorous and structurally flexible, as well as being capable of capturing document organizations at a desired level of topics. A set of experiments show interesting results and a more intuitive topic characterization and local stationarity properties than related models with Gibbs sampling and variational inferences.
키워드(Keyword) 토픽 모델   무한 잠재 토픽   디리슐레 과정   마르코프 연쇄   깁스 표집   topic model   infinite latent topics   Dirichlet process   Markov chain   Gibbs sampling  
원문 PDF 다운로드