닫기
Loading..

Please wait....

국내 논문지

홈 홈 > 연구문헌 > 국내 논문지 > 한국정보과학회 논문지 > 정보과학회 논문지 B : 소프트웨어 및 응용

정보과학회 논문지 B : 소프트웨어 및 응용

Current Result Document : 4 / 10 이전건 이전건   다음건 다음건

한글제목(Korean Title) 비지도 학습을 기반으로 한 한국어 부사격의 의미역 결정
영문제목(English Title) Unsupervised Semantic Role Labeling for Korean Adverbial Case
저자(Author) 김병수   이용훈   이종혁  
원문수록처(Citation) VOL 34 NO. 02 PP. 0112 ~ 0122 (2007. 02)
한글내용
(Korean Abstract)
말뭉치를 이용하여 통계적으로 의미역 결정(semantic role labeling)을 하기 위해서는, 의미역을 태깅하는 작업이 필수적이다. 그러나 한국어의 경우 의미역이 태깅된 대량의 말뭉치를 구하기 힘들며, 이를 직접 구축하기 위해서는 많은 시간과 노력이 필요한 문제점이 있다. 본 논문에서는 비지도 학습의 하나인 self-training 알고리즘을 적용하여, 의미역이 태깅되지 않은 말뭉치로부터 의미역을 결정하는 방법을 제안한다. 이를 위해, 세종 용언 전자사전의 격틀정보를 이용하여 자동으로 학습 말뭉치를 구축하였으며, 확률 모델을 적용하여 점진적으로 학습하였다. 그 결과, 4개의 부사격 조사에 대해 평균적으로 83.00%의 정확률을 보였다.
영문내용
(English Abstract)
Training a statistical model for semantic role labeling requires a large amount of manually tagged corpus. However, such corpus does not exist for Korean and constructing one from scratch is a very long and tedious job. This paper suggests a modified algorithm of self-training, an unsupervised algorithm, which trains a semantic role labeling model from any raw corpora. For initial training, a small tagged corpus is automatically constructed from case frames in Sejong Electronic Dictionary. Using the corpus, a probabilistic model is trained incrementally, which achieves 83.00% of accuracy in 4 selected adverbial cases.
키워드(Keyword) 의미 분석   의미역 결정   부사격   비지도 학습   semantic analysis   semantic role labeling   adverbial case   unsupervised learning  
파일첨부 PDF 다운로드