닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

학술대회 프로시딩

홈 홈 > 연구문헌 > 학술대회 프로시딩 > 한국정보과학회 학술대회 > KSC 2019

KSC 2019

Current Result Document : 1 / 31   다음건 다음건

한글제목(Korean Title) PMI와 Selectivity를 이용한 논문의 중요 어구 추출
영문제목(English Title) Keyphrases Extraction from Research Papers using PMI and Selectivity
저자(Author) 이준범   박성배   Jun-Beom Lee   Seong-Bae Park  
원문수록처(Citation) VOL 46 NO. 02 PP. 1418 ~ 1420 (2019. 12)
한글내용
(Korean Abstract)
일반적인 중요 어구 추출 방법은 크게 지도학습 기반 방법과 비지도 학습 기반 방법으로 나눌 수 있다. 지도학습 기반의 방법은 수준 높은 데이터를 많이 필요로 한다는 단점이 있어, 최근에는 비지도 기반의 중요 어구 추출 방법에 대한 연구가 중요시 되고 있다. 현재까지 가장 좋은 성능을 보인 비지도학습 기반의 중요 어구 추출 연구에서는 형용사와 명사의 결합만을 어구로 한정하여 중요 어구 후보군을 선정하고, TextRank 수식에서 단어 사이의 거리 정보를 포함하여 후보들의 점수를 계산하여 좋은 성능을 보였다. 그러나, 해당 모델은 후보군을 선정할 때 형용사와 명사의 결합 외의 형태소의 조합을 중요 어구 후보에 포함시키지 못한다는 문제점이 있고, 재귀적 연산을 통해 후보들의 점수를 계산하기 때문에 처리 시간이 오래 걸린다는 단점이 있다. 본 연구에서는 이러한 문제점을 해결하기 위해 다양한 형태소의 단어의 결합을 후보로 추출할 수 있도록 두 단어의 연관성을 수치화하는 Pointwise Mutual Information(PMI)를 중요 어구 후보군을 선정하는데 사용하였고, 특정 단어의 배타성을 수치화하는 Selectivity를 이용하여 후보들의 점수를 계산함으로써 중요 어구를 추출하는데 걸리는 시간을 대폭 단축하였다.
영문내용
(English Abstract)
키워드(Keyword)   
원문 PDF 다운로드