닫기
Loading..

Please wait....

국내 논문지

홈 홈 > 연구문헌 > 국내 논문지 > 한국정보통신학회 논문지 (J. of the Korea Inst. of Information&Communication Engineering)

한국정보통신학회 논문지 (J. of the Korea Inst. of Information&Communication Engineering)

Current Result Document : 8 / 18 이전건 이전건   다음건 다음건

한글제목(Korean Title) 문서 분석 기반 주요 요소 추출 시스템
영문제목(English Title) Document Analysis based Main Requisite Extraction System
저자(Author) 이종원   여일연   정회경   Jongwon Lee   Ilyeon Yeo   Hoekyung Jung  
원문수록처(Citation) VOL 23 NO. 04 PP. 0401 ~ 0406 (2019. 04)
한글내용
(Korean Abstract)
본 논문에서는 XML 형태의 논문이나 보고서로 작성된 문서를 분석하는 시스템을 제안한다. 논문이나 보고서에서 지정한 키워드를 추출하고 이를 사용자에게 보여준 뒤 사용자가 해당 문서 내에서 검색을 원하는 키워드를 입력하면 각 키워드들을 포함하고 있는 문단들을 추출한다. 시스템은 사용자가 입력한 키워드들의 빈도수를 확인하고 가중치를 계산한 뒤 가중치가 가장 낮은 키워드만을 포함한 문단들을 제거한다. 또한, 정제된 문단들을 10개의 영역으로 나눈 뒤 영역별 문단들의 중요도를 계산하고 각 영역들의 중요도를 비교하여 가장 높은 중요도를 갖는 주요 영역을 사용자에게 알려준다. 이러한 특징들로 인해 제안하는 시스템을 활용할 경우 기존의 문서 분석 시스템을 활용하여 논문이나 보고서를 분석하는 것보다 압축률이 높은 형태로 주요 문단들을 제공받을 수 있다. 이로 인해 문서를 이해하는데 필요한 시간을 줄일 수 있을 것으로 사료된다.
영문내용
(English Abstract)
In this paper, we propose a system for analyzing documents in XML format and in reports. The system extracts the paper or reports of keywords, shows them to the user, and then extracts the paragraphs containing the keywords by inputting the keywords that the user wants to search within the document. The system checks the frequency of keywords entered by the user, calculates weights, and removes paragraphs containing only keywords with the lowest weight. Also, we divide the refined paragraphs into 10 regions, calculate the importance of the paragraphs per region, compare the importance of each region, and inform the user of the main region having the highest importance. With these features, the proposed system can provide the main paragraphs with higher compression ratio than analyzing the papers or reports using the existing document analysis system. This will reduce the time required to understand the document.
키워드(Keyword) 문단 추출   문서 분석   순서 유지   중복 제거   키워드   Paragraph Extraction   Document Analysis   Sequence Maintenance   Deduplication   Keyword  
파일첨부 PDF 다운로드