닫기
Loading..

전자정보연구정보센터 ICT 융합 전문연구정보의 집대성

학술대회 프로시딩

홈 홈 > 연구문헌 > 학술대회 프로시딩 > 한국정보과학회 학술대회 > KSC 2019

KSC 2019

Current Result Document : 131 / 609 이전건 이전건   다음건 다음건

한글제목(Korean Title) BERT-SRU와 HTML Tag 자질을 이용한 다중 지문 기계 독해 모델
영문제목(English Title) Multi-paragraph Machine Reading Comprehension Model using BERT-SRU and HTML Tag Features
저자(Author) 이동헌   박천음   이창기   임승영   Dongheon Lee   Cheneum Park   Changki Lee   Soyoou Park  
원문수록처(Citation) VOL 46 NO. 02 PP. 0383 ~ 0385 (2019. 12)
한글내용
(Korean Abstract)
기계 독해는 기계가 입력으로 받은 문단을 분석하고 추론하는 것을 말한다. 기계 독해를 이용하여 주어진 질문과 문단을 이해하고 이에 알맞은 답을 출력하는 것을 기계 독해를 이용한 질의 응답이라 한다. KorQuAD 2.0은 여러 문단으로 구성된 Wikipedia 문서 내에서 답을 찾아야하는 데이터 셋이며, Wikipedia 문서는 HTML 문서로 구성된다. 이에 따라 KorQuAD 2.0의 문서는 길이가 길고, 문제 해결에 의미 없는 HTML tag들을 포함한다. 본 논문에서는 KorQuAD 2.0에서의 기계 독해 질의응답을 위해 정답이 포함된 후보 HTML tag들의 텍스트를 추출하고 연결하여 문서의 길이를 줄이고 해당 tag 정보를 자질로 사용하고, 대용량 코퍼스를 사전 학습한 BERT를 사용하며, 문맥 정보를 자질 정보와 함께 인코딩하기 위하여 SRU(simple recurrent unit)를 추가한 모델을 제안한다. 실험 결과, 본 논문에서 제안한 방법이 KorQuAD 2.0의 개발 셋에서 EM 49.20%, F1 71.21%의 성능을 보였다.
영문내용
(English Abstract)
키워드(Keyword)   
원문 PDF 다운로드