닫기
Loading..

Please wait....

국내 논문지

홈 홈 > 연구문헌 > 국내 논문지 > 한국정보과학회 논문지 > (구)정보과학회 논문지

(구)정보과학회 논문지

Current Result Document : 2 / 5 이전건 이전건   다음건 다음건

한글제목(Korean Title) Compact TRIE Index(CompTI):한국어 전자 사전을 위한 데이터베이스 색인 구조
영문제목(English Title) Compact TRIE Index(CompTI):A Database Index Structure for the Korean Electronic Dictionary
저자(Author) 이승선   송주원   조완섭   황규영   최기선   SeungSun Lee   JuWon Song   WanSup Cho   KyuYoung Whang   KiSun Choi  
원문수록처(Citation) VOL 22 NO. 01 PP. 0003 ~ 0012 (1995. 01)
한글내용
(Korean Abstract)
 형태소 해석은 한국어 문서 처리의 중요한 요소 중의 하나이다. 형태소 해석은 빈번한 사전 검색을 요하므로, 한국어 전자 사전을 위한 데이터베이스 색인 구조를 유지해야 한다.
 본 논문에서는 트리이를 기본 구조로 하는 한국어 전자 사전을 위한 데이터베이스 인덱스 구조를 설계하고 구현하였다. 사전에 요구되는 주 기억 장치의 사용량을 최대한 줄이기 위하여, 색인 구조는 트라이 각 노드의 크기에 다라 분류된 유형 1. 유형 2, 유형 3 세 가지의 배열을 사용한다. 또한, 빠른 사전 검색을 제공할 수 있도록 2400여개의 첫 글자를 위한 유형 0배열을 따로 둔다. 유형 0 배열은 첫 글자에 해당되는 KS코드로 바로 검색할 수 있고, 코드의 변환이 없이 글자의 종성을 제거할 수 있다. 더욱이 유형 0 배열은 자식 필드를 여러 개 두기 때문에 검색하는 노드의 수를 줄일 수 있다.
 이 데이터베이스 인덱스 구조의 특성은 다음과 같다.  ()사전의 검색과 사전의 구성, 로드 및 저장이 기존의 다른 구조보다 훨씬 빠르다. (2) 색인 구조는 TRIE 구조에 필요한 최소의 주 기억 장치만을 사용한다. (3) 사전 엔트리의 삽입과 삭제가 가능하다.
영문내용
(English Abstract)
Morphological analysis is one of the essential components for Korean document processing. Since the analysis requires frequent accesses to the dictionary, the electronic dictionary should have an efficient indexing structure that reflects linguistic features of the Korean language.
 In this paper, we design and implement a database index structure based on TRIE for the Korean electronic dictionary. To maximize the utilization of main memory space, the index structure uses four types of arrays classified into type 0, type 1, type 2 and type 3 according to the sizes of the nodes in the TRIE. The type 0 array is introduced for the 2,400 first syllables of words to facilitate direct access using the KS 5601 code. Type 0 array also makes it easy to find the word with the last phoneme of a syllable removed, obviating time-consuming code translation.
 The characteristics of the database index structure are as follows : (1) operations for accessing, constructing, loading, and saving the dictionary run much faster than other existing index structures, (2) the TRIE structure requires near optimal main memory space, and (3) dictionary entries can be inserted and deleted incrementally.
키워드(Keyword)
파일첨부 PDF 다운로드