三田図書館・情報学会誌論文(論文ID LIS034029)
- 著者
- Pan Koo Kim
- 和文タイトル
- An Automatic Indexing of Compound Words based on Mutual Information for Korean Text Retrieval
- 英文タイトル
- An Automatic Indexing of Compound Words based on Mutual Information for Korean Text Retrieval
- 掲載号・頁
- No.34, p.29-38
- 発行日
- 1997-03-31
- 和文抄録
最近,自然語テキスト表現に対する索引語として単語と複合語が広く利用されてきている。本稿では,膠着語,特に韓国語に適した複合語の自動索引手法を提案している。まず,索引語としての複合語を組み立てるための条件を述べ,次に,テキスト全体から連続する名詞群に適用できる分解規則を示した。最後に,情報理論に基づき複合語における語の連合の程度を算出する,語の利用可能性を測定する一つの尺度として相互情報を提案した。この方法を当てはめた結果,複合語の語の精度は72%から87%に向上した。
- 種別
- 原著論文