语料库制作装置及其方法

Language material storage preparation device and its method

Abstract

A preparing device of word library consists of word drawing out unit, calculation unit of word appearance frequency, calculation unit of correlation degree, word preparing unit and relation preparing unit. It is featured as using relation preparing unit to set up longitudinal contained relation structure in tree form for word obtained from word drawing out unit based on basic meaning between words.
本发明提供一种语料库的制作装置及其制作方法,该装置除了包括单词抽出部、出现频率计算部、关联度计算部、语料库制作部之外,还包括包含关系制作部,该包含关系制作部基于单词之间的语义,对单词抽出部得到的单词用树形结构建立纵向包含关系结构。根据本发明的语料库制作装置及其制作方法所得到的语料库同时具有单词间的纵向包含关系结构、相关网络、相似网络,因此,使用根据本发明制作的语料库不仅可以对各种信息进行有机的组织,而且更加便于根据用户的要求对信息进行分类,在海量的数据中找到个人感兴趣的信息。

Claims

Description

Topics

Download Full PDF Version (Non-Commercial Use)

Patent Citations (3)

    Publication numberPublication dateAssigneeTitle
    CN-1110882-AOctober 25, 1995欧洲佳能研究中心有限公司, 欧洲佳能有限公司处理两种文字对照的数据库的方法与装置
    CN-1116342-AFebruary 07, 1996唐武Chinese automatic proofreading method and system thereof
    CN-1387651-ADecember 25, 2002微软公司词典、分段和语言模型联合优化的系统和迭代方法

NO-Patent Citations (0)

    Title

Cited By (0)

    Publication numberPublication dateAssigneeTitle