Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SYSTEM, METHOD, AND PROGRAM FOR MACHINE TRANSLATION TO CHINESE
Document Type and Number:
WIPO Patent Application WO/2009/078429
Kind Code:
A1
Abstract:
The quality of translation to a Chinese sentence from an original sentence including an ability expression is improved. A machine translation system comprises analyzing means (101) for analyzing an inputted sentence of an original language, a database (a DB for ability complement judgment) (103) in which ability expressions of the original language and output patterns of complements including ability complements of Chinese are stored with the ability expressions associated with the output patterns, ability complement judging means (102) for determining the output patterns of complements including the ability complement(s) corresponding to the ability expression of the original language analyzed by the analyzing means while looking up the database, and translating means (104) for translating the sentence of the original language to a sentence of Chinese according to the output patterns of the complements.

Inventors:
XU JINAN (JP)
OSADA SEIYA (JP)
YAMABANA KIYOSHI (JP)
Application Number:
PCT/JP2008/072955
Publication Date:
June 25, 2009
Filing Date:
December 17, 2008
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
NEC CORP (JP)
XU JINAN (JP)
OSADA SEIYA (JP)
YAMABANA KIYOSHI (JP)
International Classes:
G06F17/28; G06F17/27
Other References:
BU ZHAOHUI ET AL.: "Nicchu Kikai Hon'yaku ni Okeru Hiteibun no Hon'yaku", JOURNAL OF NATURAL LANGUAGE PROCESSING, vol. 11, no. 3, 10 July 2004 (2004-07-10), pages 97 - 122
BAI JING ET AL.: "Bun Koseiso no Tekisetsu na Sentaku to Haichi ni yoru Shizen na Nicchu Kikai Hon'yaku", INFORMATION PROCESSING SOCIETY OF JAPAN KENKYU HOKOKU, vol. 2006, no. 124, 22 November 2006 (2006-11-22), pages 41 - 46
Attorney, Agent or Firm:
KATO, Asamichi (20-12 Shin-Yokohama 3-chomeKohoku-ku, Yokohama-shi, Kanagawa, JP)
Download PDF:
Claims:
 入力された原言語の文を解析する解析手段と、
 原言語の可能表現と、中国語における可能補語を含む補語の出力パターンとを対応付けたデータベースと、
 前記データベースを参照して、前記解析手段によって解析された原言語の可能表現に対応する可能補語を含む補語の出力パターンを決定する可能補語判定手段と、
 前記可能補語を含む補語の出力パターンに従って原言語の文を中国語の文へ翻訳する翻訳手段と、を備えたことを特徴とする機械翻訳システム。
 前記データベースは、原言語の用言毎に、用言の分類情報と、テンス又はアスペクトと、否定概念と、該用言の可能形に対応する中国語における補語の出力パターンを格納して構成される請求項1に記載の機械翻訳システム。
 前記可能補語の出力パターンは、
A)訳語+得+可能補語要素
B)訳語+得+了
C)訳語+得
 の3種と、前記A~Cの否定形に大別される請求項1又は2に記載の機械翻訳システム。
 前記可能補語の出力パターンには、目的語を伴う場合の目的語の配置情報が含まれる請求項1乃至3いずれか一に記載の機械翻訳システム。
 前記原言語が日本語である請求項1乃至4いずれか一に記載の機械翻訳システム。
 前記原言語が英語である請求項1乃至4いずれか一に記載の機械翻訳システム。
 中国語への機械翻訳の処理を行う翻訳方法であって、
 入力された原言語の文を解析する解析工程と、
 原言語の可能表現と、中国語における可能補語を含む補語の出力パターンとを対応付けたデータベースを参照して、前記解析工程において解析された原言語の可能表現に対応する可能補語を含む補語の出力パターンを決定する可能補語判定工程と、
 前記可能補語を含む補語の出力パターンに従って原言語の文を中国語の文へ翻訳する翻訳工程と、を含むことを特徴とする中国語への翻訳方法。
 前記解析工程では、原言語の用言と、該用言の分類情報と、テンス又はアスペクトと、否定概念と、が出力され、
 前記可能補語判定工程では、前記原言語の用言と、用言分類情報と、テンス又はアスペクトと、否定概念と、に基づいて、前記データベースから、原言語の可能表現に対応する中国語における補語の出力パターンを抽出する請求項7に記載の中国語への翻訳方法。
 前記可能補語の出力パターンは、
A)訳語+得+可能補語要素
B)訳語+得+了
C)訳語+得
 の3種と、前記A~Cの否定形に大別される請求項7又は8に記載の中国語への翻訳方法。
 前記可能補語の出力パターンには、目的語を伴う場合の目的語の配置情報が含まれる請求項7乃至9いずれか一に記載の中国語への翻訳方法。
 前記原言語が日本語である請求項7乃至10いずれか一に記載の中国語への翻訳方法。
 前記原言語が英語である請求項7乃至10いずれか一に記載の中国語への翻訳方法。
 中国語への機械翻訳処理をコンピュータに実行させるコンピュータプログラムであって、
 入力された原言語の文を解析する解析処理と、
 原言語の可能表現と、中国語における可能補語を含む補語の出力パターンとを対応付けたデータベースを参照して、前記解析工程において解析された原言語の可能表現に対応する可能補語を含む補語の出力パターンを決定する可能補語判定処理と、
 前記可能補語を含む補語の出力パターンに従って原言語の文を中国語の文へ翻訳する翻訳処理と、を前記コンピュータに実行させる翻訳プログラム。
 前記解析処理では、原言語の用言と、該用言の分類情報と、テンス又はアスペクトと、否定概念と、を出力し、
 前記可能補語判定処理では、前記原言語の用言と、用言の分類情報と、テンス又はアスペクトと、否定概念と、に基づいて、前記データベースから、原言語の可能表現に対応する補語の出力パターンを抽出する請求項13に記載の翻訳プログラム。
 前記可能補語の出力パターンは、
A)訳語+得+可能補語要素
B)訳語+得+了
C)訳語+得
 の3種と、前記A~Cの否定形に大別される請求項13又は14に記載の翻訳プログラム。
 前記可能補語の出力パターンには、目的語を伴う場合の目的語の配置情報が含まれる請求項13乃至15いずれか一に記載の翻訳プログラム。
 前記原言語が日本語である請求項13乃至16いずれか一に記載の翻訳プログラム。
 前記原言語が英語である請求項13乃至16いずれか一に記載の翻訳プログラム。
Description:
[規則37.2に基づく発明の名称]  国語への機械翻訳システム、方法、及びプ グラム

 (関連出願についての記載)
 本願は、先の日本特許出願2007-326221号(2007年 12月18日出願)の優先権を主張するものであり 前記先の出願の全記載内容は、本書に引用 もって繰込み記載されているものとみなさ る。
 本発明は、入力された原言語を中国語に翻 する機械翻訳システム、中国語への翻訳方 および中国語への翻訳プログラムに関する

 中国語への機械翻訳においては、中国語 特有な構文を持つため、その特有の構文に じる様々な研究が行われている。

 従来の中国語への機械翻訳システムの一 が、特許文献1、非特許文献1に記載されて る。

 図9は、特許文献1に記載された中国語へ 機械翻訳システムの構成を表した図である この機械翻訳システムは、形態素分析手段 、基礎文章要素規定手段と、加工文章要素 定手段と、辞書DBと、一般文章要素翻訳手段 と、特殊文章要素翻訳手段と、特殊文章要素 翻訳手段と連結されている特殊文章要素連結 ポインターと、完成翻訳文出力手段とから構 成される。

 特許文献1の特殊文章成分翻訳手段と連結 されている特殊文章要素連結ポインターは5 類の特殊翻訳モジュールと連係して動作す 。5種類の特殊翻訳モジュールはそれぞれ次 処理能力を有している(特許文献1の段落0048 下)。第一の特殊翻訳モジュールは原文章中 にある動詞の中国語対訳動詞に中国語離合詞 を生成する。第二の特殊翻訳モジュールは原 文章中の文章要素中に中国語対訳動詞の程度 を表す程度補語を生成する。第三の特殊翻訳 モジュールは原文章要素中に中国語対訳動詞 の結果を表す結果補語を生成する。第四の特 殊翻訳モジュールは原言語の文章要素に動詞 が「be動詞+過去分詞」からなる被動文から中 国語受身文「被動句」を生成する。第五の特 殊翻訳モジュールは、原言語の文章要素を構 成する構文が「主語+be動詞+形容詞+前置詞」 らなる形容詞構文に対して中国語形容詞構 生成におけるbe動詞に対応する対訳語の動 訳語を省略し、語順を再構成する。

 特許文献1の機械翻訳システムでは、上記 のように、原言語文を解析して、原言語の文 章成分等の情報を用いて、前記五つの特殊文 法または前記一般文法に分けて機械翻訳にお ける中国語生成の訳質の改善を実現している 。補語に関しては、中国語の程度補語を生成 する第二の特殊翻訳モジュールと、中国語の 結果補語を生成する第三の特殊翻訳モジュー ルとが設けられている。

 また、非特許文献1では、日中両言語の構 文上の対応にずれがある表現の中の受動態と 能動態のずれ、品詞のずれ、及び訳語数のず れに係る表現を中心として日中機械翻訳にお ける翻訳方法が提案されている。

 また、特許文献2には、機械翻訳における アスペクト(Aspect;「相」ともいう。)変換の重 要性に着目して、原言語のアスペクトを目的 原語のアスペクトに変換するアスペクト処理 装置が開示されている。また、同文献には、 アスペクトと関連するテンス(Tense;時制とも う。)についても説明が加えられている。

 また、特許文献3には、日本語文中の格助 詞が、直前の体言の属性と密接である格助詞 であるか否かにより、体言及び用言の属性か ら中国語補助語を推定する方法と、体言から 中国語補助語を推定する方法とを選択する日 中機械翻訳システムが開示されている。

 非特許文献2は、中国語文法の参考書の例 である。同文献には、中国語における可能補 語要素が動詞ごとに決められていることが記 載されている。

特表2007-518164号公報(図9)

特開平06-309352号公報

特開平06-266758号公報 ト朝暉、浅井良信、王軼謳、穆貴彬、池 田尚志 著、「日中両言語の構文上の対応に れがある表現の翻訳に関する分析 ー日中 械翻訳の角度からー」、言語処理学会第13回 年次大会、2007年3月19日 pp.658-661 守屋 宏則 著、「やさしいくわしい中 語文法の基礎」、株式会社東方書店、1995年3 月15日発行、pp.192-208

 上記特許文献ならびに非特許文献の開示事 は、本書に引用をもって繰り込み記載され いるものとする。以下の分析は、本発明に って与えられたものである。
 しかしながら、上記した各文献に記載され 技術では、原言語の可能表現を含む文から 国語文に翻訳する際、中国語可能補語を含 文の翻訳を正しく行えないという問題点が る。

 その理由は、原言語から中国語文への翻 を行う際に、中国語の能願動詞を含む文と 能補語を含む文のいずれかに訳し分けを行 必要があるところ、これらの文献では、適 な訳し分けが行われていないためである。

 例えば、日本語文「これが買える。」に し、中国語助動詞「能」(以下、本明細書に おいて、簡体字等の特許庁規定外の文字は常 用漢字に置き換えている。)を使って形式的 翻訳すると、「這個能買。」となる。しか 、最も適切な中国語の訳文は可能補語を用 た「這個買得起。」である。また、この文 否定形「これが買えません。」に対し、中 語助動詞「能」と否定の「不」を形式的に いて翻訳すると「這個不能買。」となる。 の翻訳結果は「これを買ってはいけません 」との禁止的な意味となり、誤訳となって まう。正しい中国語の訳文は可能補語を用 た「這個買不起。」である。

 このように、可能表現、あるいは、その 定形を含む原言語の中国語への翻訳におい 、中国語助動詞(例えば、能、可以、会等) 形式的に使うだけでは、訳質を低下させる 因になる。

 本発明は、上記した事情に鑑みてなされ ものであって、その目的とするところは、 能表現を含む原言語の文章を、正しい中国 に翻訳することができる機械翻訳システム 中国語への翻訳方法および中国語への翻訳 ログラムを提供することにある。

 本発明の第1の視点によれば、入力された 原言語の文を解析する解析手段と、原言語の 可能表現と、中国語における可能補語を含む 補語の出力パターンとを対応付けたデータベ ースと、前記データベースを参照して、前記 解析手段によって解析された原言語の可能表 現に対応する可能補語を含む補語の出力パタ ーンを決定する可能補語判定手段と、前記可 能補語を含む補語の出力パターンに従って原 言語の文を中国語の文へ翻訳する翻訳手段と 、を備える機械翻訳システムが提供される。

 本発明の第2の視点によれば、入力された 原言語の文を解析する解析工程と、原言語の 可能表現と、中国語における可能補語を含む 補語の出力パターンとを対応付けたデータベ ースを参照して、前記解析工程において解析 された原言語の可能表現に対応する可能補語 を含む補語の出力パターンを決定する可能補 語判定工程と、前記可能補語を含む補語の出 力パターンに従って原言語の文を中国語の文 へ翻訳する翻訳工程と、を含む中国語への翻 訳方法が提供される。

 本発明の第3の視点によれば、入力された 原言語の文を解析する解析処理と、原言語の 可能表現と、中国語における可能補語を含む 補語の出力パターンとを対応付けたデータベ ースを参照して、前記解析工程において解析 された原言語の可能表現に対応する可能補語 を含む補語の出力パターンを決定する可能補 語判定処理と、前記可能補語を含む補語の出 力パターンに従って原言語の文を中国語の文 へ翻訳する翻訳処理と、を機械翻訳システム を構成するコンピュータに実行させる翻訳プ ログラムが提供される。

 本発明によれば、可能表現を含む原言語 文章に対し、適切に訳された中国語の文章 得ることができる。その理由は、原言語で いられている可能表現に応じて中国語の可 補語の出力パターンを決定し、該出力パタ ンに従って原言語の文を中国語の文へ翻訳 るよう構成したためである。

本発明の基本原理を説明するための図 ある。 図1の各部の動作を説明するためのフロ ーチャートである。 本発明の第1の実施形態の機械翻訳シス テムの構成を表した図である。 本発明の第1の実施形態の機械翻訳シス テムの可能補語判定用のデータベースに格納 される可能補語パターンテーブルである。 本発明の第1の実施形態の機械翻訳シス テムの可能補語判定用のデータベースに格納 されるデータの可能補語パターンと中心語を 説明するための図である。 本発明の第1の実施形態の機械翻訳シス テムの動作を説明するためのフローチャート である。 日本語構文解析結果の例である。 本発明を英中翻訳に適用する場合の可 補語判定用のデータベースに格納されるデ タの例である。 従来の中国語への機械翻訳システムの 略構成図である。

符号の説明

 101 解析手段
 102 可能補語判定手段
 103 可能補語判定用DB(データベース)
 104 翻訳手段
 104a 可能補語文翻訳手段
 104b 基本文翻訳手段
 105 日本語入力手段
 106  中国語出力手段

 次に、本発明の好適な実施形態について 明する。

[発明の概要]
 はじめに本発明の基本原理について図面を 照して詳細に説明する。図1は、本発明の基 本原理を説明するための図である。図1を参 すると、本発明に係る機械翻訳システムは 入力された原言語の文章における形態素解 、構文解析等の処理を行う解析手段101と、 析手段101から得られた原言語の形態素情報 を用いて、可能補語判定用のデータベース( 下、「可能補語判定用DB」と記す。)103に格 されたデータとの照合を行う可能補語判定 段102と、可能補語判定用DB103と、翻訳手段10 4とを備えている。

 可能補語判定用DB103には、原言語の可能 現(可能形の用言)と、中国語の可能補語を含 む補語の出力パターンとを対応付けたデータ が格納される。また、前記対応付けに際して は、可能表現の分類、原言語の表現に付され ている可能形助動詞要素、テンス・アスペク ト、否定概念等を用いることができる(図4参 )。

 これらの手段はそれぞれ概略次のように 作する。

 解析手段101は、入力された原言語の文章 対して、形態素解析、構文解析等の処理を う。

 可能補語判定手段102は、前記解析手段101 解析結果を用いて、可能補語判定用DB103に 納されたデータとを照合する。そして、中 語へ生成する際に、中国語の可能補語の生 の有無と、可能補語を生成する際にその可 補語の種類を正しく判定する。例えば、動 の解析結果が可能形である場合、可能補語 定手段102は、可能補語判定用DB103を参照する ことにより、当該動詞の訳語+「得」+可能補 要素、訳語+「得了」といった用言に応じた パターンの中から適切なパターンを選択し翻 訳を行うよう判定する。また、動詞の解析結 果が、可能形でない場合は、可能補語判定手 段102は、可能補語を用いた翻訳を行わないよ う判断する。

 翻訳手段104は、可能補語判定手段102の判 結果に従い翻訳を行なう。すなわち、翻訳 段104は、入力された原言語の文章中に、可 表現が含まれない場合、可能補語を含む文 生成しない普通の翻訳処理を行うが、入力 れた原言語の文章中に、可能表現が含まれ 場合、前記可能補語判定手段102の判定結果 従い、可能補語を適切に用いた翻訳処理を う。

 図2は、図1の各部の動作を説明するため フローチャートである。キーボードやファ ル等を通じてシステムに原言語の文章が入 されると(ステップS1)、機械翻訳システムは 解析手段101により、入力された文章の形態 解析、構文解析等の処理を行う(ステップS2) 。この処理において、入力された原言語の文 章の各形態素、構文情報、意味情報等を獲得 することができる。

 次いで、機械翻訳システムは、可能補語 定手段102により、ステップS2で得られた解 結果と、可能補語判定用DB103に格納されたデ ータとの照合を行うことにより可能補語文を 生成するか否かの判定を行う(ステップS3)。

 次いで、機械翻訳システムは、翻訳手段1 04により、入力された文章に対して翻訳処理 行う(ステップS4)。このステップでは、入力 された文章に応じて、次の三つの処理(訳し け)が行われる。

 まず、前記ステップS3において、入力さ た文章の中に、可能表現が含まれないと判 された場合、翻訳手段104は、図示省略する 訳辞書や翻訳規則を利用して、入力された 言語の文章の翻訳を行う(可能補語を生成し い)。

 また、前記ステップS3において、入力さ た文章の中に、可能表現が含まれ、かつ、 記解析手段101から得られた解析結果を用い 、可能補語判定用DB103に格納されたデータと 照合した結果、可能補語を含まない文を生成 すべきと判定された場合、翻訳手段104は、図 示省略する翻訳辞書や翻訳規則を利用して、 入力された文章の翻訳を行う(可能補語を生 しない)。

 一方、前記ステップS3において、入力さ た文章の中に、可能表現が含まれ、かつ、 記解析手段101から得られた解析結果を用い 、可能補語判定用DB103に格納されたデータと 照合した結果、可能補語を含む文を生成すべ きと判定された場合、翻訳手段104は、可能補 語判定手段102により指定された可能補語のパ ターン情報と、翻訳単語辞書と、文法規則と を用いて、入力された文章の翻訳を行う。

 最後に、機械翻訳システムは、ディスプ イなどを利用してこのようにして翻訳した 国語翻訳結果を出力する(ステップS5)。

[第1の実施形態]
 続いて、本発明をより具体化した第1の実施 形態について、図面を参照して説明する。

 図3は、本発明の第1の実施形態に係る機 翻訳システムの構成を表した図である。同 に示すように、本実施形態に係る機械翻訳 ステムは、日本語文章を入力する日本語入 手段105と、入力された日本語文章における 態素解析、構文解析等の処理を行う解析手 101と、可能補語判定用DB103と、解析手段101か ら得られた解析結果を用いて、可能補語判定 用DB103に格納されたデータとの照合を行う可 補語判定手段102と、可能補語文を翻訳する 能補語文翻訳手段104aと、基本文を翻訳する 基本文翻訳手段104bと、中国語出力手段106と 備えている。なお、先に説明した基本構成 同一の構成要素には同一の符号を付してい 。また、可能補語文翻訳手段104a及び基本文 訳手段104bは、上記した翻訳手段104に相当す る。

 日本語入力手段105は、キーボード等を利 して、日本語文章を記憶する。

 解析手段101は、入力された日本語文章に して、形態素解析、構文解析等の処理を行 。

 可能補語判定用DB103は、解析手段101によ 解析結果から、日本語の動詞や形容詞の分 、テンス・アスペクト、否定概念等によっ 、中国語である目的言語の補語の出力パタ ン等を選択できるように構築される。

 可能補語判定手段102は、可能補語判定用D B103に格納されたデータから、解析手段101か 得られた日本語の解析結果に適合するデー を抽出することにより可能補語を含む文を 成するか否かの判定及び中国語の補語の出 パターンを、可能補語文翻訳手段104a又は基 文翻訳手段104bに出力する。

 可能補語文翻訳手段104aは、前記可能補語 判定手段102にて可能補語を含む文を生成する と判定された場合、併せて出力された中国語 の補語の出力パターンを用いて、入力された 日本語文章を中国語の可能補語を含む文への 翻訳処理を行う。

 基本文翻訳手段104bは、前記可能補語判定 手段102にて可能補語を含む文を生成しないと 判定された場合、入力された日本語文章に対 して通常の中国語基本文翻訳処理を行う。ま た、可能補語判定手段102により、結果補語、 方向補語、程度補語等の補語の出力パターン が出力されている場合は、該出力パターンを 用いて、中国語基本文翻訳処理を実行する。

 中国語出力手段106は、ディスプレイなど 利用して中国語翻訳結果を出力する。

 なお、前記した機械翻訳システムの各手 は、機械翻訳システムを構成するコンピュ タを上記した各機能を実現させるプログラ 又は前記コンピュータに後記する処理を実 させるプログラムにより実現できる。

 図4は、可能補語判定用DB103に格納される ーブルの例であり、可能補語判定手段102に り判定される可能補語出力パターン型と、 の具体的な(構文)との対応関係を示すテー ルである。図4に示されたように、中国語の 能補語のパターン型は、その肯定形と否定 を含めて6種類となる。

 ここで、中国語の可能補語について説明 る。

 中国語の可能補語とは可能性を表す補語 ことである。それぞれの構成の違いにより 可能補語は、A型可能補語~C型可能補語の大 く3種類に分けられる。

[A型可能補語]
 第一の可能補語(A型可能補語)は、中国語動 と結果補語あるいは方向補語の間に「得」 「不」を入れたものになる。「得」をつけ のがA型可能補語の肯定形で、「不」をつけ るのがA型可能補語の否定形になる。例えば 日本語の「払える」の中国語の訳は「付得 」で、「払えない」の中国語の訳は「付不 」となる。

 また、中国語動詞がA型可能補語と目的語 を同時に持っている際に、目的語の位置は一 般的に以下の二種類がある。

 第一は、可能補語が結果補語あるいは単 方向補語から作られている場合、目的語は 能補語の後ろに置かれる。

 第二は、可能補語が複合方向補語から作 れている場合であり、多くの場合、目的語 元の複合方向補語の間に置かれる。上記中 語動詞がA型可能補語と目的語を同時に持っ ている場合の目的語の位置も、可能補語判定 手段102により出力されるようにすることがで きる。

 A型可能補語を示す構造情報は、入力文が 肯定の場合は、「X得Y」の構造を可能補語パ ーンA1と定義する。ここでXは動詞形容詞用 の中国語訳で、YはXに対応する可能補語要 を示す。例えば、前記の例「払える」の場 、Xは「払う」の辞書に対応する中国語の訳 「付」で、Yは「払える」の可能補語要素「 起」となる。入力文が否定の場合は、「X不Y の構造を可能補語パターンA2と定義する。 こでのXとYは前述のXとYと同様である。

 第二の可能補語(B型可能補語)は、中国語 詞あるいは形容詞の後ろに「得+了」または 「不+了」を利用したものになる。例えば、 本語の「動ける」の中国語の訳は「動得了 で、「動けない」の中国語の訳は「動不了 となる。

 なお、中国語動詞がB型可能補語と目的語 と同時に持つ場合は、目的語は補語の後ろに 置かれる。

 B型可能補語を示す構造情報は、入力文が 肯定の場合は、「X得了」の構造を可能補語 ターンB1と定義する。ここでXは動詞形容詞 言辞書の中国語訳である。例えば、前記の 「動ける」の場合、Xは「動く」の辞書に対 する中国語の訳語「動」となる。入力文が 定の場合は、「X不了」の構造を可能補語パ ターンB2と定義する。ここでのXは前述のXと 様である。

 第三の可能補語(C型可能補語)は、動詞あ いは形容詞の後ろに「得」または「不得」 付くものになる.例えば、日本語の「そこへ いける」の中国語の訳は「那里去得」で、「 そこへいけない」の中国語の訳は「那里去不 得」となる。

 また、中国語動詞がC型可能補語と目的語 と同時に持つ場合は、目的語を補語の後ろに 置くこともできる。

 C型可能補語を示す構造情報は、入力文が 肯定の場合は、「X得」の構造を可能補語パ ーンC1と定義する。ここでXは動詞形容詞用 辞書の中国語訳である。例えば、前記の例 行ける」の場合、Xは「行く」の辞書に対応 る中国語の訳語「去」となる。入力文が否 の場合は、「X不得」の構造を可能補語パタ ーンC2と定義する。ここでのXは前述のXと同 である。

 図4は、可能補語判定用DB103に格納される ーブルの一例である。図4を参照すると、原 言語側の、日本語動詞分類と、否定概念と、 日本語可能形助動詞要素と、日本語アスペク ト助詞要素と、テンス・アスペクト計算結果 (ある日本語動詞とあるアスペクト助詞要素 を結合した場合、その結合した日本語のア ペクト計算結果)とにより目的原語である中 語の補語出力パターン(可能補語の場合とそ の他の補語の場合を含む。)が得られるよう 構成となっている。

 [日本語動詞分類]
 図4に示すように、日本語動詞は、可能補語 出力パターンに応じて、第一種の動詞(a)と、 第一種の動詞(b)と、第二種の動詞(a)と、第二 種の動詞(b)と、第三種の動詞とに分類できる 。例えば、日本語動詞「買う」は第一種動詞 (a)に属する。

 [否定概念]
 図4の否定概念欄は、入力文に否定概念が含 まれているか否かを示す値が設定されている 。図4の例では、値が「0」の時、入力文に否 概念が存在しないことを示す。値が「1」の 時、入力文に否定概念が存在することを示す 。

 [アスペクト助詞要素]
 図4のアスペクト助詞要素欄は、アスペクト 助詞要素が設定され、記号(φ)はアスペクト 詞がないことを示す。

 [補語出力パターン]
 目的言語の補語出力パターン欄には、中国 の補語出力パターンが設定される。図4の例 では、可能補語パターンと他の補語パターン が含まれており、前者の可能補語パターンは 、可能補語パターンA1と、可能補語パターンA 2と、可能補語パターンB1と、可能補語パター ンB2と、可能補語パターンC1、可能補語パタ ンC2に分類される。後者の他の補語パターン は、結果補語、方向補語、程度補語、数量補 語等がそれぞれ用言や否定概念、アスペクト 計算結果に応じ設定される。また、本欄の記 号(α)は、補語以外パターン(デフォルト値)で あることを示す。

 なお、可能補語判定手段102により判定さ た目的言語の中国語の補語出力パターンが 結果補語、方向補語、程度補語等の場合、 本文翻訳手段104bにより入力された日本語文 章の翻訳処理が行われる。

 次に、本実施形態に係る機械翻訳システ の動作について図面を参照して詳細に説明 る。図6は、本実施形態に係る機械翻訳シス テムの動作を表したフローチャートである。

 図6を参照すると、まず、機械翻訳システ ムは、日本語入力手段105により、入力情報で ある日本語文章をファイルもしくはキーボー ドから読み込んで、記憶する(ステップS01)。

 次いで、機械翻訳システムは、解析手段1 01により、日本語形態素解析を行うことによ 、日本語文章を形態素単位に分解する(ステ ップS02)。例えば、「私は車を買える。」と う入力日本語文章に対して、「私/は/車/を/ う/える/。」というように形態素の解析を う。

 上記形態素解析を行った結果得られる各 態素は、独自の属性値を持つ。属性値とは 原形、品詞、活用形、意味分類、アスペク 等の情報からなる。また、機械翻訳システ で用いる機械翻訳用辞書(日中翻訳辞書)は 各形態素の訳語、品詞、意味分類、用言の 合の格フレーム等の情報が与えられている のとする。

 例えば、前記例文の形態素の「買う」は その属性値は、原形(“買う”)、品詞(動詞( 五段))等の情報を有している。また、前記例 の形態素の「える」は、その属性値は、原 (“れる”)、品詞(助動詞(可能))等の情報を している。

 本実施形態においては、機械翻訳用辞書( 日中翻訳辞書)の目的言語側に、中国語の原 や品詞等の情報を持たせると同時に、前記 た5種類の動詞分類と、補語要素とが予め付 されている。例えば、「買う」の目的言語 に、中国語原形(“買”)と、品詞(動詞)と、 格フレーム(主語(助詞値(が))、述語、目的語( 助詞値(を)))と、可能補語要素(“起”)等が予 め付与されている。

 次いで、入力された日本語文章に対し、 ャート法により構文解析を行う(ステップS02 )。例えば、図7に示すように、前記例文「私 車を買える。」は、構文解析される。

 次いで、機械翻訳システムの解析手段101 、前記構文解析の結果から、日本語用言が つアスペクトの属性値と日本語テンス・ア ペクト助詞等の情報を利用して、入力文章 アスペクト値を計算する。アスペクト計算 果を可能補語判定手段102に提供する。

 次いで、機械翻訳システムの可能補語判 手段102は、前記解析手段101の解析結果を用 て、前記解析手段101の解析結果の中に日本 の可能表現が含まれているかどうかの判定 行う(ステップS03)。日本語の可能表現が含 れない場合は、基本文翻訳手段104bによる基 文翻訳処理が行われる(ステップS06)。

 一方、日本語の可能表現が含まれている 合、可能補語判定手段102は、前記解析手段1 01の解析結果を用いて、可能補語判定用DB103 格納されるデータとの照合を行うことによ 、目的言語の中国語の可能補語文を生成す かの判定を行う(ステップS04)。例えば、可能 補語判定手段102は、図4に例示するテーブル 上から順番に見ていき、すべての条件にマ チする行が見つかれば、その行の可能補語 出力パターン型を出力し、照合処理を終了 る。最後の列まで見つからなければ、デフ ルト値「δ」を出力する。

 例えば、前記例文「私は車を買える。」 形態素解析の結果が得られている場合、可 補語判定手段102は、図4に示すテーブルから 、「買」が持つ固有部(“買う”)から原形の 買う」と、「える」が持つ固有部(“れる” )と、動詞分類(第一種動詞(a))と、否定概念値 (0)、アスペクト助詞(φ)、アスペクト計算結 の「原形」に該当するデータを探索する。 の場合は、図4のNo.1に該当するので、目的言 語の中国語の可能補語の出力パターン型は可 能補語のパターンA1となる。

 次に、可能補語判定手段102は、図5のテー ブルを参照して、可能補語の出力パターン型 に対応する、可能補語パターンの「訳語+得+ 能補語要素」と可能補語パターンの中心語 得」を取得し、次の処理(ステップS05)に移 する。

 なお、ステップS04で、可能補語判定手段1 02よりδもしくは値αが出力された場合、基本 文翻訳手段104bによる、可能補語を含まない 本文翻訳処理が行われる(ステップS06)。

 一方、ステップS04で、可能補語判定手段1 02より可能補語パターンと可能補語パターン 中心語が出力された場合は、そのパターン 報と、翻訳辞書と、翻訳規則とを用いて、 能補語文翻訳手段104aにより、可能補語文へ の翻訳処理が行われる(ステップS05)。

 可能補語文翻訳手段104aは、まず、機械翻 訳用辞書(日中翻訳辞書)から、動詞や形容詞 の用言の中国語の訳語と、可能補語要素と その中国語の訳語の格フレームを取得する 次に、可能補語文翻訳手段104aは、可能補語 判定手段102より出力された可能補語パターン と可能補語パターンの中心語及び可能補語要 素を用いて、前記した訳語や可能補語要素等 の値を可能補語パターンにセットする。

 例えば、前記例文「私は車を買える。」 場合、可能補語文翻訳手段104aは、機械翻訳 用辞書(日中翻訳辞書)の「買う」の「可能補 要素(“起”)」を、可能補語判定手段102か 得られる可能補語パターンA1「X得Y」の可能 語要素であるYの位置にセットして「“X得 ”」を得る。次に、可能補語文翻訳手段104a 、機械翻訳用辞書(日中翻訳辞書)の「買う の対訳として得られる原形(“買”)を取得し 、訳語であるXの位置にセットして「“買得 ”」を得る。次に、可能補語文翻訳手段104a 、機械翻訳用辞書(日中翻訳辞書)から得た 詞や形容詞等の用言の中国語生成側の格フ ームの述語位置に生成された内容「“買得 ”」を書き込む。例えば、前記例文「私は を買える。」において、「買」の機械翻訳 辞書(日中翻訳辞書)の生成側にある「買」が 持つ格フレーム(主語(助詞値(が))、述語、目 語(助詞値(を)))から、格フレーム(主語(助詞 値(が))、述語(“買 得 起”)、目的語(助詞 (を)))が生成される。

 次いで、可能補語文翻訳手段104aは、前記 生成された格フレームに従って、主語、述語 、目的語が持つ中国語訳語を並べて、中国語 の翻訳結果を生成する。

 次いで、中国語出力手段106は、ディスプ イなどを利用して中国語翻訳結果を出力す (ステップS07)。

 例えば、前記例文「私は車を買える。」 対し、前記の格フレームの主語に「私」の 語である「我」、目的語に「車」の訳語で る「車」を代入し、文字列として並べるこ により、「我買得起車。」という正しい中 語表現を得る。

 同様に、「私は車を買えている」、「私 車を買えない」、「私は車を買えていない の文章を入力された時に、「我 買 得 起 車。」、「我 買 不 起 車。」、「我 買 不 起 車。」との対応する正しい翻訳結果 出力できる。

 一方、前記例文「私は車を買える。」に いて、従来の日中機械翻訳システムでは、 国語助動詞(例えば、能、可以、会)を使う けで翻訳処理を行っているため、翻訳結果 、「我能買車。」、「我可以買車。」、「 会買車。」のいずれかに翻訳されることに る。しかし、これらの三つの訳文は、前記 文の「私は車を買える。」と異なる意味を つことになる。

 このように、本実施形態によれば、従来 日中機械翻訳システムと比較して、翻訳結 の訳質を飛躍的に向上することができる。

 なお、図6のステップS03において、入力さ れた日本語文章に可能表現が含まれない場合 には、基本文翻訳手段104bにより、入力され 日本語文章の、中国語基本文への翻訳が行 れる。

 また、入力された日本語文章は可能表現 含むが状態形、完了形であるなど、可能補 判定用DB103に格納されているデータとの照 の結果、可能補語パターンではなく、程度 語や結果補語等で生成すべきと出力された 合も、基本文翻訳手段104bにより、入力され 日本語文章の、中国語基本文への翻訳が行 れる。

 例えば、「私は車を買えた」、「私は車 買えていた」、「私は車を買えなかった」 「私は車を買えていなかった」の文章に対 、前記した補語パターンへの訳語、補語要 のセット及び格フレームの適用処理により 「我買到了車。」、「我買到了車。」、「 没買到車。」、「我没買到車。」との正し 翻訳結果を出力することになる。

 なお、上記した実施形態では、日本語の 詞の可能表現について説明したが、日本語 容詞等の用言についても、同様に、前記可 補語判定用DBと、可能補語判定手段と、可 補語翻訳手段を設けることにより、対応す ことができる。

 以上説明したように、本実施形態によれ 、入力された原言語の文章を、中国語へ翻 する際に、中国語の可能補語の生成の有無 、可能補語を生成する際にその可能補語の 類を正しく判定させ、機械翻訳システムの 訳精度を向上させることが可能となる。

 なお、本実施形態で説明した、図4の動詞 分類情報は、以下のようにして、予め辞書に 付与することができる。

 まず、日本語原形から可能形に変形する 例えば「運ぶ」に対して、その可能形は「 べる」となる。

 次いで、日本語可能形動詞を中国語へ訳 。例えば、「運べる」の中国語訳は「搬得 」となる。

 次いで、図5に示す可能補語パターンと照 合することにより、動詞の分類情報を得る。 例えば、前記「運べる」の訳語の特徴「搬+ +動」から、図5に示す可能補語パターンA1の 訳語+得+可能補語要素」と一致するため、 本語動詞「運ぶ」は第一種動詞(a)または第 種動詞(b)に属することが分かる。

 このようにして、前記判定結果を用いて 図4の日本語動詞の分類を定めることができ る。例えば、前述の「運べる」は、後記する 否定概念を含まないため、図4の第一種動詞(a )と判定することができる。

 中国語の可能補語要素も、動詞毎に決ま ており、具体的な内容は中国語辞書、中国 文法の参考書を参照すれば見付け出すこと できる。例えば、非特許文献2の192ページに 可能補語が、「V+得+C」と「V+不+C」の形をし 構造として定義されている。ここで、Vは動 詞、Cは補語成分を示す。先の実施形態で述 た可能補語要素は、非特許文献2に示された ころの補語成分Cのことである。動詞Vと補 成分Cの対応については、非特許文献2で詳細 に説明されている。なお、上記引用をもって 、上記非特許文献2の全開示内容は本書に繰 み記載されたものとする。

 以上本発明の好適な実施形態を説明した 、本発明は、上記した実施形態に限定され ものではなく、本発明の基本的技術的思想 逸脱しない範囲で、更なる変形・置換・調 を加えることができる。例えば、英語から 国語へ翻訳する際にも、上記した実施形態 同様のデータベースを用意し、可能補語の 定を行うことにより、英語の可能助動詞を む文の訳し分けを実現することができる。

 図8は、英中翻訳における可能補語判定用 DBを示す例である。例えば、英語句「I am abl e to catch the fish.」に対し、図8に示す可能 語判定用DBと、前記可能補語判定手段と、前 記可能補語翻訳手段を用いることより、「我 抓得住那条魚。」という中国語表現を得るこ とができる。

 上記した英中翻訳への展開からも理解され ように、本発明は、日本語や英語以外の言 を原言語とする機械翻訳システムに適用す ことができる。
 本発明の全開示(請求の範囲を含む)の枠内 おいて、さらにその基本的技術思想に基づ て、実施形態ないし実施例の変更・調整が 能である。また、本発明の請求の範囲の枠 において種々の開示要素の多様な組み合わ ないし選択が可能である。すなわち、本発 は、請求の範囲を含む全開示、技術的思想 したがって当業者であればなし得るであろ 各種変形、修正を含むことは勿論である。