2015年度講義ノート

栗林ゆき絵


(11)簡易翻訳ツールを使ってみよう。--自動翻訳入門②単語レベル--

本日のポイント
- 形態素解析(単語分割、辞書引き)の大まかな流れを知る。
- コンピュータによる翻訳のための辞書を作ってみる。(続き)

[1]簡易翻訳ツールの中身はどうなっている?

*基本のアルゴリズム[図解pdf]はこちら

プログラムその1(最長一致法による形態素解析、対訳表示)
mt1.pl....対訳を画面に、形態素の辞書情報をファイルに出力。 [出力ファイル:outtaiyaku.txt]
ダウンロードはこちら

1.1文をキーボードから入力。

2.辞書ファイルをオープン。

3.初回は入力語=1文丸ごととする。
入力語が辞書に見つかったら、訳語を表示。
見つからなければ、入力語を語末から1文字ずつ短くしていき、
辞書ファイル検索を繰り返す。「最長一致法」

4.辞書に見つかった語を切り取った残りの部分を次の初期入力語として、3を繰り返す。

5.残りの部分がなくなったら終了。
(ただし、途中で未知語があると辞書検索できないので、そこで終了)

プログラムその2(解析と変換)
mt2.pl....形態素解析結果のファイルを読み込んで、文頭から順にスペイン語の品詞情報を参照し、 それに従って、対訳を適切な順序で訳出する。
[翻訳結果の出力ファイル : MToutput.txt](追加書き込み)
ダウンロードはこちら

[2]マイ辞書を作成し、さまざまな例文で翻訳テストしてみよう。

西日翻訳例文集[応用例文]を翻訳できるように、辞書追加。(全員)
*さらに[自由例文]を5文決めて、翻訳できるように辞書を整備。
まずは、1年時の教科書の基本例文などから取るとよい。(なるべく多様な文を(時制、人称、語彙など偏らないように)選択するとよい)

*辞書作成に慣れたら、新聞記事などWeb上の生のスペイン語で試してみよう。

補足(余力のある人・プログラミング経験者向け)

*プログラミング言語perl
授業では文法の詳細は説明扱いませんので、関心のある人は 補足1「perl入門」を参照してください。


[スペイン語情報処理HOME]

©Yukie Kuribayashi