栗林ゆき絵
本日のポイント - 形態素解析(単語分割、辞書引き)の大まかな流れを知る。 - コンピュータによる翻訳のための辞書を作ってみる。(続き) |
プログラムその1(最長一致法による形態素解析、対訳表示) mt1.pl....対訳を画面に、形態素の辞書情報をファイルに出力。 [出力ファイル:outtaiyaku.txt] ダウンロードはこちら 1.1文をキーボードから入力。 ↓ 2.辞書ファイルをオープン。 ↓ 3.初回は入力語=1文丸ごととする。 入力語が辞書に見つかったら、訳語を表示。 見つからなければ、入力語を語末から1文字ずつ短くしていき、 辞書ファイル検索を繰り返す。「最長一致法」 ↓ 4.辞書に見つかった語を切り取った残りの部分を次の初期入力語として、3を繰り返す。 ↓ 5.残りの部分がなくなったら終了。 (ただし、途中で未知語があると辞書検索できないので、そこで終了) プログラムその2(解析と変換) mt2.pl....形態素解析結果のファイルを読み込んで、文頭から順にスペイン語の品詞情報を参照し、 それに従って、対訳を適切な順序で訳出する。 [翻訳結果の出力ファイル : MToutput.txt](追加書き込み) ダウンロードはこちら |
*西日翻訳例文集[応用例文]を翻訳できるように、辞書追加。(全員) *さらに[自由例文]を5文決めて、翻訳できるように辞書を整備。 まずは、1年時の教科書の基本例文などから取るとよい。(なるべく多様な文を(時制、人称、語彙など偏らないように)選択するとよい) *辞書作成に慣れたら、新聞記事などWeb上の生のスペイン語で試してみよう。 |
©Yukie Kuribayashi