サイバーアジア〜ホームページ紹介(27)〜

電子テキスト

 全文テキストデータベースは、ネットに限らずテキストの電子化による当然の帰結だろう。中国語について言えば、ネットでは以前紹介した台湾中央研究院の「漢籍全文資料庫」や、CD-ROM150枚の『文淵閣四庫全書』などが代表的だ。文革以後の「当代文学」を含む現代文学については、大陸では「新語絲」(GBコード中国語)、台湾では「台湾中央大学東坡資料庫」(Big5コード中国語)などが全文テキストを収集している。しかし1999年1月1日に中国でも著作権法および実施条例が施行されており、ネット上の未許可全文データ群がどのように再編成されていくか注目したい。
 こうした電子テキストから様々な文例を抜き出したりするのもコンピューターお得意の分野である。1980年代から作家の全作品の分析を羅列したものが辞書体で出版されているが、ネットで得た電子テキストを自分のパソコンで検索することもできる。エディタの検索機能を使ってもよいし、中国語全文検索ソフト(百歩穿楊:日中産業通信)も市販されている。
 何を読むかという書目について言えば、「亜洲週刊」が「20世紀中国文学小説ベスト100」(Big5コード中国語)という企画を行っており、両岸三地、北米、マレーシア、シンガポールの作家らによる100作品発表と、ネット上で人気投票を行っている。専門家によるリストには魯迅、沈従文、老舎、張愛玲ら無難な作家作品が上位を占めているが、人気投票の動向は金庸らの武侠小説や衛斯理のSF、瓊瑤の恋愛小説などが盛り返しているようで、研究者による評価と地域を問わぬ読者の共通項との乖離を示していて興味深い。

(初出:『アジアクラブマンスリー』アジアクラブ、1999.9)