ゼミ生による発表「漢字圏の文字コードあれこれ」『電脳社会の日本語』その後


漢字圏の文字コードあれこれ(遠山)

『電脳社会の日本語』P.223〜230)

漢字圏におけるグローバル・スタンダード概要
現状:各国で様々な文字コードを採用。
問題点:外部コードとして使う場合、発信元と受信先でコードが異なると混乱する。〜グローバル・スタンダードの必要。
グローバル・スタンダード化への取り組み:コンピュータはASCII、JISローマ字の命令を受け付ける。ISO10646(ユニコード)、ISO2022系のコードがスタンダードとなる。
ISO10646(ユニコード):16ビット、1バイト、65,536文字で全世界の文字を表す。
ISO2022:8(7)ビット、多バイト、エスケープシーケンスによって文字集合を切り替え全世界の文字を表す。情報交換用符号、基本になる文字コード(ISOローマ字コード)を各国版に拡張・共存させるためのルール〜文字コードそのものではない。
UTF:ISO10646(ユニコード)をISO2022に変換するための符号変換方式。

中国

電報碼 19世紀〜 
4桁の数字で漢字をあらわす〜発信・受信コードの統一という考え方
GB2312(GB基本漢字)1981年 字体は「簡化字総表」「第一次異体字整理表」にもとづく簡体字。
GB7589(第二補助集)、GB7590(第四補助集) 1987年 「GB基本漢字」の補助集。簡体字。
GB/T12345(「GB伝統漢字」)1990年 「GB基本漢字」の伝統字(繁体字)版。「GB基本漢字」でつくった文書をGB/T1234読めば、そのまま伝統漢字になる。複数の伝統字を併合した簡体字は単純な切り替えではうまくいかない。(略字を使っている国では必ずおこること)
GB/T13131(第三補助集 GB7589の伝統字版)、GB13132(第五補助集 GB7590の伝統字版)1991年、ISO IR165 
(ITU-T.101 Chinese primary set)1992年 ITU(国際通信連合)が「GB基本漢字」の増補版を集大成、中国政府に代わって登録申請。
GBK 1996年 中国語EUC(CN-GB)を拡張した文字コード。Windows2000以降で対応
少数民族のための文字コードもあり〜隣接同族同語に文字コードがある場合も

台湾

CCCII(中文資料訊交換碼)1980年:ISO2022系
CNS11643(中國國家標準中文標準交換碼)1986年:ISO2022系に準拠
Big5(大五碼)1984年:台湾の事実上の標準。CNS台湾漢字・試案を採用。ISO2022系に準拠していない。
※中国、台湾、香港、シンガポール、アメリカに広がる華人社会のメールはISO2022=GB基本漢字、CNS台湾漢字、ASCIIを識別番号で切り替える。

韓国

KSC6501(「KS基本漢字ハングル」1987年:(1992年にKSX1001と改称) 完成形方式。漢字は読み順に配列、複数の読みがある漢字は重複して収録。
KSX1002(「KS補助漢字ハングル」1991年:1991年時点ではISO2022で用いられない。
UHC:GBKと似た構造。ISO2022に準拠していない。Windowsに採用。

参考文献・資料


『電脳社会の日本語』その後 加藤弘一氏と小形克宏氏の論争(柳下)

『電脳社会の日本語』(P.183〜184)
「日本工業調査会はJIS拡張漢字の是非で紛糾し、符号化方式を定めた付属書を参考規格にどどめるという条件をつけて可決した。〜主要な基本ソフトはどこも実装しない。」 この「実装」というという表現をめぐって、2000年2月23日から6月1日にかけて論争が起きた。最終的に、加藤氏は文字コードへの言及を休止している。

内容
加藤 2000.3.17.<ほら貝『電脳社会の日本語』補足と訂正>
自分のサイトで『電脳社会の日本語』の記述に触れ、
「184ページでJIS拡張漢字(JIS X 0213)隙間方式シフトJISについて、主要な基本ソフトは実装しないと書きましたが、本書校了後、この夏に発売されるある基本ソフトの新版が変則的な形で隙間方式シフトJISに対応する可能性が出てきました。」と発表。

小形 2000.5.23.
メールで「『ある基本ソフト』とはMacOS Xのことではないか。」と加藤氏に質問。加藤氏、「お尋ねの点ですが、こちらが驚いております。というのは、あの補足をつけたのは小形さんがPC Watchに掲載された記事が直接のきっかけだったからです・・・」と返答。

加藤 2000.5.27. <ほら貝『電脳社会の日本語』補足と訂正>
サイトの3/17の補足を削除。「不必要な補足と訂正で混乱を招いたことについて」と「謝罪文」を新たに掲載。

小形 2000.5.31.<文字の海、ビットの船 特別編第5回>
自分のコラムで加藤氏批判を展開。
「先週、第2部の第2、3回にわたって、実際には主要なOSは規格としてのJIS X 0231(以下、0231)を実装しないと書いた。
加藤にメールで問い合わせたところ、彼はたしかにMacOS Xを念頭において、上記の文章を書いたことが確認できた。しかし、この加藤の記述は間違っている。私がアップルコンピュータの木田泰夫に聞いたところ、木田はMacOS XはShift_JISX0231をサポートしないと明言した。
 おそらく取材を受けてくれたアップルコンピュータも同様であろうが、私はこの記事で《MacOS Xが0231を変則的な形で実装するとほのめかす》意図は、まったくなかったということだ。これは加藤と彼の知人の深読みにすぎないし、私たちにとっては、そのような深読みは迷惑でしかない。 
 ここにあらわれる加藤の問題点は、やはり二つにまとめられる。ひとつは推測にもとづく曖昧な根拠の情報を未確認のまま流したこと。もう一つは、なんらかの理由でぼかして書いた記述を、またさらに曖昧な情報で糊塗しようとしたことだ。」

加藤 2000.5.27.〜6.1. <ほら貝 エディトリアル>
この論争に対する経過説明と心情吐露。文字コードからの決別表明。
5.27.「文字コードは技術的な問題とはいえ、謀略と陰謀と利害関係とどろどろした人間関係がからみ、いろいろな経験をしてきているので、予防措置をしたつもりだったのですが。」
5.29.「27日に『謝罪文』を公開した後も、あちこちいじっていたのですが、幹と枝葉の区別がつかなくなる重箱の隅症候群でした。」
6.1.「あらためて確認したところ、小形氏の記事に「文字集合としての実装」という記事がありました。『謝罪文』を一日のうちに何度も見直しているうちに、小形氏の記事に対する不満や取材であることを隠した接触法に憤りが勝ってきて、悪循環に陥ってしまいました。
 文字コードから関心を移し、縁を切ろうとしたとたん、こういうことになると、文字コードの世界には情の深い女神様が棲んでいるのか、などと思いたくなります。ともあれ、文字コードの女神様ともこれでお別れで、その意味ではほっとしています。

参考資料

(文責:成田)