なぜバックスラッシュは円記号になったのか

 すこし前にこういう話がありました。


元のビデオはこちら (ハッカソン魂 男女混交初心者ハッカソン#3 スラッシュの謎とOSの血塗られた歴史)


動画の最後の方にバックスラッシュと円記号の話が出てきます。面白く語っているので細かいところは若干盛った話し方になっています。米国の文字コード規格であるASCIIコードにあるバックスラッシュが,日本での相当規格では,より実用性の高い通貨の円記号に置き換えられたという意味ではあっています。

詳しい(というか真面目な)説明は,拙著『[改訂新版] プログラマのための文字コード技術入門』の第2章をお読みいただければと思います。

かいつまんでいうと,ASCIIという米国の規格を国際標準にしたISO/IEC 646という規格ではいくつかの符号位置が各国規格でカスタマイズできるようになっており,日本の対応規格であるJIS X 0201ではASCIIバックスラッシュ相当の位置(5/12, 0x5C)に円記号を割り当てているということです。

国によって違うので,韓国ではウォン記号だったり,欧州諸国ではダイアクリティカルマークのついたアルファベットを入れたりしています。

ただし欧州と日本で状況が違うのは,日本のJIS X 0201がASCIIと2箇所しか違わない (オーバーラインとチルダを同一視すれば円記号の1箇所のみ)のに対し,欧州ではもっと多くの違いがあり,ASCIIの波括弧 { } や鉤括弧 [ ] ,縦線 | 等も別の文字が割り当てられています。これだけ違いがあるとASCIIと同じもののように扱うのは難しくなります。そこで,8ビットのISO 8859シリーズ,つまり西欧のLatin-1等ができると,これは7ビット部分はASCIIと同一ですから,こっちを使えばいいやということになって,完全にASCII互換になります。

日本の場合1文字しか違わない,それも通常の言語表記には用いないバックスラッシュだったということから,JIS X 0201から完全にASCIIに切り替える動機が乏しかったといえます。欧州で8ビットの8859ができたのと同じように日本では2バイトのJIS X 0208ができたので,1バイト部分はASCIIと完全に同じにしても構わない(2バイト部分に円記号もオーバーラインもあるので問題ない)のですが,切り替えにより過去データにコード変換が必要となる(1バイトの円記号を2バイトに置き換える)ことを嫌ってか,切り替えるタイミングを逃したように見えます。


 

このブログの人気の投稿

ブログ再開について

『漢字文化事典』の項目を執筆しました

秋バラを撮りに