以下のプログラム作成には、 「韓国映画とハングル」のソチョンさんの 助言をいただきました。(ユニコードの文字コードの事や、 動作確認、その他いろいろ。)ありがとうございます。
自宅のWindows95のIE3やIE4では動いています。 NN3やMac、UNIXで動くのかは不明です。 動くといいのですが... ということで、まだ試作品です。 役にたつようであれば、勝手に改造して使ってください。
一部のツールは、ハングルの単独字母には(まだ)対応していません。 ごめんなさい。
韓国語特有の記号には、(まだ)対応していません。 ごめんなさい。
まだまだバグが残っていると思います。ごめんなさい。
"さる@さるばん"さん作成のgifファイルによる ハングル画像ファイル2376個を使って 掲示板にハングルを書き込むための JavaScript(の試作品)です。
この画像は、ハングルを初声、中声、終声の3つに 分解して、それを元にしてファイル名が決められています。 詳しくは、 さる@さるばんさんのホームページへどうぞ。
日本で作られているUnicodeによる日韓混在文のWebページには 大きく2種類あります。 一つは「UTF-8」エンコーディングによるもの。 もう一つは、 ユニコード番号の10進数表記を使ってハングルをエスケープして Shift-JISコード内にハングルを埋め込む方法です。
後者の、ユニコードの10進数でエスケープしたものは
가
といった形になっています。ここで
44032(10進数) = AC00(16進数)
であり、これはユニコードでは完成型の「ka」を
意味します。
(正式には確か、「文字参照」といって、SGMLやXML(HTML4.0でも??)
の規格だと聞いています。)
で、韓国もののWeb siteの掲示板に、この
文字参照ハングルが時々使用されています。
Microsoft Internet Explorer 4 では、
表示も書き込みも可能なのですが...
(MSWrod97でも読めるそうです。)
というわけで、仕組は簡単なのです。 掲示板のソースコードを開いて、十進数の部分を 計算してハングルに変換すれば読めるようになるはずです。
なお、Netscape Navigator をご使用の場合、 ソースの表示用のプログラム(エディターなど)を指定したほうが便利です。 なぜなら、以下の方法では、ソースを表示して、それを クリップボードにコピーする、という手段をとるからです。 (フレームの場合、一度フレームを名前を付けて保存してから、 エディターで開かないといけないかもしれません。)
どのプログラムも基本的に時間がかかります。
ちなみに、ユニコード2.0の中の完成型ハングルは次のような 配列になっています。 ローマ字表記法はいろいろありますが、大丈夫でしょう、きっと。
字母番号 0:k 1:kk 2:ks 3:n 4:nc 5:nh 6:t 7:tt 8:r 9:rk 10:rm 11:rp 12:rs 13:rth 14:rph 15:rh 16:m 17:p 18:pp 19:ps 20:s 21:ss 22:ng 23:c 24:cc 25:ch 26:kh 27:th 28:ph 29:h 30:a 31:ae 32:ya 33:yae 34:eo 35:e 36:yeo 37:ye 38:o 39:wa 40:wae 41:oe 42:yo 43:u 44:wo 45:we 46:wi 47:yu 48:eu 49:yi 50:i
初声番号 0:k 1:kk 2:n 3:t 4:tt 5:r 6:m 7:p 8:pp 9:s 10:ss 11:ng 12:c 13:cc 14:ch 15:kh 16:th 17:ph 18:h 中声番号 0:a 1:ae 2:ya 3:yae 4:eo 5:e 6:yeo 7:ye 8:o 9:wa 10:wae 11:oe 12:yo 13:u 14:wo 15:we 16:wi 17:yu 18:eu 19:yi 20:i 終声番号 0:(null) 1:k 2:kk 3:ks 4:n 5:nc 6:nh 7:t 8:r 9:rk 10:rm 11:rp 12:rs 13:rth 14:rph 15:rh 16:m 17:p 18:ps 19:s 20:ss 21:ng 22:c 23:ch 24:kh 25:th 26:ph 27:h
それから、KS完成型ハングルとユニコード完成型ハングルの
コード変換表は、Information regarding Hangeul
から入手しました。
http://asadal.cs.pusan.ac.kr/kr-jtc1-sc2/k984f.txt
です。
10進数ユニコード数とEUC-KRのハングル文字との対応表を作成しました。
(上のk984f.txtをPerlスクリプトで成形したものです。)
御自由にお使いください。
ftp://ftp.unicode.org/
から入手できるコードテーブルを使って、KS-C-5601(ハングル、記号、
漢字など)および統合型ハングルコード(Unified Hangeul Code)(のうち
EUC-KRに入っていない部分)と10進数ユニコード数との対応表を
作成しました。(間違いがあったらごめんなさい。一部手動で作成したので。)
ご自由にお使い下さい。
そうそう、IE4では "escape(str)"の結果がユニコードになる、 というのは、韓国・朝鮮メーリングリスト の[kmlabs 4269]で知ったのでした。
また、UTF-8なファイル作成には、 Juria's WIN32 Editor を使用しました。 なぜMeadowを使わなかったかというと、 KS X 1001(旧KS C 5601)に入っていない Microsoftオリジナルコード(UHC)の中の文字(Meadowでは使えない)を 使っているからです。