!日韓混在文編!

ちょっと情報が古くなっています。 少しずつ更新していくつもりです。

Windows95で日本語と朝鮮語の混ざった文書を 作成、印刷する方法をいくつか紹介します。

ここでは、入力方法については考慮しません。

目次

フォントを直接指定する方法

ワープロソフトの場合

ワープロソフトでフォントを指定すれば、 日韓混在文が作れます。 互換性のあるワープロソフト、同じフォントを 持っている人と文書を交換できます。

Shift-JIS化 KSフォントの場合

「標準ハングル」フォントなどの Korean Writer 互換コード などは、フォントの属性が「日本語」となっています。 これは「CodePage 932」を意味しているのだと思います。 (CodePageとは、Unicodeとの変換表のことです。 本当は、文字をコードに変換する関数のことらしいですが、 そういわれても良くわかりません。) これらは、普通の日本語フォントと同様に使えます。

Unicodeで内部処理をするプログラムの場合、 UnicodeとShift-JISの間でコード変換をしています。 完成型ハングルの部分は、この変換の(Shift-JIS側の)定義域に 入っていますが、記号や漢字などは、定義域に入らなくて、 プログラム上でうまく動かないことがあるそうです。 そのため、最近の市販のShft-JIS化KS(Shift-KS)フォントは 記号や漢字などは配置を変更しているのだそうです。 (製品ごとに、変更の方法が異るのだそうです。)

KSフォントの場合

MicroSoft Internet Explorer 3(4) の韓国語サポートを インストールすると、Gulimche というフォントが 使えるようになります。 このフォントの属性は「韓国語」です。 これは「CodePage 949」を意味しているのだと思います。

日本語のShift-JISコードと韓国語のEUC-KRコードは どのコードが2byte文字か、という情報が異なります。 そのため、2byteのハングルが左半分と右半分と ばらばらになって、文字化けすることがあります。 (カーソルがハングルの真ん中に来たり、 ハングルの真ん中で改行されたり。)

再描画させたり、恣意的に改行するなど、 工夫が必要です。

html文書の場合

html文書(ホームページ文書)でも、フォントの指定はできます。 しかし、Internet Explorer 3 以外では、ただしく 表示できないかもしれません。(Shift-JIS用フォントと EUC-KR用フォントの混在の場合。)

なばさんのサイトでは、 Korean Writer 互換フォント (Shift-KS フォント)を指定することで 日韓混在文を実現されています。 Internet Explorer 3、4、及びNetscape Navigator 4でのみ 可能なようです。Style sheet を使用されています。 (Korean Writer 互換フォントを複数指定個指定しています。 Style Sheetを使わないと、本文で何度もフォントを直接指定しないと いけなくなります。)

いずれの場合も、Shift-JISコードではなくて、 EUCコードで保存した方がいいと思います。 なぜなら、
1. Shift-JISとEUC-KRが混在していたら、Webブラウザの日本語自動判別機能 が混乱するかもしれない。
2. Korean Writer 互換コードを使う場合は、 Shift-JISで書かれた日本語部分と一緒にEUCコードに変換しておくと、 ハングル部分はEUC-KRになっているので、Korean Writer 互換フォントが なくてもハングル部分が読める。
からです。

KSコード内にある 平仮名、片仮名を使う

KSコードには漢字、平仮名、片仮名が入っているので、 これらを使って日本語を表記できます。

この方法だと、すべてKSの範囲でおさまるので、 韓国人に日本語の電子メールを出すことができます。

注意点としては、

などがあります。

コードコンバーターを使う場合

JIS=>KSに使えるコードコンバーターには、 Unicode経由による変換と、独自の変換表による変換の2種類に区別できます。

単純にUnicode経由による変換だと、上の注意点のようにうまく 変換されないので、独自の変換表による変換の方をお勧めします。 (音引き「ー」が変換されない、とか、漢字の「国」が変換されないとか、です。 独自の変換表を使う場合は、マイナス記号の「−」で代用したり、 旧字の「國」におきかえてくれたりする訳です。)

「ピョンジ」「パランセ」「kajero」 などを使えば、簡単に変換できます。これらはGUI (マウスを使った簡単操作)で変換できます。

hrks.com を使っても同様のことができます。 hrとは、Nifty Serve内の private フォーラム「アタゴオルのハングル工房」 内で使われている、独自の方法で日韓混在文を実現する コードです。 hrksは、このhrをksをはじめとする各種コードに変換するための MS-DOSのフィルタープログラムです。
hrの特性上、日本語のhtmlファイルを作って、それを KSコードに変換しようとした場合、 タグ内の半角アルファベットがハングルに変換されます。 (アルファベットをそのまま出力するには、"["と"]"で 囲まなければならないので。)

j2kを使っても、同様のことができます。 これもMS-DOS用のフィルタープログラムです。 conv.ksがEUC-KRコードで書かれていればEUC-KRで出力されますが、 Shift-KSコードで書かれていればShift-KSで出力されます。

直接漢字や仮名を入力する場合

ハングルIMEには漢字変換機能があるので、それで 直接漢字を入力できます。 MSIE4専用IMEの場合、子音を漢字変換させれば記号や仮名も 入力できます。 また、記号入力ツールを 使えば、平仮名、片仮名を入力することができます。

kWnn95などのKoreanWriter互換コード を使う場合、最終的にEUC-KR(KSコード)に変換しないと、 韓国人には読めません。 それをkWnnのコードコンバーターでKSコードに変換するのであれば 別に問題ありません。
しかし、日本語用の「Shift-JIS <-> EUC-JP」コンバーターを 使ってEUC-KRに変換しようとしても、うまくいきません。

kWnnコードは、外字領域にひらがな、カタカナが 重複して定義されています。 そして、kWnnの記号入力ツールを使うと、 外字領域の方にある仮名が使われるのです。 これは、Unicodeで内部処理をするプログラムでも使えるように、 わざとそうしているのだそうです。

Unicodeを使う

Unicodeなら当然日韓混在文を扱えます。 ただし、 日韓の漢字の字体を区別できない、 という問題点があります。 つまり、文章を書いた人は日本の漢字を意図していても、 その文書ファイルを読み込むアプリケーションは (同じUnicode番号の)韓国の漢字で表示する、という ことがありうるわけです。

Aprotool TM Editorは Unicodeに対応しています。 さらに、Unicodeに言語情報を付け加えた独自のコード系である "ESC:フォーマット"を採用することにより、 日韓の漢字の字体の区別もできます。

kajeroエディターや xyzzyエディター、 Meadow(Emacs20)は 日韓両フォントを同時に使用できます。 しかし、Unicodeで保存した時点で、どちらの漢字であるか、 といった情報は失われます。

Webサイト"rikichan帝国"には Unicode(UTF8)を使った日韓混在文のページがあります。 ブラウザのフォント設定の話などもあります。

ISO-2022の規則を使う

エスケープ文字列を使って文字集合を切り替えることにより、 多言語文書を実現する方法です。 従って、日韓の漢字の字体の差は保存されます。 JUNET、7bits ISO-2022、ISO-2022-JP-2、Compound Textなどがありますが、 これらがどう違うのかは知りません。(微妙に異なるみたいです。)

kWnn95には kWnnフォントを使ったRTF(リッチテキスト)ファイルと Compound Textとの間のコードコンバーターがあります。

また、kajeroエディターでも この方法で日韓混在文を扱えます。 保存形式を7bitsに指定しておけば、できたファイルは kWnnで使用できます。 しかし、残念ながら、逆はうまくいかないようです。

xyzzyでも Meadowでも Compound Textは使えると思います。 Mule for Windowsでは 日韓どちらか一方のフォントでしか表示できません。

Aprotool TM Editorの場合、 ISO-2022を利用した独自のコード系(ISO-2022-ESC B)を使用することにより 日韓混在文を楽しめます。(メニューから、"多言語"−>"ESC:"を 選んだ上で、"オプション"−>"文字コードの設定..."を選び、 "ISO2022"を指定する。)

JISコードのみを使う

特別なコードは使わない場合

この場合は、当然ハングルは使用できません。 片仮名を使うしかありません。

英語式にハングルをローマ字化する方法もあります。 この場合、ローマ字化の仕方に一般規則はないので、 手作業でする必要があります。
例えば、「白」という苗字は、"Paik" と書く人もいれば、 "Back" と書く人もいます。 "大宇" は"DaeWoo" なのに、 歌手の"ソテジ"は SeoTaiji"です。 歌手の"カンスジ"は、"Kang Soo Jee" だったり "Kang Susie" だったりします。

ここでは、(IMEの話はしない、という方針を破って) 朝鮮の人名や地名を漢字で表す場合に 便利なプログラムを紹介します。

Mule for Windowsでは quail機能の中に「hanja-jis」というのがあります。 これは2bol式キーボードでハングルを入力して (実際にはハングルは表示されません)、 JIS漢字に変換する機能です。

なばさんの 「くろねこの単語−(1) 韓国関係」 を使うと、韓国関係の単語のための変換辞書を登録できます。 MS-IME用とATOK用があります。

絵でハングルを表現する

HRtoolsの中の ハングルバナー(hrban.com)、笹本ハングル(hrss.com) を使用することにより、日本語文書の中にハングルを *図形、絵* として表現できます。
朝鮮語の単語をいくつかハングルで表したい時は便利かも?

画像ファイルでハングルを表現する

日本語ホームページの中で部分的にハングルを使いたい時は、 画像ファイルでハングルを表現する方法もあります。

HRHTMLを使うと、 そのようなhtmlファイルを簡単に作成できます。

ユニコードでエスケープする

Microsoft Internet Explorer 4 でのみ、読み書きできる方法です。 ハングルのユニコード番号の10進数表示を使って、 Shift-JISファイル内にハングルを埋め込みます。 Web掲示板でよく見かけます。 (たとえばInternet Explorerで書き込むと、自動的にこの形式になります。)

完成型ハングルの「フト」(ka)のユニコード番号は、 44032(10進数) = AC00(16進数)であり、これを
&#44032;
といった形にエスケープしているのです。

おまけ――自作プログラミング(?)編」 も参考にしてください。

Hanglinを使うと、クリップボード経由で この形式に変換できます。

ハングルを適当に変換する

日本のパソコン通信でハングルを扱う時、 ハングル部分を適当に変換して特別な符号で囲むことにより、 Shift-JIS文書としてネット上で交換している方々がいます。

HR方式は、ハングルをHRという独自のローマ字を使って表記し、 日本語文書の中に挿入します。 この時、HRと認識されたくないアルファベットは ”[”と”]”で囲みます。

AN方式は、Shift-KS (EUC-JPをShift-JISに変換する法則を使って EUC-KRを変換したもの。したがってShift-JISの文字領域におさまる) で書いたハングル(やKS記号、KS漢字)を”[:”と”:]”ではさんで 日本語文書に挿入します。

"HRtools""ハングル Viewer"を使って ハングルのコード変換や表示ができます。

南北朝鮮が合意したハングルのローマ字表記を 使う方法もあります。 (読み手には、読みにくいかもしれません。) この場合、発音どおりにローマ字化するのではなくて、 ハングル表記を復元できる形でローマ字化します。
"hcode"を使えば、 EUC-KRコードをこのローマ字に変換できます。

韓国のFTPサイトには、別のローマ字表記のための プログラムもあるようです。

"hcode"を使えば、 2揃い式キーボードでハングルを打った時のキーを、 アルファベットで現わしたものにも変換できます。 (読み手には、絶対読みにくいと思います。) 例えば、"安寧" のハングルは、"aks-sud"と 変換されます。

LaTeXを使う

須賀井 義教さんの コンピュータと朝鮮語のための覚え書き / MEMORANDUM が詳しいです。お勧めです。

また、韓国のTeXユーザーグループのホームページ http://www.ktug.or.kr/ Korean TeX Users Group も有用だと思います。

OTFパッケージを使う。

OTFパッケージを使って、pLaTeXで組版して、 さらにdvipdfmxを使ってdviファイルをpdfファイルに 変換する、という方法もあります。 ここを見てください。

kTeXを使う

kTeX(KoreanTeX)を使うと ハングルが印刷できます。 横書しか使えませんが、 KS完成型コードに含まれない現代ハングルも使用できます。 ハングルモードの中で、独自のローマ字表記をします。

今昔文字鏡用マクロを使う

今昔文字鏡という9万字の外字フォント集があります。 このフォントをLaTeXで使うためのマクロ(styleファイル)その他一式が motexdoc.lzhという圧縮ファイル名で配布されています。 ASCII版pLaTeX2eとdviout for windows を使う場合、 TrueType フォントの文字鏡フォントで印刷できます。

このmojikyo.styというスタイルファイル(マクロ)を使うと、 ユニコードの中の漢字(ハングルを含む)も使うことができるそうです。 ただし、ユニコードフォントを1byte fontに変換しておかないと 使えないのだそうです。

&#44032;の形式でユニコードフォントを(ハングルを)指定できるのだそうです。 Internet Explorer で、閲覧ページを保存する時に エンコードを"Shift-JIS"などにしておけば、自動的にハングルは &44032;の形式(SGMLやXMLの文字参照)に変換されます。

xbmkanji.styを使う

xbmkanji.styという外字スタイルファイルを使うと、 xbm形式の画像やbdf形式のフォントファイルを表示できます。

BDFフォントを使用する場合、7bitの文字コードで指定してください。 8bit(EUC-KRなど)の文字コードで指定してはいけません。

xbmkanji.styは作成者の安岡孝一氏のホームページ
http://www.kudpc.kyoto-u.ac.jp/~yasuoka/index-j.html
から入手できます。

ハングル(KS C 5601)のBDF フォントとしては、
ftp://ftp.etl.go.jp/pub/mule/fonts
の中にある korean.tar が使用できます。

mule2texを使う

muleで編集した多言語LaTeXファイルを LaTeXで使える形式に変換するプログラムです。 ハングルの場合、ハングルフォントを指定してくれます(サブフォントマクロ)。 (実は、JUNETコードからサブフォントマクロへ変換するわけなので、 mule(Emacs、Meadow)だけでなくkajero editorやxyzzyからでも使えるはずです。)

小野康男さんのホームページ
http://www.asahi-net.com/~RQ5Y-ON/index.htm
にはPDFファイルで簡単な紹介があります。

現在のところ、NIFTYからしか入手できないようです。 また、ハングルの場合、KSコードの中の漢字や記号には 対応していないそうです。

cygwinを使ってインストールできます(Perlも必要)。 フォントとしてハングルのBDFファイルが必要です。 また、これをMETAFONTに変換するために、bm2mfという プログラムが必要です(これは、Internet上でも入手可能)。

DIVOUTの設定としては、 [Option] => [Setup parameters...]を選ぶと "DVIOUTのプロパティ"というウィンドが現れますが、 "FONT"タブの中の、"TEXPK"の項目を正しく指定する必要が あるようです。 これは、"Guess"ボタンを押せば自動的にしてくれますので、 その後で"Save"ボタンを押してください。

いろいろと試行錯誤しながらインストールしたので、 手順を忘れてしまいました。 一からやりなおしてみてから、説明を書きます。 おそらく、NIFTYの過去ログにはWindowsへのインストールに おける注意点が説明されているのだと思います。

LaTeXで多言語を扱う方法

以下は、私は使ったことはないのですが、 LaTeXで多言語を扱う方法を紹介した ホームページ(や書籍)を紹介します。

LaTeXの情報収集には、有名な
http://www.matsusaka-u.ac.jp/~okumura/texwiki/
TeX Wiki
が便利です。

pTeXと多言語処理

よしだともこさんのホームページ

http://www.biwa.or.jp/~tomoko/root/9601.html
よしだともこのルート訪問記(12) Mac とUNIX でヘブライ語の環境を構築!

京都産業大学外国語学部の竹内茂夫さん
(ArabTeXの紹介あり)
http://www.biwa.or.jp/~tomoko/root/9704.html
よしだともこのルート訪問記(27) タイトル:千客万来 多言語厨房
京都大学人文科学研究所の斎藤希史さん
(LaTeX CJK の紹介あり)

書籍『よしだともこのルート訪問記』

上の2つの記事に加えて、書き下ろしとして、
Mule(Emacs)とLaTeXによる古典ギリシア語環境の実現
水落健治さん、高橋直人さん、鎌田雅年さん
(Emacs20用とMeadow用の古典ギリシア語環境構築おまかせパク が付録CD-ROMに入っています。)
が収録されています。

NPX(高橋直人さんのMule/Emacsに関する非公式拡張のページ)

http://www.etl.go.jp/etl/divisions/~ntakahas/npx/
上の古典ギリシア語(cgreek-emacs20)その他のLISPプログラムあり。

大阪外大のページ

http://www.osaka-gaidai.ac.jp/~mes/multi/multi.html
(ArabTeXの紹介あり)

「pLaTeX2e for WINDOWS Another Manual Vol.1 Basik Kit 1999」

乙部巌己+江口庄英 著、SOFTBANK発行 (1998年10月)
(注意:1996年12月に出た「Vol.1 Basik Kit」の改訂版です。)
付録CD-ROMの中に、MulTeX と Ω(ユニコード用のTeX)が 入っています。

小野康男さんのホームページ

http://www.asahi-net.com/~RQ5Y-ON/index.htm
LaTeXで多言語を使用する方法がいくつか紹介されていますが、 PDFファイル化されていますので、 Acrobat Reader (またはGhostScript)が必要です。
(Babel、mule2tex、外字利用法の紹介あり)

金水 敏さんのホームページ

http://www.lit.kobe-u.ac.jp/~kinsui/welcomej.htm
LaTeX用の漢文作成パッケージ"

永田善久さんのホームページ

http://www.lg.fukuoka-u.ac.jp/~ynagata/latex.html
LaTeX によるドイツ語・日本語処理の詳しい説明あり。

作成日:1998年 5月 1日
更新日:2006年 3月10日

chiyu (chiyu@sings.jp)
目次に戻る