(インターネットからのフランス研究)
4.文学・思想研究へのパソコンのその他の利用法
(1)電子テキストからコンコーダンスやインデックスを作成する
5) Micro-OCP. Oxford Concordance Program, 1988. OS: DOS3.0 or later.
このソフトは DOS用のコンコーダンス・インデックス作成ツールである。従って、文字コードとしてはいわゆる "拡張ASCII"系のDOS 用コードを用いなければならない (コードページ850, 863, 437 など) 。現在インターネットから入手できる電子テキストは "ANSI/ISO 8859 Latin1" のコードを使っている場合が多い (Windows コードページ1252はこのコードに基本的に対応している) (以下、このコードを便宜的にANSIコードと呼ぶことにする) 。拡張ASCII 系コードページと ANSI とではフランス語特殊文字のコードが異なる。そこで、Micro-OCP を使用するには、 ANSI コードによるフランス語テキストを、使用するDOS 用コードに変換しなければならない。
(エディタを使ってのコード変換)
テキストエディタなどで、 ANSI コードによるテキストの中の特殊文字を検索し、それをDOS のコードに置換するという作業を特殊文字の種類だけ繰り返せば、この変換をすることができる。そのためには"ANSI/ISO"と拡張ASCII 系コードページの両方についてフランス語特殊文字それぞれのコードを知る必要があるが、筆者は、"ANSI/ISO"については日本規格協会から "ISO 8859-1" のコードの規格書を取り寄せ、拡張ASCII 系コードページについては文献 [12] を参照した。
置換をいちいち手作業で行うのは大変だが、「マクロ」を組んでこの作業を自動的に行わせることができる。ここでは 1) でも触れた 「秀丸エディタ」の場合を見てみたい。この秀丸マクロの利用法、マクロファイルの記述法は 中尾浩さんに教えていただいた。秀丸のマクロでは欧文特殊文字は「\x00」の書式で16進コードで指定する。たとえば e accent aiguは ANSI では16進コードで E9 の位置、コードページ850 では16進コードで 82 の位置にある。したがって、E9のコードを82のコードに置換することになるが、マクロとしては次のように記述する。
replaceallfast "\xE9", "\x82";
置換したい特殊文字の分だけ同様に記述し、マクロファイルとしてまとめる。この際、一度変換した文字が再度変換対象にならないように記述の順序に気をつける必要がある。このマクロファイルを秀丸本体 (HIDEMARU.EXE) と同じフォルダに置いておき、秀丸で開いたANSIコードのフランス語テキストに対してこのマクロを実行すれば、DOS コードへの変換を行うことができる。
筆者が試作したマクロファイルは、次のファイル名の色文字部分をクリックすればダウンロードできるので、適宜利用していただきたい。 ANSI-->DOS(850)変換用マクロ−− "ansi2dos.mac" 、DOS(850)-->ANSI 変換用マクロ−− "dos2ansi.mac" 。ダウンロードした後で秀丸本体と同じフォルダに移せば、マクロを実行することができる。 (Netscapeではクリックすると直接ファイルの内容を見ることができ、次に保存 (Save) の操作をすればよい。Internet Explorer では指示に従ってダウンロードする。ダウンロードしたファイルをエディタなどで開けば内容を見ることもできる。)
以上のようにしてテキストをDOS のコードに変換した後、Micro-OCP をDOS 上で起動して、解説書に従って操作すれば、さまざまな形式のコンコーダンスやインデックスを作成することができる。
出力した結果を再び ANSI/ISO 8859-1 (またはWindows1252)のコードに戻すには、上に掲げたDOS -->ANSI 変換用秀丸マクロを使えばよい。また、このDOS(850)--> ANSIの変換のためには、パソコン通信ニフティサーブのFLR 会議室付属のデータライブラリに「DOS-> Windows 欧文文字変換ソフト ACOVDTW4 」というフリーウェアのソフトが登録されているので、それをダウンロードして利用することもできる。