(^^;
)。リッチテキストル←→テキストファイル針谷壮一さんのサイトにあります。
テキストファイル←→テキストファイル
のあいだで、文字コードのコンバートを行ないます。対応コードは、Unicodeのほかヨーロッパ・アジアの各種コードの計57種類です。
MS-Wordなどの多言語対応のワープロでは、標準のWord文書形式(拡張子.doc)のほかに、リッチテキスト形式(拡張子.rtf)により保存することができます。このリッチテキスト形式は多言語混在可能なファイルで、フォント・文字セット・レイアウト・図表・画像など、Word文書形式とほぼ同等の内容を保存することができます。
このリッチテキストファイルをMS-Wordでテキスト形式で保存しなおせば、リッチテキストファイルとテキストファイル間で事実上コンバートすることができるわけですが、この方法によると、Unicodeを介在して行なわれるため、Unicodeでのコード番号が異なる文字は違う文字と判断され、大量の文字化けが起こる可能性があります。
これを防ぐために、この「RTFコンバータ」では独自のUnicode異体字検索テーブルを持っており、日本漢字・中国簡体字・台湾繁体字で字体の違う漢字でも、異体字を検索して、適切な出力を行なうことができます。たとえば、MS-Word上で中国語簡体字により
「再見」
と打って、テキストファイル(日本語)で保存すると、「再?」のように文字化けしますが、「RTFコンバータ」ではきちんと「再見」のように変換します。
同様に、MS-Wordでは、ヨーロッパの言語で使われるアクサンのついたローマ字を、日本語テキストファイルで保存すると「?」で出力されてしまいます。たとえばフランス語の「ete」(夏)は「?t?」のように保存されますが、「RTFコンバータ」では、日本語テキストファイルに変換すると、「ete」のようにアクサンのないローマ字を出力します。
また、各言語の各種エンコードに対応しているので、異なる言語のテキストファイル間のコンバートや、日本語シフトJIS・EUC・JIS間のコンバート、中国語GB・HZ間のコンバートも行なうこともできます。
なお、ファイルの分割・復元にはJack32.dllが必要で、統合アーカイバプロジェクトにあります。
echo test > test.txt:stream.txt
v(^^)