サロゲートペアの代替文字

Utf16sjisコマンドは、surro.csvおよびUTF-16~MS932.binにしたがって、UTF-16からシフトJISにテキストを変換します。下線( _ )は、シフトJISの2バイト文字に含まれています。テキストにサロゲートペアが出現した場合、Utf16sjisコマンドは、サロゲートペアをたとえば下線に置換しますが、利用者は、シフトJISの2バイト文字から新しい代替文字を選択できます。

手順

  1. 2000B, 20089, 200A2など十六進数でサロゲートペアの符号位置(コードポイント)を表現してください。
  2. surro.txtの各行に1個の十六進数を記入してください。
  3. surroコマンドで、surro.csvを作成してください。
  4. surro.csvの各行に新しい代替文字を記入してください。
UTF-16LE
符号位置を上位および下位のサロゲートで表現した

詳細は、Utf16sjisコマンドのユーザーズガイドを参照してください。PDF