[Prev][Next][Index]

日本語のテキストファイルが文字化けで読めない



[A]
日本語のテキストファイルが文字化けで読めません。どうすればよいですが。

[Q]
Windows と UNIX のファイルでは、テキストファイルでも改行コードと漢字コードが異なります。 ファイルの漢字コードが Windows の場合は、nkf コマンドを利用して UNIX の漢字コードに変換して下さい。

■ OS( Windows、UNIX、Macintosh )よって漢字コードは異なる

  1. 日本語EUC  ← UNIX で一般的に使用されている方式です。
  2. 7ビットJIS ← 電子メールやネットニュースを日本語でやり取りします。
  3. シフトJIS  ← MS-DOS 系列の MS-DOS、WINDOWS や Macintosh で使用される方式です。

■ OS によっても行の終了を示す改行コードが異る

  1. LF (ラインフィールド)  ← UNIX で一般的に使用されている方式です。
  2. CR+LF         ← MS-DOS、WINDOWS で使用されている方式です。
  3. CR (キャリッジリターン) ← Macintosh で使用される方式です。

■ nkf コマンドを利用して UNIXの漢字コードに変換

  1. 手順としては、まずファイルの漢字コードを下記のコマンドで調べて下さい。
    % kcc -c ファイル名

  2. Windows ファイルを UNIX ファイルに変換します。-d は、改行文字から CR コードを削除しま 。 -e は、文字コードを日本語 EUC に変換します 。

    % nkf -ed 元のファイル > 新しいファイル  ( EUC コードに変換)

  3. UNIX ファイルを Windows ファイルに変換します。-c は、行末に CR を追加します 。

    % nkf -sc 元のファイル > 新しいファイル  ( SHIFT-JIS コードに変換 )

  4. 他の漢字コードに変換します。
    % nkf -j 元のファイル > 新しいファイル  ( JIS コードに変換 )