[Prev][Next][Index]
日本語のテキストファイルが文字化けで読めない
[A]
日本語のテキストファイルが文字化けで読めません。どうすればよいですが。
[Q]
Windows と UNIX のファイルでは、テキストファイルでも改行コードと漢字コードが異なります。
ファイルの漢字コードが Windows の場合は、nkf コマンドを利用して UNIX の漢字コードに変換して下さい。
■ OS( Windows、UNIX、Macintosh )よって漢字コードは異なる
- 日本語EUC ← UNIX で一般的に使用されている方式です。
- 7ビットJIS ← 電子メールやネットニュースを日本語でやり取りします。
- シフトJIS ← MS-DOS 系列の MS-DOS、WINDOWS や Macintosh で使用される方式です。
■ OS によっても行の終了を示す改行コードが異る
- LF (ラインフィールド) ← UNIX で一般的に使用されている方式です。
- CR+LF ← MS-DOS、WINDOWS で使用されている方式です。
- CR (キャリッジリターン) ← Macintosh で使用される方式です。
■ nkf コマンドを利用して UNIXの漢字コードに変換
- 手順としては、まずファイルの漢字コードを下記のコマンドで調べて下さい。
% kcc -c ファイル名
- Windows ファイルを UNIX ファイルに変換します。-d は、改行文字から CR コードを削除しま 。
-e は、文字コードを日本語 EUC に変換します 。
% nkf -ed 元のファイル > 新しいファイル ( EUC コードに変換)
- UNIX ファイルを Windows ファイルに変換します。-c は、行末に CR を追加します 。
% nkf -sc 元のファイル > 新しいファイル ( SHIFT-JIS コードに変換 )
- 他の漢字コードに変換します。
% nkf -j 元のファイル > 新しいファイル ( JIS コードに変換 )