it-swarm-ja.com

iso-8859-1 latin1エンコーディングでファイルを読み取る方法は?

iso-8859-1 latin1エンコーディングのファイルを読み取るには、どのパッケージをインストールする必要がありますか?

現在、テキストではなく変な文字しか表示されません。

% locale

LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
1
evfwcqcg

どちらのエンコードもASCIIのスーパーセットであるため、latin1エンコードはUTF-8と「ほぼ」互換性があります。つまり、通常の文字(a-z)は表示されますが、発音区別符号(é、èなど)は表示されません。ファイルの実際のエンコーディングが何であるかを理解してみましょう。

まず、fileコマンドはエンコーディングを検出できる場合があります。単に使用してください:

$ file weird_file

あなたは得ることができますweird_file: ISO-8859 text for latin1、weird_file: UTF-8 Unicode text UTF-8、またはその他。ここで、それがlatin1であると判断した場合、表示する最良の方法は、実際にはgeditなどのエディターを開き、ファイルを開くときに正しいエンコーディングを選択することです。ファイルをUTF-8に変換する場合は、「名前を付けて保存」してUTF-8を要求できます。

それでもエンコードがわからない場合は、Libre Officeでドキュメントを開いてみてください。通常、検出に優れています。また、ファイルが破損している(たとえば、UTF-8テキストがlatin1として解釈され、UTF-8として保存されている)か、ほとんどの場合、テキストが含まれていない可能性があります。確認できるよう、お気軽にアップロードしてください。

2
Jennifer Wilson