it-swarm-ja.com

正しいファイル拡張子

さまざまなファイルタイプの画像が約12000個ありますが、それらはすべて* .jpgという名前に変更されました。

今、私は彼らに適切な拡張子を返したいです、どうすればいいですか

15
akabhirav

あなたはbashで比較的簡単にそれを行うことができます:

for f in *jpg; do 
    type=$(file -0 -F" " "$f" | grep -aPo '\0\s*\K\S+') 
    mv "$f" "${f%%.*}.${type,,}"  
done

これは@ A.Bの答えと同じ考え方ですが、findの代わりにシェルグロブを使用しています。 ${f%%.*}は、拡張子のないファイル名です。 fileコマンドの-0は、grepに使用するファイル名の後に\0を出力します。これは、スペース、改行などを含む任意のファイル名で機能するはずです。 ${type,,}は、小文字の拡張子を取得するためのトリックです。 PNGpngに変換します。

あなたは質問で言っていませんでしたが、これを再帰的にしてサブディレクトリに降りる必要がある場合は、代わりにこれを使用できます:

shopt -s globstar
for f in **/*jpg; do 
    type=$(file -0 -F" " "$f" | grep -aPo '\0\s*\K\S+') 
    mv "$f" "${f%%.*}.${type,,}"  
done

shopt -s globstarは、**がサブディレクトリに一致するようにするbashのglobstarオプションを有効にします。

グロブスター

設定されている場合、パス名拡張コンテキストで使用されるパターン**は、すべてのファイルと0個以上のディレクトリとサブディレクトリに一致します。パターンの後に/が続く場合、ディレクトリとサブディレクトリのみが一致します。

22
terdon

以下のスクリプトを使用して、誤って設定された拡張子.jpgを(再帰的に)正しい名前に変更できます。判読できないファイルが見つかった場合、スクリプトの出力で報告します。

スクリプトはimghdrモジュールを使用して、次のタイプを認識します:rgbgifpbmpgmppmtiffrastxbmjpegbmppngimghdrモジュールの詳細 here 。リンクで説明されているように、リストはより多くのタイプで拡張できます。

そのままで、質問で述べたように、拡張子が.jpgのファイルの名前を変更します。わずかな変更で、任意の拡張機能または特定の拡張機能セットを正しい拡張機能(または here などの拡張機能なし)に変更できます。

スクリプト:

#!/usr/bin/env python3
import os
import imghdr
import shutil
import sys

directory = sys.argv[1]

for root, dirs, files in os.walk(directory):
    for name in files:
        file = root+"/"+name
        # find files with the (incorrect) extension to rename
        if name.endswith(".jpg"):
            # find the correct extension
            ftype = imghdr.what(file)
            # rename the file
            if ftype != None:
                shutil.move(file, file.replace("jpg",ftype))
            # in case it can't be determined, mention it in the output
            else:
                print("could not determine: "+file)

使い方

  1. スクリプトを空のファイルにコピーし、rename.pyとして保存します
  2. 次のコマンドで実行します:

    python3 /path/to/rename.py <directory>
    
11
Jacob Vlijm

注:私のアプローチは複雑すぎるようです。私はあなたの代わりに返事をしたいと思います。


コマンドfileを使用して、ファイルタイプを判別できます。

% file 20050101_14-24-37_330.jpg 
20050101_14-24-37_330.jpg: JPEG image data, EXIF standard 2.2, baseline, precision 8, 1200x1600, frames 3

% file test.jpg
test.jpg: PNG image data, 1192 x 774, 8-bit/color RGBA, non-interlaced

この情報を使用して、ファイルの名前を変更できます。

イメージにコマンドを適用する前にテストを行ってください

find . -type f -iname "*.jpg" -print0 | xargs -0 -I{} file -F"<separator>" {} | 
 awk -F " image data" '{print $1}' | 
  awk -F"<separator> " '{
   system("mv \""$1"\" $(dirname \""$1"\")/$(basename -s .jpg \"" $1 "\")."$2)
   }'

% find . -type f -name "*.jpg"
./test.jpg
./sub/20050101_14-24-37_330.jpg

% find . -type f -iname "*.jpg" -print0 | xargs -0 -I{} file -F"<separator>" {} | awk -F " image data" '{print $1}' | awk -F"<separator> " '{system ("mv \""$1"\" $(dirname \""$1"\")/$(basename -s .jpg \"" $1 "\")."$2)}'

% find . -type f -iname "*"    
./test.PNG
./sub/20050101_14-24-37_330.JPEG
3
A.B.