it-swarm-ja.com

`wget`が直接ファイルではなくindex.htmlをダウンロードするのはなぜですか?

これをダウンロードしようとしていますが、常にメインページにリダイレクトされ、最終的には、ダウンロードしようとしているファイルではなく、index.htmlファイルをダウンロードするだけです。

http://tweaking.com/files/setups/tweaking.com_windows_repair_aio.Zip

正しくダウンロードする方法を知っていますか? --user-agent = "firefox + linux、IE + windows、(あなたが考えることができるものなら何でも)"を使用しましたが、機能しません。

これは出力であり、--user-agentが有効になっている場合と同じです。

[email protected]:~$ wget  http://www.tweaking.com/files/setups /tweaking.com_windows_repair_aio.Zip--2012-04-13 19:40:07--  http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.Zip
Resolviendo www.tweaking.com... 199.119.100.39
Conectando con www.tweaking.com[199.119.100.39]:80... conectado.
Petición HTTP enviada, esperando respuesta... 302 Found
Ubicación: http://tweaking.com [siguiente]
--2012-04-13 19:40:08--  http://tweaking.com/
Resolviendo tweaking.com... 199.119.100.39
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 302 Moved Temporarily
Ubicación: http://www.tweaking.com [siguiente]
--2012-04-13 19:40:08--  http://www.tweaking.com/
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 200 OK
Longitud: no especificado [text/html]
Grabando a: “tweaking.com_windows_repair_aio.Zip.1”

    [ <=>                                                                            ]     46.913       234K/s   en 0,2s    

2012-04-13 19:40:09 (234 KB/s) - “tweaking.com_windows_repair_aio.Zip.1” guardado [46913]
5
Jaheaga

ユーザーエージェントは良いスタートですが、その場合は十分ではありません。頻繁にチェックされるもう1つのHTTPヘッダー値は、「リファラー」[原文のまま!]です。 Wikipedia:HTTPリファラー を参照してください。

wgetには、参照ページを指定するための--referer=urlオプションがあります。 Wiresharkでダウンロードが成功したかどうかトラフィックを分析すると、私のテストシステムからの次のリクエストが使用されたことがわかります。

GET /files/setups/tweaking.com_windows_repair_aio.Zip HTTP/1.1
Host: www.tweaking.com
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:11.0) Gecko/20100101 Firefox/11.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-gb,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: keep-alive
Referer: http://www.tweaking.com/content/page/windows_repair_all_in_one.html

この場合、User-Agentを偽造する必要はないようです。

wget --referer=http://www.tweaking.com/content/page/windows_repair_all_in_one.html  http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.Zip

トリックを行います。

10
zpea