it-swarm-ja.com

特定のページにリンクしているページを見つける方法は?

次のページがあります

http://www.fda.gov/downloads/scienceresearch/fieldscience/laboratorymanual/ucm092156.pdf

このページにリンクしているwww.fda.govのページを見つけたいですか?どうやってやるの?

1
Norfeldt
  1. wgetを使用して、Webサイト全体を再帰的にダウンロードできます。

    wget --recursive --page-requisites --html-extension --no-parent --domains www.fda.gov www.fda.gov

  2. 次に、egrepを使用してすべてのファイルを再帰的に検索し、ucm092156.pdfにリンクしているページを見つけることができます。

    egrep -r -o '*ucm092156.pdf' www.fda.gov/

2
Mark Riddell