yuu_nkjm blog
2010-06-01(Tue) [長年日記] 編集
[Windows 7 (64bit)] DeepBurnerでisoイメージをDVDに焼く
Windows 7 (64bit)上ではライティングソフトとして,DeepBurnerを使っています.isoデータの書き込みを2,3回やってみた範囲では問題なく動いているようです.普通にファイルを焼いたことはないのですが,大丈夫でしょう.
2010-06-02(Wed) [長年日記] 編集
[WebSite][backup][Script] warrickでInternet Archiveや検索エンジンのキャッシュから過去のWebサイトを復元する
最近,「xxxってサブドメインのWebコンテンツが見られないよー」という指摘を受けた.「DNSの引っ越しミスか?」とか思ってたんだけど,Webアドミンがコンテンツそのものの引っ越しを忘れていたようだorz.
Webアドミンはコンテンツのバックアップも取ってないみたいだし,どうすっかなってことで,まずはInternet ArchiveからFirfoxのアドオンのScrapbookでぶっこぬくことを試みた.しかし,これでやったところ,imgタグのsrcやaタグのhrefがInternet Archive用に変更されたままになってしまい,その後の再構成がめんどくさそうだった.
Google先生にお伺いを立ててみると"warrick"というスクリプトが良さそうだったので,これを使ってみる事にした.
手順
-
Warrick Downloadingからwarrickをダウンロード.普通に展開.
tar zxvf warrick-1.8.tar.gz
- Perl,SOAP-Lite,XML-Parser,expatあたりが入っていなかったら,yastで追加する.
-
下記の様なコマンドを発行すれば,スクリプトを実行したディレクトリの下に"www.foo.hoge.jp"ができて,その下に復元される.はじめにサイトの分析が入るからか,保存ディレクトリがしばらく出来ないので,気長に待つと良し.
上のコマンドの意味は,「再帰的に,重複を除いて,利用できる全てのリソース(InternetArchive, Yahoo, Google, Bing)から,ログを取りながら再構成する」だったかな.詳細は,Warrick Runningを参照の事.warrick.pl -r -d -nc -o log.txt "http://www.foo.hoge.jp/"
ちょっと見るだけなら
http://404.undo.jpが便利そう.
(※サイト検索用キーワード: Webのアーカイブサイトの名称をすぐに思い出せないことが多い.思いつくのは,InternetArchive,Web Archive,Web Archivesとか似てるけど違う名前ばかり.)