yuu_nkjm blog

今後はhttps://scrapbox.io/yuunkjm/へ

トップ «前月最新翌月» 　　　追記設定

2010-06-01(Tue) [長年日記] 編集

[Windows 7 (64bit)] DeepBurnerでisoイメージをDVDに焼く

Windows 7 (64bit)上ではライティングソフトとして，DeepBurnerを使っています．isoデータの書き込みを2，3回やってみた範囲では問題なく動いているようです．普通にファイルを焼いたことはないのですが，大丈夫でしょう．

[ツッコミを入れる]

2010-06-02(Wed) [長年日記] 編集

[WebSite][backup][Script] warrickでInternet Archiveや検索エンジンのキャッシュから過去のWebサイトを復元する

最近，「xxxってサブドメインのWebコンテンツが見られないよー」という指摘を受けた．「DNSの引っ越しミスか？」とか思ってたんだけど，Webアドミンがコンテンツそのものの引っ越しを忘れていたようだorz.

Webアドミンはコンテンツのバックアップも取ってないみたいだし，どうすっかなってことで，まずはInternet ArchiveからFirfoxのアドオンのScrapbookでぶっこぬくことを試みた．しかし，これでやったところ，imgタグのsrcやaタグのhrefがInternet Archive用に変更されたままになってしまい，その後の再構成がめんどくさそうだった．

Google先生にお伺いを立ててみると"warrick"というスクリプトが良さそうだったので，これを使ってみる事にした．

手順

Warrick Downloadingからwarrickをダウンロード．普通に展開． tar zxvf warrick-1.8.tar.gz
Perl，SOAP-Lite，XML-Parser，expatあたりが入っていなかったら，yastで追加する．
下記の様なコマンドを発行すれば，スクリプトを実行したディレクトリの下に"www.foo.hoge.jp"ができて，その下に復元される．はじめにサイトの分析が入るからか，保存ディレクトリがしばらく出来ないので，気長に待つと良し． warrick.pl -r -d -nc -o log.txt "http://www.foo.hoge.jp/" 上のコマンドの意味は，「再帰的に，重複を除いて，利用できる全てのリソース(InternetArchive, Yahoo, Google, Bing)から，ログを取りながら再構成する」だったかな．詳細は，Warrick Runningを参照の事．