BLOG
PHP Simple HTML DOM Parser
2015/2/8
PHPでWebスクレイピング用ライブラリがしたいと思い、
Goutteを試そうとしましたがエラーが。。
Goutteの最新バージョン(2.*)はPHP5.4以上に対応とのことでした。
私の環境では対応していなかったので取りあえず諦めて、
PHP Simple HTML DOM Parserを試してみました。
導入方法はまずはライブラリをここから(http://sourceforge.net/projects/simplehtmldom/files/)ダウンロードして、そしてそれを読み込みWebスクレイピングします。
例は下記のような感じです。
1 2 3 4 |
require_once 'simple_html_dom.php'; $s_uri = "http://www.takurokamiyoshi.net/blog/"; $html = file_get_html($s_uri); echo $html->find("#sidenavi ul",1); |
かなり簡単にWebスクレイピングができました。手軽につかえるライブラリなので、サイト巡回が楽になりそうです。