【環境】
PHP: 5.4.45
PHP: 5.4.45
出来るかぎりコピーアンドペーストで簡単に利用できるコードを不定期に紹介していきたいなと考えています。
シンプルなコードなので、これらのコードをベースに拡張して利用して頂けると思います。
今回はPHPから直接webサイト(ホームページ)のHTMLソースを取得するコードを紹介します。
簡単なHTML解析程度ならこのコードで取得したHTMLソースで実施できるかと思います。
このソースでは取得したHTMLソースをそのまま表示している為、本来アクセスした場合よりも不完全な状態でページが表示されます。
1 2 3 4 5 |
<?PHP $url = "http://yahoo.co.jp/"; //取得したいサイトのURL $reshtml = file_get_contents($url); print ($reshtml); ?> |
コード上のツールバーの をクリックするとコピーが簡単にできます。
利用している主な関数等
※PHPマニュアルより
file_get_contentsを利用すれば今回のような単純にURLを指定してHTMLソースを取得するだけでなく、 GETやPOSTでパラメータを渡すことや、HTTPS(セキュア)アクセスも可能です。
うまく利用すればwebスクレイピングのようなwebページの解析も可能になります。
今後機会があれば紹介していきたいと思います。