PHPの
Googleから返されたページのHTML構造を調べ、それに応じて特定のタグを解析するためにDOMライブラリを使用するという考え方です。私が見るところ、画像は<ul>
として整理されています および<li>
次のようなタグ:
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
各<li>
内 タグ追加のタグがあり、そのうちの1つは<a>
。このタグには、「imgrefurl」と「imgurl」の2つの属性があり、必要な画像が得られる可能性があります。これらの2つの属性のうち、探索するのに必要なものはどれですか。
または、<img>
があります <li>
内のタグ 実際の画像バイナリを含む「src」属性があります。したがって、それを解析することもできます。バイナリは検索ページに表示される画像用であり、実際の画像用ではないことに注意してください。
DOMへのいくつかのポインタについては、このメソッドが役立つ場合があります- http:// www .php.net / manual / en / domelement.getelementsbytagname.php
および<li>
を読み取る タグを付けてから、クラス「rg_li」を使用してタグを解析します。
上記が理にかなっていることを願っています