作者:胃热额外_522 | 来源:互联网 | 2023-09-23 10:52
这几天研究了一下php中的curl类库,做了一个简单的百度搜索,先上代码
来源gaodaimacom搞#代%码网])?$_GET[&#039;key&#039;]:&#039;&#039;;session_start();$_SESSION[&#039;key&#039;] = $k;$curl = curl_init(); // 设置你需要抓取的URL for($i = 0;$i<2;$i++){curl_setopt($curl, CURLOPT_URL, "http://www.baidu.com/s?wd={$_SESSION[&#039;key&#039;]}&pn={$i}"); // 设置header curl_setopt($curl, CURLOPT_HEADER, 1); // 设置cURL 参数,要求结果保存到字符串中还是输出到屏幕上。 curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); // 运行cURL,请求网页 $data = curl_exec($curl); $pre = &#039;/(.*?)<\/a><\/h3>/s&#039;;preg_match_all($pre,$data,$match);foreach ($match[1] as $k => $v) {?>
" target="_blank" rel="nofollow">
经过分析百度的搜索时的url发现有一个规律
https://www.baidu.com/s?wd=搜索的关键字
但是我发现使用https协议后不能够获得百度上的数据于是改为http://www.baidu.com?wd=搜索的关键字就可以啦!!