cURL正在从Pirate Bay检索编码的HTML

 blankworld 发布于 2023-01-16 12:28

我正在创建一个正在抓取网站www.piratebay.se的脚本.两三天前脚本工作正常,但现在我遇到了问题.

这是我的代码:

$URL = 'http://thepiratebay.se';
$ch = curl_init();

curl_setopt($ch, CURLOPT_URL, $URL);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, TRUE); 
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.1) Gecko/20061204 Firefox/2.0.0.1");
curl_setopt($ch, CURLOPT_COOKIE, "language=pt_BR; c[thepiratebay.se][/][language]=pt_BR");

$fonte = curl_exec ($ch);

curl_close ($ch);
echo $fonte;

这段代码的响应不是干净的HTML,而是看起来像这样:

[ s8N> k9-ىMI7 $8.v͕$ hyGSg:ӷ> 5???aor&. v) )d w 8w l c u""1 F*G 2$ 6 C } z(bw 4Ƒz6 S t4 K x 6u ~ T ACJb T^3 USPI:Mf n ' 4 XE QQ& c5 `'β TY]D Q nBfS }a % R) Zn ̙ ̙8IB a L

我已经尝试在.htaccess,PHP和cURL上使用用户代理,但没有成功.

撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有