HttpClient返回403forbiddenn问题

作者：开在覀黎明前的小茉莉 | 来源：互联网 | 2023-05-19 00:09

想要做一个群博（本身是有的，由于CSDN的rss订阅不符合规范没法进行抓取，自己打算手动实现抓取操作）,但是通过HttpClient进行网页源码获取的时候竟然发现返回的是403forbidde

想要做一个群博（本身是有的，由于CSDN的rss订阅不符合规范没法进行抓取，自己打算手动实现抓取操作）,但是通过HttpClient进行网页源码获取的时候竟然发现返回的是403 forbidden，有点尴尬了。然后网上查找资料之后发现说是要设置请求参数，然后想着是不是HttpClient是不是有什么setParameter方法，找了一下果然有，然后向下面这样设置了参数：

    HttpClient httpclient = new DefaultHttpClient();
     httpclient.getParams().setParameter("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11");

然而无济于事，既然作为一个请求有请求参数，那么是不是应该也有请求头部呢，没错，终于找到解决403 forbidden的办法了，通常情况下，通过浏览器去请求一个网页时，浏览器会将User-Agent包含在请求头部当中，如果直接通过HttpClient去访问一个网页而不设置请求头部，就有可能被服务器拒绝响应，因此只要像下面这样设置了请求头部就可正常访问了：

    HttpGet httpgets = new HttpGet(url);
    httpgets.setHeader("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.0.3) Gecko/2008092417 Firefox/3.0.3");

这样就可以模拟浏览器去请求一个网页了！

+++++++++++++++++++++++++++++++++++++
题外话
希望通过博客帮助自己去记录一些东西，记录一些问题，或许问题很小，但是需要的时候看看总会有很大的帮助的！

推荐阅读

java
Android HttpClient及连接管理器

超文本传输协议HTTP也许是当今互联网上使用的最重要的协议了。尽管java.net包提供了基本通过HTTP访问资源的功能，但它没有提供全面的灵活性和其它很多应用程序需要的功能。HttpClient就 ... [详细]

蜡笔小新 2023-09-15 15:45:48
java
提升接口测试效率的关键：用例与工具的综合应用

本文将探讨如何通过有效的接口测试用例设计和工具选择，显著提高接口测试的效率和质量。 ... [详细]

蜡笔小新 2024-11-28 16:45:22
text
C#爬虫Fiddler插件开发自动生成代码

哈喽^_^一般我们在编写网页爬虫的时候经常会使用到Fiddler这个工具来分析http包,而且通常并不是分析一个包就够了的,所以为了把更多的时间放在分析http包上,自动化生成 ... [详细]

蜡笔小新 2024-11-28 13:39:49
java
Android Jsoup与HttpClient网络爬虫解析

一、Jsoup介绍Jsoup是一款Java的HTML解析器，可直接解析某个URL、HTML文本内容。他提供了一套非常具有效率的API，可通过DOM，CSS以及类似于Jquer ... [详细]

蜡笔小新 2023-09-25 15:40:34
java
如何正确的使用HttpClient方法

本篇文章给大家分享的是有关如何正确的使用HttpClient方法，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不 ... [详细]

蜡笔小新 2023-09-08 04:27:55
install
hibernate报错

这个报错出现在userDao里面，sessionfactory没有注入。解决办法：spring整合Hibernate使用test测试时要把spring.xml和spring-hib ... [详细]

蜡笔小新 2024-11-28 16:52:44
go
代码优化：避免重复和提高可读性

本文讨论了在处理分页数据时常见的低级错误，并提供了优化后的代码示例，以减少重复代码并提高可读性和维护性。 ... [详细]

蜡笔小新 2024-11-28 15:27:32
go
深入理解Python的multiprocessing模块

本文详细介绍了Python的multiprocessing模块，该模块不仅支持本地并发操作，还支持远程操作。通过使用multiprocessing模块，开发者可以利用多核处理器的优势，提高程序的执行效率。 ... [详细]

蜡笔小新 2024-11-28 15:03:25
substring
搜索引擎架构设计

本文详细介绍了搜索引擎的主要组成部分，包括爬虫模块、索引模块和搜索模块。其中，索引模块采用了高效的二元分词技术进行数据存储，而搜索模块则基于ASP.NET框架实现了一个用户友好的界面和高效的搜索算法。 ... [详细]

蜡笔小新 2024-11-28 13:45:27
install
PHP 5.4.8 编译安装指南

本文详细介绍了如何在Linux环境下编译安装PHP 5.4.8，并配置为FastCGI模式运行。包括所需依赖包的安装、源代码下载、编译配置及启动服务等步骤。 ... [详细]

蜡笔小新 2024-11-28 10:19:51
install
Python中调用Java代码的方法与实践

本文探讨了如何在Python环境中集成并调用Java代码，通过具体的步骤和示例展示了这一过程的技术细节。适合对跨语言编程感兴趣的开发者阅读。 ... [详细]

蜡笔小新 2024-11-27 17:54:57
const
Spring Boot集成与使用JPA详解

本文详细介绍如何在Spring Boot项目中集成和使用JPA，涵盖JPA的基本概念、Spring Data JPA的功能以及具体的操作步骤，帮助开发者快速掌握这一强大的持久化技术。 ... [详细]

蜡笔小新 2024-11-27 17:44:54
java
MVC框架下使用DataGrid实现时间筛选与枚举填充

本文介绍如何在ASP.NET MVC项目中利用DataGrid组件增强搜索功能，具体包括使用jQuery UI的DatePicker插件添加时间筛选条件，并通过枚举数据填充下拉列表。 ... [详细]

蜡笔小新 2024-11-27 11:02:33
const
深入理解Web API中的特性路由

本文探讨了Web API 2中特性的路由机制，特别是如何利用它来构建RESTful风格的URI。文章不仅介绍了基本的特性路由使用方法，还详细说明了如何通过特性路由进行API版本控制、HTTP方法的指定、路由前缀的应用以及路由约束的设置。 ... [详细]

蜡笔小新 2024-11-26 20:52:15
java
[置顶] 性能测试java协议使用httpclient方法引发的思考

最近手上在进行一个性能测试项目，脚本是java语言使用httpClient实现http请求。并发用户数线程只有40个，但是服务器端启动的线程出现了400多个，是哪里平白无故出现这么多线程呢？肯定是有问 ... [详细]

蜡笔小新 2023-09-08 01:33:04

开在覀黎明前的小茉莉

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章