作者:zhangwenkaii_555 | 来源:互联网 | 2023-09-18 17:38
我一本正经地胡说一下吧如何获取网页数据。
var data = new System如何获取网页数据。Net。WebClient { }。DownloadData(this。textBox1。Text); //根据textBox1的网址下载html
var r_utf8 = new System如何获取网页数据。
IO如何获取网页数据。StreamReader(new System。IO。MemoryStream(data),Encoding。UTF8); //将html放到utf8编码的StreamReader内
var r_gbk = new System如何获取网页数据。
IO如何获取网页数据。StreamReader(new System。IO。MemoryStream(data), Encoding。Default); //将html放到gbk编码的StreamReader内
var t_utf8 = r_utf8如何获取网页数据。
ReadToEnd(); //读出html内容
var t_gbk = r_gbk如何获取网页数据。ReadToEnd(); //读出html内容
if (!isLuan(t_utf8)) //判断utf8是否有乱码
htm = t_utf8;
this如何获取网页数据。
Text = "utf8";
else
htm = t_gbk;
this如何获取网页数据。
Text = "gbk";
}如何获取网页数据。
原因就是解析时使用的字符编码与网页的字符编码不同如何获取网页数据。
可通过IE先查看在什么编码下网页可正常显示如何获取网页数据,如果为简体中文(GBK2312),在解析返回的网页源代码时,就要使用System.Text.Encoding.GetEncoding("gbk2312");或
System.Text.Encoding.GetEncoding(936);进行解码如何获取网页数据。 祝你好运一生一世!点击好评,谢谢你!