java - 如何解决利用Jsoup解析网页偶然出现问号乱码的问题?

 手机用户2502863643 发布于 2022-11-03 16:41

利用Jsoup解析网页文章,有时获取结果中部分文章的标题会出现问号乱码(???)的问题,试过指定编码解析,还是不能解决?

另外还有一个奇怪的地方,将含有乱码的字符串在android上的控件setText(),乱码会自动消失,恢复正常,谁有遇到过这种问题不?

1 个回答
  • 采取Document document = Jsoup.parse(new URL(url).openStream(), "UTF-8", url);的方式获取,不要先获取网页html的文本,采用Jsoup.parse(html)的方式(即使在读html时设置了UTF-8,sb.append(new String(buf, 0, len, "UTF-8")); 这样也无效的)

    Jsoup 采集回来的信息出现乱码
    注:设置为UTF-8不是GBK

    2022-11-06 03:15 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有