对utf-8域使用urltools::url_parse

作者：阮琳芷信玲俊岳 | 来源：互联网 | 2022-10-18 12:44

如何解决《对utf-8域使用urltools::url_parse》经验，有好办法吗？

该功能url_parse非常快，并且在大多数情况下都可以正常工作。但是最近，域名可能包含UTF-8字符，例如

url <- "www.cordes-tiefkühlprodukte.de"

现在，如果我url_parse对此URL进行应用，则在域列中会得到一个特殊字符“ ”：

url_parse(url)
  scheme                            domain port path parameter fragment
1    www.cordes-tiefkhlprodukte.de

我的问题是：如何将该条目“修复”为UTF-8？我尝试iconv了stringi软件包中的某些功能，但没有成功。

（我知道httr::parse_url，这不存在此问题。因此一种方法是检测非ascii的url，并url_parse在那些URL 和parse_url少数特殊情况下使用。但是，这导致（有效）检测的问题非ASCII网址。）

编辑：不幸的是，url1 <- URLencode(enc2utf8(url))没有帮助。当我做

robotstxt::paths_allowed(
    url1, 
    domain=urltools::suffix_extract(urltools::domain(url1))
)

我得到一个错误could not resolve host。但是，可以手动插入原始URL和第二级域paths_allowed。

> sessionInfo()

R版本3.6.1（2019-07-05）平台：x86_64-w64-mingw32 / x64（64位）运行于：Windows 10 x64（内部版本17134）

矩阵产品：默认

区域设置：[1] LC_COLLATE = German_Germany.1252 LC_CTYPE = German_Germany.1252
[3] LC_MOnETARY= German_Germany.1252 LC_NUMERIC = C
[5] LC_TIME = German_Germany.1252

附加的基本软件包：[1]统计信息图形grDevices utils数据集方法基础

其他附带的软件包：[1] urltools_1.7.3 fortunes_1.5-4

通过名称空间（未附加）加载：[1] editor_3.6.1 Rcpp_1.0.1 triebeard_0.3.0

windows

推荐阅读

windows
基于layUI的图片上传前预览功能的2种实现方式

本文介绍了基于layUI的图片上传前预览功能的两种实现方式：一种是使用blob+FileReader，另一种是使用layUI自带的参数。通过选择文件后点击文件名，在页面中间弹窗内预览图片。其中，layUI自带的参数实现了图片预览功能。该功能依赖于layUI的上传模块，并使用了blob和FileReader来读取本地文件并获取图像的base64编码。点击文件名时会执行See()函数。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-14 17:06:58
windows
搭建Windows Server 2012 R2 IIS8.5+PHP（FastCGI）+MySQL环境的详细步骤

本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP（FastCGI）+MySQL环境的步骤，包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]

蜡笔小新 2023-12-14 17:03:58
windows
Alink回归预测的不完善问题及期待

本文讨论了Alink回归预测的不完善问题，指出目前主要针对Python做案例，对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法，以及Maven的相关知识。最后，对Alink回归预测的未来发展提出了期待。 ... [详细]

蜡笔小新 2023-12-14 14:25:33
windows
C#生成随机数的三种方法及其问题分析

本文介绍了C#中生成随机数的三种方法，并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法，但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数，进一步突显了这个问题。文章指出，随机数生成在任何编程语言中都是必备的功能，但Random类生成的随机数并不可靠。最后，提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]

蜡笔小新 2023-12-14 14:15:30
windows
Hibernate配置lazy=false时无法加载数据的问题解决方法

本文介绍了在Hibernate配置lazy=false时无法加载数据的问题，通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程，包括运行环境和数据库的配置信息。 ... [详细]

蜡笔小新 2023-12-14 13:59:45
windows
Win10下游戏不能全屏的解决方法及兼容游戏列表

本文介绍了Win10下游戏不能全屏的解决方法，包括修改注册表默认值和查看兼容游戏列表。同时提供了部分已经支持Win10的热门游戏列表，帮助玩家解决游戏不能全屏的问题。 ... [详细]

蜡笔小新 2023-12-14 13:40:42
windows
如何在联想win10专业版中修改账户名称

本文介绍了在联想win10专业版中修改账户名称的方法，包括在计算机管理中找到要修改的账户，通过重命名来修改登录名和属性来修改显示名称。同时指出了windows10家庭版无法使用此方法的限制。 ... [详细]

蜡笔小新 2023-12-14 13:35:37
windows
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
windows
Windows下配置PHP5.6的方法及注意事项

本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项，包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法，如下载缺失的msvcr110.dll文件等。通过本文的指导，读者可以轻松地在Windows系统下配置PHP5.6，并解决一些常见的配置问题。 ... [详细]

蜡笔小新 2023-12-14 12:37:25
windows
电脑公司win7剪切板位置及使用方法

本文介绍了电脑公司win7剪切板的位置和使用方法。剪切板一般位于c:\windows\system32目录，程序名为clipbrd.exe。通过在搜索栏中输入cmd打开命令提示符窗口，并输入clip /？即可调用剪贴板查看器。赶紧来试试看吧！更多精彩文章请关注本站。 ... [详细]

蜡笔小新 2023-12-14 12:25:19
windows
Metasploit攻击渗透实践

本文介绍了Metasploit攻击渗透实践的内容和要求，包括主动攻击、针对浏览器和客户端的攻击，以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码，以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]

蜡笔小新 2023-12-14 12:14:09
windows
C#之数据集：DataSet对象的使用及相关方法详解

本文介绍了C#中数据集DataSet对象的使用及相关方法详解，包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成，以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读，读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]

蜡笔小新 2023-12-14 12:09:13
windows
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
windows
Mac OS 升级到11.2.2 Eclipse打不开了，报错Failed to create the Java Virtual Machine

本文介绍了在Mac OS升级到11.2.2版本后，使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 12:01:13
windows
win10系统搭建Java开发环境的操作方法

本文介绍了win10系统搭建Java开发环境的详细操作方法，包括下载Windows10系统和Java SE，安装Java开发环境，设置变量等步骤。操作简单，只需按照指导进行即可。 ... [详细]

蜡笔小新 2023-12-14 11:46:43

阮琳芷信玲俊岳

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章