如何更改列名称以符合mlr3的命名约定

作者：风之淡然1_925 | 来源：互联网 | 2024-10-10 12:04

我想使用许多（>50K）标记作为特征名称来执行文本分类。但是，中的Task()函数mlr3不允许在列名中包含很多字符，这些字符是

我想使用许多（> 50K）标记作为特征名称来执行文本分类。但是，中的Task()函数mlr3不允许在列名中包含很多字符，这些字符是通过的make.names，否则就可以了。以下是我目前找到的清单：

mutate(token=str_replace(token, "à", "a")) %>% mutate(token=str_replace(token, "ã", "a")) %>% mutate(token=str_replace(token, "á", "a")) %>% mutate(token=str_replace(token, "ø", "o")) %>% mutate(token=str_replace(token, "ç", "c")) %>% mutate(token=str_replace(token, "ô", "o")) %>% mutate(token=str_replace(token, "é", "e")) %>% mutate(token=str_replace(token, "é", "e")) %>% mutate(token=str_replace(token, "í", "i")) %>% mutate(token=str_replace(token, "î", "i")) %>% mutate(token=str_replace(token, "è", "e")) %>% mutate(token=str_replace(token, "ë", "e")) %>% mutate(token=str_replace(token, "å", "a")) %>% mutate(token=str_replace(token, "â", "a")) %>% mutate(token=str_replace(token, "æ", "a")) %>% mutate(token=str_replace(token, "ñ", "n")) %>%

如何使我的 data.frame 与兼容mlr3，而无需以这种方式手动替换所有特殊字符（反复试验）？make.names()显然不起作用！

我非常感谢一些帮助:) 谢谢！

回答

一种方法是使用 janitor::clean_names()

d <- data.frame(`süßigkeit` = 1:3, `straße` = 1:3, `Hellö` = 1:3, `séé` = 1:3) janitor::clean_names(d) #> sussigkeit strasse hello see #> 1 1 1 1 1 #> 2 2 2 2 2 #> 3 3 3 3 3

^{由reprex 包(v0.3.0)于 2021 年 1 月 11 日创建}

如果您正在处理向量，而不是 data.frame 的名称，则可以使用底层函数janitor::make_clean_names()：

make_clean_names("süßigkeit") [1] "sussigkeit"

推荐阅读

text
如何在 Angular 6 HttpClient 中获取响应头

本文介绍如何使用 Angular 6 的 HttpClient 模块来获取 HTTP 响应头，包括代码示例和常见问题的解决方案。 ... [详细]

蜡笔小新 2024-12-22 15:33:55
foreach
实用正则表达式有哪些

小编给大家分享一下实用正则表达式有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下 ... [详细]

蜡笔小新 2024-12-22 13:59:04
text
字符串中特定字符的移除方法

本文介绍如何从字符串中移除大写、小写、特殊、数字和非数字字符，并提供了多种编程语言的实现示例。 ... [详细]

蜡笔小新 2024-12-22 00:08:06
sum
Day4 作业

#print(34or4 ... [详细]

蜡笔小新 2024-12-21 20:41:21
replace
Hive中日期与字符串互转的常用函数详解

本文详细介绍了Hive中用于日期和字符串相互转换的多种函数，包括从时间戳到日期格式的转换、日期到时间戳的转换，以及如何处理不同格式的日期字符串。通过这些函数，用户可以轻松实现日期和字符串之间的灵活转换，满足数据处理中的各种需求。 ... [详细]

蜡笔小新 2024-12-21 20:34:59
replace
前端开发：使用JavaScript获取最近7天、半年和一年的日期格式化方法

本文介绍了如何在React和React Native项目中使用JavaScript进行日期格式化，提供了获取近7天、近半年及近一年日期的具体实现方法。 ... [详细]

蜡笔小新 2024-12-21 12:00:48
chat
ChatGPT：内容创造者还是非法搬运工？

探讨ChatGPT在法律和版权方面的潜在风险及影响，分析其作为内容创造工具的合法性和合规性。 ... [详细]

蜡笔小新 2024-12-21 10:13:36
replace
优化SQL Server批量数据插入存储过程的实现

本文介绍了一种改进的SQL Server存储过程，用于生成批量插入语句。该方法不仅提高了性能，还支持单行和多行模式，适用于SQL Server 2005及以上版本。 ... [详细]

蜡笔小新 2024-12-21 06:43:52
replace
使用正则表达式去除字符串中单词间的空格

本文探讨了如何在Hive（基于Hadoop）环境中编写类似SQL的语句，以去除字段中的空格。特别是在处理邮政编码等数据时，去除特定位置的空格是常见的需求。 ... [详细]

蜡笔小新 2024-12-20 19:08:43
instance
HTML5与JavaScript实现本地文件读取、写入及路径获取

本文探讨了如何利用HTML5和JavaScript在浏览器中进行本地文件的读取和写入操作，并介绍了获取本地文件路径的方法。HTML5提供了一系列API，使得这些操作变得更加简便和安全。 ... [详细]

蜡笔小新 2024-12-20 18:36:06
instance
Java 中的不可变集合与同步集合详解

本文将详细探讨 Java 中提供的不可变集合（如 `Collections.unmodifiableXXX`）和同步集合（如 `Collections.synchronizedXXX`）的实现原理及使用方法，帮助开发者更好地理解和应用这些工具。 ... [详细]

蜡笔小新 2024-12-20 15:34:31
buffer
深入理解Java类加载机制与自定义类加载器

本文详细探讨了Java中的ClassLoader类加载器的工作原理，包括其如何将class文件加载至JVM中，以及JVM启动时的动态加载策略。文章还介绍了JVM内置的三种类加载器及其工作方式，并解释了类加载器的继承关系和双亲委托机制。 ... [详细]

蜡笔小新 2024-12-20 12:58:21
replace
iOS BLE应用后台持续扫描与连接问题分析

本文探讨了在iOS平台上开发BLE（蓝牙低功耗）应用程序时遇到的挑战，特别是如何实现应用在后台模式下仍能持续扫描并连接蓝牙设备。文章提供了具体的配置方法和常见的问题解决方案。 ... [详细]

蜡笔小新 2024-12-20 03:50:11
buffer
java文本编辑器,java文本编辑器设计思路

java文本编辑器,java文本编辑器设计思路 ... [详细]

蜡笔小新 2024-12-19 21:02:48
instance
[Vue.js 3.0] Guide – Scaling Up – State Management

[Vue.js 3.0] Guide – Scaling Up – State Management ... [详细]

蜡笔小新 2024-12-19 17:37:14

风之淡然1_925

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章