当前位置: 开发笔记 > 前端 > 正文

json字符串加入转义字符_Excel催化剂Unicode文本及Html转义字符转换

作者：秦乐0_707 | 来源：互联网 | 2023-09-11 17:17

文本文件的批量性操作，Excel催化剂已经有非常多的功能，常听说许多人对Excel催化剂的印象是功能太杂，但试问，不是活在真

文本文件的批量性操作&＃xff0c;Excel催化剂已经有非常多的功能&＃xff0c;常听说许多人对Excel催化剂的印象是功能太杂&＃xff0c;但试问&＃xff0c;不是活在真空世界中做数据分析&＃xff0c;面对一大堆杂乱的数据环境&＃xff0c;没有足够“杂”的功能来应付&＃xff0c;真的可以称得上数据神器么&＃xff1f;
本篇的两个小功能&＃xff0c;处理下一般数据采集获取到的非理想文本数据&＃xff1a;带unicode字符串的文本和带html特殊符号的文本。这些功能也是从实际需求中来。为了让数据处理更加得心应手&＃xff0c;功能仍然不断新增。

网页采集数据常有的不完善

一、html编码问题
这里说的网页采集&＃xff0c;当然可以最原始的从网页上复制粘贴回来的数据&＃xff0c;更自动化的&＃xff0c;就是使用网页采集工具批量性获取到的数据。
网页html文本&＃xff0c;有转义字符如&＃xff1a; <(小于号) 、 (空格)等&＃xff0c;这些因为html上有特定的含义&＃xff0c;需要转义成其他输入字符。
更多的可见下文截图&＃xff1a;
最终我们还原后&＃xff0c;应该得到下面的文本才是想要的。

二、Unicode格式文本
我们采集到的数据中&＃xff0c;可能会是以下展示的样式&＃xff0c;非英文、数字的比如中文&＃xff0c;用了Unicode字符表示(u开头的)。
我们需要这样的格式&＃xff0c;才是人阅读和使用的文本。

解决办法
既然这么大的共性情况&＃xff0c;肯定是将它落实到功能上固化&＃xff0c;有再次出现时可以立马解决&＃xff0c;这就是Excel催化剂越来越“杂”的由来。
处理一个文件&＃xff0c;你说在线转换下就可以&＃xff0c;处理100个、1000个呢&＃xff0c;还会这样去做吗&＃xff1f;在Excel催化剂里&＃xff0c;必然是批量性操作最佳使用场合。

自定义函数处理Excel单元格内容
如果数据已经落到Excel的单元格里&＃xff0c;在做网页采集功能时&＃xff0c;其实已经将此成套的网页采集相关会用到的功能都做成了自定义函数。
如下的将html的转义字符解码
同样地&＃xff0c;Unicode字符串还原为原字符&＃xff0c;也有自定义函数。
除此以外&＃xff0c;还有大量的转换Utf8、从json提取、从xml提取指定元素、Url转码和还原等一大堆自定义函数。
上述自定义函数使用场景&＃xff0c;数据源在Excel单元格或提取结果存储在Excel单元格&＃xff0c;另如果是对整个文件的转换&＃xff0c;就是本篇开发的两个小功能。
使用非常简单&＃xff0c;选择一个或多个待转换的文本文件路径单元格&＃xff0c;当只选择待转换时&＃xff0c;转换后的结果覆盖原文件&＃xff0c;选择两列时&＃xff0c;右侧列为转换结果生成新文本&＃xff0c;建议采用新生成文件方式。
任何覆盖原始文件的操作均有数据风险&＃xff0c;无法恢复数据初始状态&＃xff0c;不是一个好的科学的数据管理方式。

结语
小功能有大智慧&＃xff0c;你能感受到了吗&＃xff1f;盼望Excel催化剂的使用者&＃xff0c;会因为其功能的不断新增而惊喜&＃xff0c;因为又有新的繁琐操作被简单固化了。
看到小小的Excel催化剂包含这么多的功能&＃xff0c;来应对各种数据采集、处理、分析各环节的痛点&＃xff0c;希望催化剂的使用者们&＃xff0c;都有慧眼&＃xff0c;不用再相信培训机构所吹嘘的培训一小时&＃xff0c;从此不加班的收割式的忽悠大法。
应对功能越来越多&＃xff0c;请始终坚守最佳的Excel催化剂使用方法&＃xff1a;搜索&＃43;笔记&＃xff0c;用到时即搜即得&＃xff0c;日常追更下文章。写文章者1小时&＃xff0c;读文章者2分钟即可。

推荐阅读

css
VScode格式化文档换行或不换行的设置方法

本文介绍了在VScode中设置格式化文档换行或不换行的方法，包括使用插件和修改settings.json文件的内容。详细步骤为：找到settings.json文件，将其中的代码替换为指定的代码。 ... [详细]

蜡笔小新 2023-12-14 17:15:38
build
Nginx使用AWStats日志分析的步骤及注意事项

本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息，并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境，并进行DNS解析。 ... [详细]

蜡笔小新 2023-12-14 19:42:01
build
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
json
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
json
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
button
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
css
Hibernate基础映射

在说Hibernate映射前，我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象，以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]

蜡笔小新 2023-12-14 10:57:47
css
SpringBoot集成前端模版（thymeleaf）的配置步骤

本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤，包括在application.properties配置文件中添加thymeleaf的配置信息，引入thymeleaf的jar包，以及创建PageController并添加index方法。 ... [详细]

蜡笔小新 2023-12-14 10:11:46
css
解决Mac上无法使用localhost连接mysql的问题

本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题，并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别，指出了使用socket方式连接导致连接失败的原因。此外，还提供了相关链接供读者深入了解。 ... [详细]

蜡笔小新 2023-12-13 17:48:58
css
如何从列表中删除所有零？

本文介绍了如何使用python从列表中删除所有的零，并将结果以列表形式输出，同时提供了示例格式。 ... [详细]

蜡笔小新 2023-12-13 13:02:00
json
Kotlin中扩展函数的惯用用法及其合理性

本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下，定义扩展函数没有意义，但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法，并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑，并给出了自己的反驳。最后，文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]

蜡笔小新 2023-12-12 19:17:21
html5
前端人员必须知道的三个问题及其发展阶段

本文介绍了前端人员必须知道的三个问题，即前端都做哪些事、前端都需要哪些技术，以及前端的发展阶段。初级阶段包括HTML、CSS、JavaScript和jQuery的基础知识。进阶阶段涵盖了面向对象编程、响应式设计、Ajax、HTML5等新兴技术。高级阶段包括架构基础、模块化开发、预编译和前沿规范等内容。此外，还介绍了一些后端服务，如Node.js。 ... [详细]

蜡笔小新 2023-12-12 12:45:59
html5
iOS超签签名服务器搭建及其优劣势

本文介绍了搭建iOS超签签名服务器的原因和优势，包括不掉签、用户可以直接安装不需要信任、体验好等。同时也提到了超签的劣势，即一个证书只能安装100个，成本较高。文章还详细介绍了超签的实现原理，包括用户请求服务器安装mobileconfig文件、服务器调用苹果接口添加udid等步骤。最后，还提到了生成mobileconfig文件和导出AppleWorldwideDeveloperRelationsCertificationAuthority证书的方法。 ... [详细]

蜡笔小新 2023-12-11 20:23:23
json
SpringMVC接收请求参数的方式总结

本文总结了在SpringMVC开发中处理控制器参数的各种方式，包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver，处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor，以及PathVariableMapMethodArgumentResol等子类。 ... [详细]

蜡笔小新 2023-12-11 19:55:40
json
Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法

本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数，可以设置密码的有效期、最小间隔时间、最小长度，并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]

蜡笔小新 2023-12-14 17:57:01

秦乐0_707

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

json字符串加入转义字符_Excel催化剂Unicode文本及Html转义字符转换

网页采集数据常有的不完善

二、Unicode格式文本我们采集到的数据中&＃xff0c;可能会是以下展示的样式&＃xff0c;非英文、数字的比如中文&＃xff0c;用了Unicode字符表示(u开头的)。我们需要这样的格式&＃xff0c;才是人阅读和使用的文本。

二、Unicode格式文本
我们采集到的数据中&＃xff0c;可能会是以下展示的样式&＃xff0c;非英文、数字的比如中文&＃xff0c;用了Unicode字符表示(u开头的)。
我们需要这样的格式&＃xff0c;才是人阅读和使用的文本。