[字符编码]NumericCharacterReference和HTMLEntities（一）

作者：eric_sun2012 | 来源：互联网 | 2024-09-28 15:31

你是否在dreamweaver里编辑网页的时候看到Σ这样的东西，你曾使用过 这样的玩意吧，或者你在调试webservice的时候看到返回xml字符串中现

你是否在dreamweaver里编辑网页的时候看到&＃x3A3;这样的东西，你曾使用过这样的玩意吧，或者你在调试webservice的时候看到返回xml字符串中现&＃x3B3;这样的怪物呢？你看不懂他们可能用浏览器或者DW预览一下都是可以看到庐山真面目的，它是谁？

&＃x3A3;这个是 Numeric Character Reference

这个是Character entities references

从字面上观察，一个是用&＃x+16进制+; 表达信息，一个是用&+字符串+; 突然让我想起了汇编语言里头的助记符跟实际二进制指令代码，带着这个猜测往下看吧！

Character entities references

HTML 中规定了 Character entity references，也就是通常我们说得 html实体字符，一些字符在 HTML 中拥有特殊的含义，比如小于号 (<) 用于定义 HTML 标签的开始。如果我们希望浏览器正确地显示这些字符，我们必须在 HTML 源码中插入字符实体。

字符实体有三部分：一个和号 (&)，一个实体名称，或者 # 和一个实体编号，以及一个分号 (;)。要在 HTML 文档中显示小于号，我们需要这样写：< 或者 <

并不是所有的浏览器都支持最新的实体名称，不同的浏览器中需要去验证哪些可以被识别哪些不能被识别，下图中的“撇号”在IE下就不能支持，对于不支持的实体名称可以用另外的方式解决，继续阅读下一段吧。

注意：实体对大小写敏感。

比较全面的列表请参看：这里

参考:http://www.w3school.com.cn/html/html_entities.asp

Numeric Character Reference

看看维基百科的解释：

A numeric character reference (NCR) is a common markup construct used in SGML and other SGML-related markup languages such as HTML and XML. It consists of a short sequence of characters that, in turn, represent a single character from the Universal Charact

NCR是一种常见的标记结构，用于SGML和其他SGML相似的标记语言，如HTML和XML。它由一个短的字符序列组成,代表一个字符（全球的文字字符）。

NCR编码是由一个与号(&)跟着一个井号(#), 然后跟着这个字符的Unicode编码值, 最后跟着一个分号组成的, 如:

    &＃nnnn;
    或者
    &＃xhhhh

其中, nnnn是字符编码的十进制表示, 而hhhh是字符的16进制表示.

另外要注意的是x在xml中必须是小写的.而hhhh可以大小写混用, 另外nnnn和hhhh也可以有前导零.

HTML Entites与NCR不同, HTML字符实体的名字必须是在HTML中已经定义的才能被使用,比如:

    & //&
      //空格

如果是XML的话，必须在DTD中定义过, 类似:

1     ENTITY nbsp CDATA "&＃160;" -- no-break space = non-breaking space,
2                                       U+00A0 ISOnum -->
3     ENTITY iexcl CDATA "&＃161;" -- inverted exclamation mark, U+00A1 ISOnum -->
4     ENTITY cent CDATA "&＃162;" -- cent sign, U+00A2 ISOnum -->
5     ENTITY pound CDATA "&＃163;" -- pound sign, U+00A3 ISOnum -->
6     ENTITY curren CDATA "&＃164;" -- currency sign, U+00A4 ISOnum -->
7     ENTITY yen CDATA "&＃165;" -- yen sign = yuan sign, U+00A5 ISOnum -->
8     ENTITY brvbar CDATA "&＃166;" -- broken bar = broken vertical bar,
9                                       U+00A6 ISOnum -->

其中, 名字是大小写敏感的. 比如:

    Å // Å
    而:
    å //

到此，我们来回答一下上面提出的问题，在html中没有规定的字符实体名称或不被浏览器支持的一些实体，怎么办呢？

答：可以使用NCR的方式，先找到字符对应的UNICODE编码，以小于号为例，unicode编码16进制为3C（10进制为60），在html则可以使用&＃x3C或&＃60，跟上面的表格对照看是否相同，由此我们也可以知道，如果我们的html所采用的编码不支持一些字符（比如其他国家的字符），则可以通过NCR来引入我们的页面就不会乱码了。

有一天，我的一个好朋友在调试webservice时发现对方的接口返回类似&＃xhhhh这样的东西，一时不知道如何处理，如何转换为我们想要的编码呢？下一篇文章将提供通用的转换程序，敬请期待！

最后感谢网络上无名的作者，是你们的博文让我学得更多，谢谢！如不小心引入您的博文内容而未带上出处，请告知我一声。

推荐阅读

io
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
io
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
io
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
io
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
io
将Web服务部署到Tomcat

本文介绍了如何在JDeveloper 12c中创建一个Java项目，并将其打包为Web服务，然后部署到Tomcat服务器。内容涵盖从项目创建、编写Web服务代码、配置相关XML文件到最终的本地部署和验证。 ... [详细]

蜡笔小新 2024-12-27 11:48:15
io
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
io
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
io
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
io
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
io
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
io
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
jsp
Linux 自动化安装脚本详解

本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建，还处理了系统服务的配置和启动，确保在多种 Linux 发行版上都能顺利运行。 ... [详细]

蜡笔小新 2024-12-27 16:33:32
io
解决PHP与MySQL连接时出现500错误的方法

本文详细探讨了当使用PHP连接MySQL数据库时遇到500内部服务器错误的多种解决方案，提供了详尽的操作步骤和专业建议。无论是初学者还是有经验的开发者，都能从中受益。 ... [详细]

蜡笔小新 2024-12-27 15:48:52
io
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
io
2023年全球运营商网络设备市场预计突破202亿美元

尽管某些细分市场如WAN优化表现不佳，但全球运营商路由器和交换机市场持续增长。根据最新研究，该市场预计在2023年达到202亿美元的规模。 ... [详细]

蜡笔小新 2024-12-27 12:44:44

eric_sun2012

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章