当前位置: 开发笔记 > 数据库 > 正文

Oracle字符集问题总结-mysql教程

作者：weneay | 来源：互联网 | 2017-05-12 15:07

经常有同事咨询oracle数据库字符集相关的问题，如在不同数据库做数据迁移、同其它系统交换数据等，常常因为字符集不同而导致迁移

经常有同事咨询Oracle数据库字符集相关的问题，如在不同数据库做数据迁移、同其它系统交换数据等，常常因为字符集不同而导致迁移失败或数据库内数据变成乱码。现在我将oracle字符集相关的一些知识做个简单总结，希望对大家今后的工作有所帮助。

　　一、什么是oracle字符集

　　Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货币，数字，和日历自动适应本地化语言和平台。

　　影响oracle数据库字符集最重要的参数是NLS_LANG参数。它的格式如下:
　　NLS_LANG = language_territory.charset
　　它有三个组成部分(语言、地域和字符集)，每个成分控制了NLS子集的特性。其中:
　　Language 指定服务器消息的语言，territory 指定服务器的日期和数字格式，charset 指定字符集。如:AMERICAN _ AMERICA. ZHS16GBK
　　从NLS_LANG的组成我们可以看出，真正影响数据库字符集的其实是第三部分。所以两个数据库之间的字符集只要第三部分一样就可以相互导入导出数据，，前面影响的只是提示信息是中文还是英文。

　　二、如何查询Oracle的字符集
　　很多人都碰到过因为字符集不同而使数据导入失败的情况。这涉及三方面的字符集，一是oracel server端的字符集，二是oracle client端的字符集;三是dmp文件的字符集。在做数据导入的时候，需要这三个字符集都一致才能正确导入。
　　1、查询oracle server端的字符集

　　有很多种方法可以查出oracle server端的字符集，比较直观的查询方法是以下这种:

SQL>select userenv(‘language’) from dual;

　　具体的修改方法比较多，最简单的就是直接用UltraEdit修改dmp文件的第2和第3个字节。比如想将dmp文件的字符集改为ZHS16GBK，可以用以下SQL查出该种字符集对应的16进制代码:
　　SQL> select to_char(nls_charset_id('ZHS16GBK'), 'xxxx') from dual;
　　0354

　　然后将dmp文件的2、3字节修改为0354即可。

　　如果dmp文件很大，用ue无法打开，就需要用程序的方法了。网上有人用java存储过程写了转换的程序(用java存储过程的好处是通用性教好，缺点是比较麻烦)。我在 windows下测试通过。但要求oracle数据库一定要安装JVM选项。有兴趣的朋友可以研究一下程序代码

第一次迭代：掌握字符集方面的基本概念。
有些朋友可能会认为这是多此一举，但实际上正是由于对相关基本概念把握不清，才导致了诸多问题和疑问。
首先是字符集的概念。
我们知道，电子计算机最初是用来进行科学计算的（所以叫做“计算机”），但随着技术的发展，还需要计算机进行其它方面的应用处理。这就要求计算机不仅能处理数值，还能处理诸如文字、特殊符号等其它信息，而计算机本身能直接处理的只有数值信息，所以就要求对这些文字、符号信息进行数值编码，最初的字符集是我们都非常熟悉的ASCII，它是用7个二进制位来表示128个字符，而后来随着不同国家、组织的需要，出现了许许多多的字符集，如表示西欧字符的ISO8859系列的字符集，表示汉字的GB2312-80、GBK等字符集。

我们在创建数据库时，需要考虑的一个问题就是选择什么字符集与国家字符集（通过create database中的CHARACTER SET与NATIONAL CHARACTER SET子句指定）。考虑这个问题，我们必须要清楚数据库中都需要存储什么数据，如果只需要存储英文信息，那么选择US7ASCII作为字符集就可以；但是如果要存储中文，那么我们就需要选择能够支持中文的字符集（如ZHS16GBK）；如果需要存储多国语言文字，那就要选择UTF8了。

实验结果分析三
quote:
--------------------------------------------------------------------------------
最初由 tellin 发布
用ZHS16GBK插入数据
SQL> INSERT INTO TEST VALUES('东北');
1 row created.
SQL> SELECT * FROM TEST;
R1
--------------------
6+11
??
SQL> EXIT
--------------------------------------------------------------------------------
当客户端字符集设置为ZHS16GBK后向数据库插入“东北”，Oracle检查发现数据库设置的字符集为US7ASCII与客户端不一致，需要进行转换，但字符集ZHS16GBK中的“东北”两字在US7ASCII中没有对应的字符，所以Oracle用统一的“替换字符”插入数据库，在这里为“？”，编码为63（00111111），这时，输入的信息实际上已经丢失，不管字符集设置如何改变（如下面引用的实验结果），第二行SELECT出来的结果也都是两个“？”号（注意是2个，而不是4个）。
quote:
--------------------------------------------------------------------------------
更改客户端字符集为US7ASCII
D:\>SET NLS_LANG=AMERICAN_AMERICA.US7ASCII
D:\>SQLPLUS "/ AS SYSDBA"
无法显示用ZHS16GBK插入的字符集，但可以显示用US7ASCII插入的字符集
SQL> SELECT * FROM TEST;
R1
----------
东北
??

更改服务器字符集为ZHS16GBK
SQL> update props$ set value$='ZHS16GBK' WHERE;
1 row updated.
SQL> COMMIT;
更改客户端字符集为ZHS16GBK
D:\>SET NLS_LANG=AMERICAN_AMERICA.ZHS16GBK
D:\>SQLPLUS "/ AS SYSDBA"
可以显示以前US7ASCII的字符集，但无法显示用ZHS16GBK插入的数据，说明用ZHS16GBK插入的数据为乱码。
SQL> SELECT * FROM TEST;
R1
--------------------
东北
??
--------------------------------------------------------------------------------
需要指出的是，通过“update props$ set value$='ZHS16GBK' WHERE;”来修改数据库字符集是非常规作法，很可能引起问题，在这里只是原文引用网友的实验结果。

实验结果分析四
quote:
--------------------------------------------------------------------------------
SQL> INSERT INTO TEST VALUES('东北');
1 row created.

分析了这么多的内容，但实际上总结起来也很简单，要想在字符集方面少些错误与麻烦，需要坚持两条基本原则：
在数据库端：选择需要的字符集（通过create database中的CHARACTER SET与NATIONAL CHARACTER SET子句指定）；
在客户端：设置操作系统实际使用的字符集（通过环境变量NLS_LANG设置）。

推荐阅读

sql
使用AJAX动态加载列表数据并展示

AJAX技术允许网页在不重新加载整个页面的情况下进行异步更新，通过向服务器发送请求并接收JSON格式的数据，实现局部内容的动态刷新。 ... [详细]

蜡笔小新 2024-12-14 17:11:55
sql
Spring 3 MVC 配置 MySQL 数据库连接

本文探讨了如何在 Spring 3 MVC 应用程序中配置 MySQL 数据库连接，通过 XML 配置实现 JDBC 直接操作数据库，而不使用 Hibernate 等额外框架。 ... [详细]

蜡笔小新 2024-12-14 16:42:35
mysql
2023年最新指南：如何在手机上访问PHP网页

本文提供了2023年最新的解决方案，帮助用户了解如何在移动设备上顺利访问和浏览PHP网页，涵盖从基础设置到高级技巧的全方位指导。 ... [详细]

蜡笔小新 2024-12-14 14:07:43
odbc
探讨MySQL使用中的常见问题与解决方案

本文探讨了在使用MySQL数据库时遇到的一些基本问题，如连接失败和语句执行错误，并提供了多个有效的解决方案。 ... [详细]

蜡笔小新 2024-12-14 11:33:08
sql
微服务架构中的API网关

API网关作为微服务架构中的关键组件，扮演着系统与外部世界交互的唯一接口角色。它不仅封装了系统的内部复杂性，还为不同客户端提供了个性化的API接口。本文将探讨API网关的重要性及其核心功能。 ... [详细]

蜡笔小新 2024-12-14 10:45:54
sql
Kettle资源库管理及运行方式详解

本文介绍了Kettle资源库的基本概念、类型及其管理方法，同时探讨了Kettle的不同运行方式，包括图形界面、命令行以及API调用，并详细说明了日志记录的相关配置。 ... [详细]

蜡笔小新 2024-12-14 08:43:37
sql
Windows环境下部署Kubernetes Dashboard指南

本指南详细介绍了如何在Windows系统中部署Kubernetes Dashboard，包括下载最新配置文件、修改服务类型以支持NodePort访问、下载所需镜像并启动Dashboard服务等步骤。 ... [详细]

蜡笔小新 2024-12-13 18:18:00
sql
如何解决PHP中时间获取不准确的问题

本文探讨了在PHP开发过程中遇到的时间获取错误问题，并提供了详细的解决方案，包括通过修改配置文件和编程方法来调整时区设置。 ... [详细]

蜡笔小新 2024-12-13 15:33:22
数据库
Twisted网络编程必备（1）注：测试版本Twisted10.1.0.winxp32py2.6，对于原代码略有修改

转自：http:www.yybug.comread-htm-tid-15324.html为什么使用Twisted? 如果你并不准备使用Twisted，你可能有很多异议。为什么使用T ... [详细]

蜡笔小新 2024-12-13 14:57:51
oracle
JSP服务器概述及搭建指南

本文详细介绍了JSP服务器的概念、主流服务器软件及其搭建步骤，旨在帮助开发者更好地理解和使用JSP技术。 ... [详细]

蜡笔小新 2024-12-13 14:42:46
mysql
基于Spring Boot的家政服务平台毕业设计项目（含源代码）

本文档介绍了如何搭建和运行一个基于Spring Boot的家政服务平台，旨在为计算机专业学生提供毕业设计参考。项目涵盖了从环境配置到核心功能实现的全过程。 ... [详细]

蜡笔小新 2024-12-14 14:21:47
mysql
Windows中实现清洁启动的步骤与技巧

清洁启动是一种技术手段，旨在通过最小化启动项和驱动程序的数量来启动Windows系统，以此帮助用户识别并解决由软件冲突引起的系统问题。本文将详细介绍如何在Windows操作系统中执行清洁启动。 ... [详细]

蜡笔小新 2024-12-14 13:58:57
mysql
解决Windows Docker运行时未添加-d参数导致的交互模式退出问题

当在Windows环境下使用Docker运行容器时，如果忘记了添加-d参数，容器将以交互模式启动。本文将指导您如何安全地退出这种模式而不终止Docker容器。 ... [详细]

蜡笔小新 2024-12-14 12:58:17
redis
如何有效解决concrt140.dll文件丢失问题？

本文提供了三种实用的方法来解决concrt140.dll文件丢失的问题，包括重新下载文件、重新安装相关组件以及使用专业软件恢复。 ... [详细]

蜡笔小新 2024-12-14 12:45:24
redis
PHP7升级后未安装bcmath扩展导致调用错误

本文讨论了从PHP5.6升级至PHP7过程中遇到的问题，特别是关于bcmath扩展的兼容性问题。bcmath用于执行高精度数学运算，类似于Java中的BigDecimal。升级后，在调用bcmath函数时出现了错误。 ... [详细]

蜡笔小新 2024-12-14 12:41:44

weneay

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章