浅谈Java、MySQL的中文排序问题

作者：qw874515 | 来源：互联网 | 2023-10-11 15:13

首先要声明的是Java和MySQL中的中文排序是完全不同的两回事，之所以把他们放到一块，仅仅是巧合。众所周知，Java中使用Unicode来表示字符（char是两个字节的），很好地解决了C

　　首先要声明的是Java和MySQL中的中文排序是完全不同的两回事，之所以把他们放到一块，仅仅是巧合。
　　众所周知，Java中使用Unicode来表示字符（char是两个字节的），很好地解决了C/C++一直头疼的多国语言问题（这样甚至可以用中文当变量名来编程了:)）。但因为Unicode里的中文是按部首+笔画排序的，如果习惯地想用：
String s1="中国",s2="其它";
System.out.println(s1.compareTo(s2));
来比较中文或进行习以为常的按拼音排序，结果肯定是错误的（这里的结果是-841，即“中国”<“其它”，与拼音顺序不符）。幸好，Java里还提供了区域敏感（locale-sensitive）的字符串比较：java.text.Collator。因为区域不定，所以Collator类本身是抽象类，要这样使用：
Collator myCollator=Collator.getInstance();
System.out.println(myCollator.compare(s1, s2))；
　　这样，虽然结果只是简单的1，但总算是正确的拼音顺序。把该方法用于Comparator.compare()方法中，即可实现正确的排序。

　　而MySQL中也经常会碰到这样的问题，order by某个字段时，如果以该字段的中文（GB2312编码）排序时，会比较混乱，不知以何种顺序进行排序。这是因为默认状态下，MySQL的排序不区别英文字母的大小写，而碰到GB2312编码的中文时按两个字节的ASCII码来处理，这样便使得排序出来的结果杂乱无章。解决方法也很简单（zz from 网上）：
　　方法一、
　　一种解决方法是对于包含中文的字段加上"binary"属性，使之作为二进制比较，例如将"name char(10)"改成"name char(10)binary"。
　　方法二、
　　如果你使用源码编译MySQL，可以编译MySQL时使用--with--charset=gbk 参数，这样MySQL就会直接支持中文查找和排序了。--with--charset=gbk比--with--charset=gb2312好。默认的是latin1，编译时用extra-charsets=gb2312,gbk，其中,用来加入多个字符集。

推荐阅读

get
基于SSM框架的在线考试系统：随机组卷功能详解

本文深入探讨了基于SSM（Spring, Spring MVC, MyBatis）框架构建的在线考试系统中，随机组卷功能的设计与实现方法。 ... [详细]

蜡笔小新 2024-11-22 19:00:26
get
深入解析 C++ 中的 String 和 Vector

本文详细介绍了 C++ 编程语言中 String 和 Vector 的使用方法及特性，旨在帮助开发者更好地理解和应用这两个重要的容器。 ... [详细]

蜡笔小新 2024-11-22 17:01:09
java
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
stream
在Android中实现黑客帝国风格的数字雨效果

本文将详细介绍如何在Android平台上利用自定义View实现类似《黑客帝国》中的数字雨效果。通过实例代码，我们将探讨如何设置文字颜色、大小，以及如何控制数字下落的速度和间隔。 ... [详细]

蜡笔小新 2024-11-22 16:49:53
get
阶段一：Hankson的趣味数学挑战——不使用辗转相除法求解特定条件下的正整数

Hanks博士是一位著名的生物技术专家，他的儿子Hankson对数学有着浓厚的兴趣。最近，Hankson遇到了一个有趣的数学问题，涉及求解特定条件下的正整数x，而不使用传统的辗转相除法。 ... [详细]

蜡笔小新 2024-11-22 14:26:49
php
WPF验证机制详解与实践

本文深入探讨了WPF框架下的数据验证机制，包括内置验证规则的使用、自定义验证规则的实现方法、错误信息的有效展示策略以及验证时机的选择，旨在帮助开发者构建更加健壮和用户友好的应用程序。 ... [详细]

蜡笔小新 2024-11-22 09:44:38
process
Zabbix自定义监控与邮件告警配置实践

本文详细介绍了如何在Zabbix中添加自定义监控项目，配置邮件告警功能，并解决测试告警时遇到的邮件不发送问题。 ... [详细]

蜡笔小新 2024-11-22 08:33:19
java
PHP与MySQL实现高效分页查询

本文探讨了如何在PHP与MySQL环境中实现高效的分页查询，包括基本的分页实现、性能优化技巧以及高级的分页策略。 ... [详细]

蜡笔小新 2024-11-22 05:45:48
java
处理Android EditText中数字输入与parseInt方法

本文探讨了如何在Android应用中从EditText组件安全地获取并解析用户输入的数字，特别是用于设置端口号的情况。通过示例代码和异常处理策略，展示了有效的方法来避免因非法输入导致的应用崩溃。 ... [详细]

蜡笔小新 2024-11-21 20:37:54
get
深入Luat OS：C与Lua混合编程指南

本文详细介绍了在Luat OS中如何实现C与Lua的混合编程，包括在C环境中运行Lua脚本、封装可被Lua调用的C语言库，以及C与Lua之间的数据交互方法。 ... [详细]

蜡笔小新 2024-11-22 15:52:23
io
memcpy的速度测试

想把一组chara[4096]的数组拷贝到shortb[6][256]中，尝试过用循环移位的方式，还用中间变量shortc[2048]的方式。得出的结论：1.移位方式效率最低2. ... [详细]

蜡笔小新 2024-11-22 15:10:54
get
Delphi XE2 之 FireMonkey 入门(19) - TFmxObject 的子类们(表)

td{border:1pxsolid#808080;}参考:和FMX相关的类(表)TFmxObjectIFreeNotification ... [详细]

蜡笔小新 2024-11-21 22:35:24
java
探讨Java中将图像对象转换为文件和字节数组的方法

本文详细探讨了在Java中如何将图像对象转换为文件和字节数组（Byte[]）的技术。虽然网络上存在大量相关资料，但实际操作时仍需注意细节。本文通过使用JMSL 4.0库中的图表对象作为示例，提供了一种实用的方法。 ... [详细]

蜡笔小新 2024-11-21 21:42:59
php
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
get
递归实现表达式求和

本文通过C++语言实现了一个递归算法，用于解析并计算数学表达式的值。该算法能够处理加法、减法、乘法和除法操作。 ... [详细]

蜡笔小新 2024-11-21 15:38:13

qw874515

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章