当前位置: 开发笔记 > 运维 > 正文

java转换字符串编码格式的方法

作者：jp85201 | 来源：互联网 | 2021-08-14 00:04

这篇文章主要介绍了java转换字符串编码格式的方法，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧

java转换字符串编码格式 (解码错误,重新解码)

字符集概念：规定了某个文字对应的二进制数字存放方式（编码）和某串二进制数值代表了哪个文字（解码）的转换关系。

我们在计算机屏幕上看到的是实体化的文字，而在计算机存储介质中存放的实际是二进制的比特流。

乱码场景(纯属瞎掰)：

1) 前台输入utf-8编码的一串汉字(string1)。 (页面编码为utf-8, 在内存中会将这串汉字以utf-8编码为对应的二进制流存储)

2) 这串汉字(string1)的二进制流在经过http协议传输到后台时，这段比特流会被以iso-8859-1编码强行解码为字符串(string2)。

(2.1 http默认编码格式为iso-8859-1)

(2.2 这个默认编码在什么时候起作用呢&＃63; 应该是在到达tomcat之后, 到达servlet之前, tomcat对request请求强行使用iso-8859-1进行了解码)

(2.3 有什么办法阻止tomcat对request请求强行iso-8859-1解码呢&＃63;

apache-tomcat\conf\server.xml中添加URIEncoding="UTF-8"配置即可,还是来个图吧)

3) 在后台(servlet)接收字符串(string2)时毫无疑问的乱码了。

) 这时需要将接收到的字符串(string2)根据iso-8859-1编码重新转换为byte流。再将byte流根据utf-8编码重新解码为字符串(sting3)。

5) 这时的字符串(string3)和前台的字符串(string1)是对应同一个二进制流，并且使用的是同一种编码。也就不会乱码了。

乱码的另一种解决办法：

request.setCharacterEncoding("UTF-8"),这句话熟悉么,这句话的意思是：用"utf-8"编码对客户端的请求进行重新解码。

在步骤2之后(或步骤3中)执行，那么接收到的参数也不会乱码啦。

一个小例子：

import java.io.UnsupportedEncodingException;

public class ConvertEncodingFormat {

  /**
   * 将一段错误解码的字符串重新解码
   */
  public static String convertEncodingFormat(String str, String formatFrom, String FormatTo) {
    String result = null;
    if (!(str == null || str.length() == 0)) {
      try {
        result = new String(str.getBytes(formatFrom), FormatTo);
      } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
      }
    }
    return result;
  }

  /**
   * test
   */
  public static void main(String[] args) {
　　　　 // utf-8编码
    String str = "你好，少年！";

    // UTF-8编码的byte流强行用iso-8859-1解码，毫无疑问的乱码了
    String str1 = convertEncodingFormat(str, "UTF-8", "iso-8859-1");
    System.out.println(str1);

    // 将str1再转化为byte流,重新用UTF-8解码，乱码问题解决
    String str2 = convertEncodingFormat(str1, "iso-8859-1", "UTF-8");
    System.out.println(str2);
  }

}

java字符串的各种编码转换

import java.io.UnsupportedEncodingException; 
 
/** 
 * 转换字符串的编码 
 */ 
public class ChangeCharset { 
 /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ 
 public static final String US_ASCII = "US-ASCII"; 
 
 /** ISO 拉丁字母表 No.1，也叫作 ISO-LATIN-1 */ 
 public static final String ISO_8859_1 = "ISO-8859-1"; 
 
 /** 8 位 UCS 转换格式 */ 
 public static final String UTF_8 = "UTF-8"; 
 
 /** 16 位 UCS 转换格式，Big Endian（最低地址存放高位字节）字节顺序 */ 
 public static final String UTF_16BE = "UTF-16BE"; 
 
 /** 16 位 UCS 转换格式，Little-endian（最高地址存放低位字节）字节顺序 */ 
 public static final String UTF_16LE = "UTF-16LE"; 
 
 /** 16 位 UCS 转换格式，字节顺序由可选的字节顺序标记来标识 */ 
 public static final String UTF_16 = "UTF-16"; 
 
 /** 中文超大字符集 */ 
 public static final String GBK = "GBK"; 
 
 /** 
 * 将字符编码转换成US-ASCII码 
 */ 
 public String toASCII(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, US_ASCII); 
 } 
 /** 
 * 将字符编码转换成ISO-8859-1码 
 */ 
 public String toISO_8859_1(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, ISO_8859_1); 
 } 
 /** 
 * 将字符编码转换成UTF-8码 
 */ 
 public String toUTF_8(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_8); 
 } 
 /** 
 * 将字符编码转换成UTF-16BE码 
 */ 
 public String toUTF_16BE(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_16BE); 
 } 
 /** 
 * 将字符编码转换成UTF-16LE码 
 */ 
 public String toUTF_16LE(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_16LE); 
 } 
 /** 
 * 将字符编码转换成UTF-16码 
 */ 
 public String toUTF_16(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, UTF_16); 
 } 
 /** 
 * 将字符编码转换成GBK码 
 */ 
 public String toGBK(String str) throws UnsupportedEncodingException{ 
 return this.changeCharset(str, GBK); 
 } 
  
 /** 
 * 字符串编码转换的实现方法 
 * @param str 待转换编码的字符串 
 * @param newCharset 目标编码 
 * @return 
 * @throws UnsupportedEncodingException 
 */ 
 public String changeCharset(String str, String newCharset) 
  throws UnsupportedEncodingException { 
 if (str != null) { 
  //用默认字符编码解码字符串。 
  byte[] bs = str.getBytes(); 
  //用新的字符编码生成字符串 
  return new String(bs, newCharset); 
 } 
 return null; 
 } 
 /** 
 * 字符串编码转换的实现方法 
 * @param str 待转换编码的字符串 
 * @param oldCharset 原编码 
 * @param newCharset 目标编码 
 * @return 
 * @throws UnsupportedEncodingException 
 */ 
 public String changeCharset(String str, String oldCharset, String newCharset) 
  throws UnsupportedEncodingException { 
 if (str != null) { 
  //用旧的字符编码解码字符串。解码可能会出现异常。 
  byte[] bs = str.getBytes(oldCharset); 
  //用新的字符编码生成字符串 
  return new String(bs, newCharset); 
 } 
 return null; 
 } 
 
 public static void main(String[] args) throws UnsupportedEncodingException { 
 ChangeCharset test = new ChangeCharset(); 
 String str = "This is a 中文的 String!"; 
 System.out.println("str: " + str); 
 String gbk = test.toGBK(str); 
 System.out.println("转换成GBK码: " + gbk); 
 System.out.println(); 
 String ascii = test.toASCII(str); 
 System.out.println("转换成US-ASCII码: " + ascii); 
 gbk = test.changeCharset(ascii,ChangeCharset.US_ASCII, ChangeCharset.GBK); 
 System.out.println("再把ASCII码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String iso88591 = test.toISO_8859_1(str); 
 System.out.println("转换成ISO-8859-1码: " + iso88591); 
 gbk = test.changeCharset(iso88591,ChangeCharset.ISO_8859_1, ChangeCharset.GBK); 
 System.out.println("再把ISO-8859-1码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf8 = test.toUTF_8(str); 
 System.out.println("转换成UTF-8码: " + utf8); 
 gbk = test.changeCharset(utf8,ChangeCharset.UTF_8, ChangeCharset.GBK); 
 System.out.println("再把UTF-8码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf16be = test.toUTF_16BE(str); 
 System.out.println("转换成UTF-16BE码:" + utf16be); 
 gbk = test.changeCharset(utf16be,ChangeCharset.UTF_16BE, ChangeCharset.GBK); 
 System.out.println("再把UTF-16BE码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf16le = test.toUTF_16LE(str); 
 System.out.println("转换成UTF-16LE码:" + utf16le); 
 gbk = test.changeCharset(utf16le,ChangeCharset.UTF_16LE, ChangeCharset.GBK); 
 System.out.println("再把UTF-16LE码的字符串转换成GBK码: " + gbk); 
 System.out.println(); 
 String utf16 = test.toUTF_16(str); 
 System.out.println("转换成UTF-16码:" + utf16); 
 gbk = test.changeCharset(utf16,ChangeCharset.UTF_16LE, ChangeCharset.GBK); 
 System.out.println("再把UTF-16码的字符串转换成GBK码: " + gbk); 
 String s = new String("中文".getBytes("UTF-8"),"UTF-8"); 
 System.out.println(s); 
 } 
}

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

推荐阅读

service
华为云openEuler环境下的Web应用部署实践

本文详细记录了在华为云openEuler系统上进行Web应用部署的具体步骤，包括配置yum源、安装Apache、MariaDB、PHP及其相关组件，并完成WordPress的安装与配置过程。 ... [详细]

蜡笔小新 2024-11-25 12:39:31
service
SpringBoot底层注解用法及原理

2.1、组件添加1、Configuration基本使用Full模式与Lite模式示例最佳实战配置类组件之间无依赖关系用Lite模式加速容器启动过程，减少判断配置类组 ... [详细]

蜡笔小新 2024-11-25 09:48:01
linux
解决 MyBatis 批量操作时 BindingException 异常

本文探讨了在使用 MyBatis 进行批量数据处理时遇到的参数绑定异常问题，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-11-24 13:03:13
服务器
Maven快照版本管理及更新策略详解

本文深入探讨了Maven中的快照版本管理和更新策略，解释了快照版本与正式版本的区别，并提供了如何配置快照更新策略的方法，以确保项目依赖始终保持最新。 ... [详细]

蜡笔小新 2024-11-24 06:20:08
服务器
如何使用Maven将依赖插件一并打包进JAR文件

本文详细介绍了在使用Maven构建项目时，如何将所需的依赖插件一同打包进最终的JAR文件中，以避免手动部署依赖库的麻烦。 ... [详细]

蜡笔小新 2024-11-23 22:51:34
port
Servlet基础入门指南（上）

本文介绍了Tomcat的基本操作，包括启动、关闭及首次访问的方法，并详细讲解了如何在IDEA中创建Web项目，配置Servlet及其映射，以及如何将项目部署到Tomcat。 ... [详细]

蜡笔小新 2024-11-23 11:55:30
tomcat
[附源码]计算机毕业设计JAVAjsp医药管理信息系统

[附源码]计算机毕业设计JAVAjsp医药管理信息系统项目运行环境配置：Jdk1.8Tomcat7.0MysqlHBuilderX（Webstor ... [详细]

蜡笔小新 2024-11-22 18:50:22
tomcat
最适合初学者的编程语言

本文探讨了适合编程新手的最佳语言选择，包括Python、JavaScript等易于上手且功能强大的语言，以及如何通过有效的学习方法提高编程技能。 ... [详细]

蜡笔小新 2024-11-22 16:17:04
service
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
port
Android与JUnit集成测试实践

本文探讨了如何在Android项目中集成JUnit进行单元测试，并详细介绍了修改AndroidManifest.xml文件以支持测试的方法。 ... [详细]

蜡笔小新 2024-11-20 18:30:14
服务器
解决PHP及Web开发中的UTF-8乱码问题

本文详细探讨了在Web开发中常见的UTF-8编码问题及其解决方案，包括HTML页面、PHP脚本、MySQL数据库以及JavaScript和Flash应用中的乱码问题。 ... [详细]

蜡笔小新 2024-11-20 10:58:03
service
深入解析 Java 中 org.w3c.dom.Node.isEqualNode() 方法及其应用实例

本文详细介绍了 Java 中 org.w3c.dom.Node 类的 isEqualNode() 方法的功能、参数及返回值，并通过多个实际代码示例来展示其具体应用。此方法用于检测两个节点是否相等，而不仅仅是判断它们是否为同一个对象。 ... [详细]

蜡笔小新 2024-11-19 18:11:10
linux
不用任何框架你们能从头到尾写一个完整的项目吗？

现在的新手程序猿，动不动就是框架，就连外面培训的也是框架，我就问一句，没了框架是不是就啥也不会了 ... [详细]

蜡笔小新 2024-11-25 12:37:01
linux
IIS6批量添加主机头，修改IIS数据库

首先，找到IIS的数据库。默认是在C:\WINDOWS\system32\inetsrv下的MetaBase.xml文件。如果找不到，请右键右键站点-》所有服务-》将配置保存到一个 ... [详细]

蜡笔小新 2024-11-25 10:44:48
linux
Spring MVC 常见问题及解决方法

本文总结了在使用 Spring MVC 过程中常见的错误及其解决方案，包括 Servlet 配置错误等典型问题。 ... [详细]

蜡笔小新 2024-11-25 10:41:15

jp85201

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章