作者:手机用户2502869883 | 来源:互联网 | 2023-09-10 10:11
MySQL插入emoji表情错误的3种解决方案,Incorrectstringvalue:'xF0x9Fx98x84',Go语言社区,Golang程序员人脉社
原因:mysql的UTF-8只支持三个字节的存储,而一般字符是三个字节,但是emoji表情是4个字节,所以存储不了。
而mysql为了解决这个问题,在5.5.3版本之后转而支持了存储4个字节的utf8字符,字符集为utf8mb4.这个相当于windowsX64和windowsX86的区别,64位是兼容32位的,也就是说utf8mb4存取utf8都是没有问题的。
那么在有表情的字段上就应该这样做,将该字段设置为utf8mb4
ALTER TABLE table_name MODIFY colum_name VARCHAR(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci
然而你还需要设置下表的字符集
ALTER TABLE table_name CHARSET=utf8mb4;
当然你可能还需要设置本数据库为utf8mb4啊
SET NAMES utf8mb4
然后启动起来。
可是在服务器和数据库连接的地方怎么办?
jdbc.url=jdbc:mysql://localhost:3306/aaa?useUnicode=true&characterEncoding=utf-8
这里这个utf-8要改成utf8mb4吗?
貌似不能改啊,数据库驱动就这些编码,没法改啊,一改就出错,不过没事,这是可以兼容的,对于jdbc的驱动来说.
既然没事,那就测试存储吧。
我不清楚原理,只知道现象。
那么接下来会出现两个现象,
第一:你可以存储表情了。
第二:由于未知原因,你还是不能存储表情。
对于第二种情况的同学,我要告诉你的是,当你去操作这些需要加入表情的字段之前,请插入这条sql语句。
SET NAMES utf8mb4
即可。
也就是说每次插入啊修改啊之前都set一次就没有问题了。
相信我,绝对可行。
当然,有更省事的方法,那么以上几段话当我没说,啥东西都不用改,我们从另一个角度来看问题,其实我们在存的时候过滤掉表情即可,就不用担心以后各种取各种兼容各种显示了。
com.vdurmont
emoji-java
4.0.0
这个包里,有这个方法
String string = EmojiParser.removeAllEmojis(param);
ok了。拿到这个来存不就行了吗?
第三种方案:
字符串是万金油,但是字节数组是万金油之王.我们可以对这种字段不存储varchar类型,而是存储varbinary,
这是一种可变的二进制存储.对应的java类型则是byte[]
例子:
String aa ="?";
Test record = new Test();
record.setV2(aa.getBytes("utf-8"));
mapper.insert(record);
System.out.println(mapper.selectByPrimaryKey(2));
//Test [id=2, v1=null, v2=?]
由此方案可以延伸出存储字节数组的字符串形式/base64形式等,其本质均是存储的字节数组.