百木园-与人分享,
就是让自己快乐。

数据中有emoji,导致插入不了数据库

前言

前两天负责的系统,因为需要获取用户的昵称并进行入库,但是有个别用户的昵称中存在emoji表情,导致入库时报错。

报错内容:
java.sql.SQLException: Incorrect string value: ‘\\xF0\\x9F\\x92\\x94‘ for column

问题原因

Q:为什么我们设置表的的字符类型为utf8却不能存放emoji呢?

A:因为我们UTF-8编码可能是2或3或4个字节,但mysql中的utf8是3个字节,存放一个emoji是需要4个字节的,自然不够。
Mysql数据库在5.5.3之后开始支持utf8mb4字符集,所以mysql版本是5.5.3+的都可以设置让数据库存储Emoji表情
所以如果你的应用有移动端的,最好一开始设计数据库的时候就使用utf8mb4字符集

解决方案:

方案一: 过滤字符串中的emoji

方案二: 转译emoji后入库。获取时反转译成emoji使用

//转译emoji
URLEncoder.encode(含有emoji的数据, \"UTF-8\");
//反转译成emoji<br/>
URLDecoder.decode(经过转义的数据, \"UTF-8\");

另外再推荐一款emoji转义工具

注意点:emoji转译后可以入库。但当用户就是输入的内容本身就是【转译后的内容】
此时从库中反转译时就变成了emoji。这就造成跟用户输入不一致的情况

方案三: 修改数据库配置,实现可存储emoji

目前网上给的解决方案普遍都是:修改该字段或者该张表的编码方式为utf8mb4
但仅这么处理是并不起作用。

还需要执行SET NAMES utf8mb4; 将整个库的 character_set_client、character_set_connection、character_set_results等值修改为utf8mb4才会起作用

修改已经建立表的字符集alter table TABLE_NAME convert to character set utf8mb4 collate utf8mb4_bin;

注意点:新建数据库时可以进行初始化设置,但是已有的线上生产库进行此操作有风险,因此建议使用相关类库转义后进行存储和显示

使用下列SQL语句可以查看MySQL中character_set相关变量:
SHOW VARIABLES LIKE \'%char%\';

------The End------

感谢大家看到最后,文章持续更新!欢迎大家指出我的文章的不足之处,也欢迎大家关注、收藏+分享

如果这个办法对您有用,或者您希望持续关注,也可以扫描下方二维码或者在微信公众号中搜索【码路无涯】

来源:https://www.cnblogs.com/mlwy/p/15582776.html
图文来源于网络,如有侵权请联系删除。

未经允许不得转载:百木园 » 数据中有emoji,导致插入不了数据库

相关推荐

  • 暂无文章