你好,欢迎来到电脑编程技巧与维护杂志社! 杂志社简介广告服务读者反馈编程社区  
合订本订阅
 
 
您的位置:技术专栏 / 数据库开发
mysql5.1中utf8编码下一个汉字占用一个char的疑惑
 
最近发现Oracle和MySQL的字段长度的计算不一样(都是UTF8编码),比如:
在Oracle下定义:name varchar2(10) ,name字段能存放:10个字符或3个汉字
在MySQL下定义:name varchar(10),name字段能存放:10个字符或10个汉字
从上面可以得知:在oracle下,1个汉字=3个字节
为什么在 MySQL 下,1个汉字=1个字节 呢??

经查,说:MySQL5 以后 varchar 的单位是字符了,而 oracle 的varchar2 是字节
编码不一样一个汉字占用的字节也不一样:
UTF-8 下 1汉字=3字节
GDK下 1汉字=2字节

mysql varchar(50),不管中文还是英文都是存50个的。
MySQL5的文档,其中对varchar字段类型这样描述:varchar(m) 变长字符串。M 表示最大列长度。M的范围是0到65,535。(VARCHAR的最大实际长度由最长的行的大小和使用的字符集确定,最大有效长度是65,532字节)。
为何会这般变换?真是感觉MySQL的手册做的太不友好了,因为你要仔细的继续往下读才会发现这段描述:MySQL 5.1遵从标准SQL规范,并且不删除VARCHAR值的尾部空格。VARCHAR保存时用一个字节或两个字节长的前缀+数据。如果VARCHAR列声明的长度大于255,长度前缀是两个字节。
好了,貌似懂了一点。但具体他说的长度大于255时使用2个字节长度前缀,小学减法题:65535 - 2 = 65533啊。不知道这些大牛如何计算的,暂且保留疑问吧?

注:我测试了一下使用UTF8编码,varchar的最大长度为21854字节。
在mysql 5.0.45版本,数据库编码utf8下进行测试:varchar最长定义为21785。也就是说不论字母、数字、汉字,只能放21785个。

推想:varchar字节最大65535,utf8编码一个字符3个字节65535/3=21785。但是用length函数取值的时候发现,一个汉字占3个字节,一个字母等字符占用一个字节。这个对于char(10)来说,是不是实际长度是不定的呢?

  推荐精品文章

·2024年12月目录 
·2024年11月目录 
·2024年10月目录 
·2024年9月目录 
·2024年8月目录 
·2024年7月目录 
·2024年6月目录 
·2024年5月目录 
·2024年4月目录 
·2024年3月目录 
·2024年2月目录 
·2024年1月目录
·2023年12月目录
·2023年11月目录

  联系方式
TEL:010-82561037
Fax: 010-82561614
QQ: 100164630
Mail:gaojian@comprg.com.cn

  友情链接
 
Copyright 2001-2010, www.comprg.com.cn, All Rights Reserved
京ICP备14022230号-1,电话/传真:010-82561037 82561614 ,Mail:gaojian@comprg.com.cn
地址:北京市海淀区远大路20号宝蓝大厦E座704,邮编:100089