一个汉字的内码码长为16bit,因为一个汉字是两个字节,一字节是8bit,所以根据汉字国标GB2312-80的规定,一个汉字的内码码长为16bit。
每个汉字使用2个字节。
GB2312-80 GB2312将代码表分为94个区,对应第一字节每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H)。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。
一般换算全部用十六进制。机内码、国际码是十六进制的,区位码是十进制的。具体换算步骤:(H表示十六进制,D表示十进制)
1、将四位数的区位码分为两部分,两位数一组。
2、将这两个两位数换算为十六进制,运用公式进行计算。 国际码=区位码(十六进制)+2020H 机内码=国际码+8080H 例如:某汉字的区位码是2534。则25D=19H,34D=22H 则国际码=1922H+2020H=3952H,机内码=3952H+8080H=B9D2H