iso8859和gbk,iso8859转换成gbk
GB 和 GBK 的区别?
简单的说就是GB可以输出简体中文,GBK则可以输出简/繁体中文!
一、GB字库:全称GB2312或GB2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集--基本集》,由中国国家标准总局 发布,1981年5月1日实施。GB2312编码通行于大陆;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB2312。GB2312标准共收录6763个汉字, GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。01-09区为特殊符号。16-55区为一级汉字共有汉字3755个,按拼音排序;56-87区为二级汉字共有汉字3008个,按部首/笔画排序;10-15区及88-94区则未有编码。
二、GBK字库:GBK全名为汉字内码扩展规范,英文名Chinese Internal Code Specification。K 即是“扩展”所对应的汉语拼音(KuoZhan)中“扩”字的声母。 1993年,Unicode
1.1版本推出,收录了中国大陆、台湾、日本及韩国通用字符集的汉字,总共有20,912个。中国大陆订定了等同于Unicode
1.1版本的“GB13000.1-93”“信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面”。由于GB2312-80只收录了6763个汉字,有不少汉字,如部分于GB2312-80推出后才简化的汉字(如“啰”),部分人名用字(如中国前总理朱镕基的“镕”字),台湾及香港使用的繁体字,日语及朝鲜语汉字等,并未有收录在内。 中国大陆于是利用了GB2312-80未有使用的编码空间,收录了所有出现于Unicode
1.1及GB13000.1-93之中的汉字,制定了GBK编码。微软在它出品的Windows 98中,即采用了GBK编码。在微软的系统内称为CP936字码表。
关于GB与BIG5码的判别,没有100%可靠的方法。但是从两个编码系统汉字的分布来看,还有可以作一定的判断的。GB码的编码范围是首字节A1-F7,尾字节A1-FE,而且首字节A1-A9是符号区,AA-AF这一段没有定义。BIG5码的编码范围是首字节A1-F9,尾字节分两段,分别是40-7E及A1-FE,首字节A1-A3是符号区,A4-C5是常用汉字区。这样我们可以找到几个依据:1)尾字节40-7E是BIG5码特有的,可以以此来判别,但是现在GBK在这个码区也定义了字符,不过这些汉字的使用频度不高,所以仍然可以作为一条依据,但无法保证100%正确;2)首字节A4-A9在GB中为日文假名、希腊字母、俄文字母和制表符,正常文本中很少出现,AA-AF则根本没有定义,但这个范围却是BIG5码的常用汉字,所以如果文本中频繁出现这个范围的码,也可以认为是BIG5码。尤其是首字节位于AA-AF之间,尾字节位于A1-FE的,几乎100%是BIG5码无疑,因为即使在GBK中,这个范围也是没有定义的。为了提高识别的正确率,最好多种判据同时使用。另外还可以通过分析汉字出现的频率,或查找某些常用的词组来判别。因为做起来比较复杂,就不多说了。首字节C6-D7,尾字节A1-FE在GB中属于一级字库,是常用汉字,而在BIG5中,C6-C7没有明确定义,但通常用来放日文假名和序号,C8-D7属于罕用汉字区。所以如果这个范围的码出现较多,可以判别为GB码。
问题不是很清楚呀,麻烦说清楚点。
文本ansi和gbk编码有什么区别?
不知道你具体啥意思 还有ISO国际标准化组织经常发布标准,被称作ISO标准。 编码?纯文本的编码标准: ANSI GBK、Unicode、Unicode big endian和UTF-8这几种编码 UTF-3
2、UTF-16和UTF-8 UCS2 中国常用GBK 和gb2312 国际化最好的是utf8
文本ansi和gbk编码有什么区别?
不知道你具体啥意思 还有ISO国际标准化组织经常发布标准,被称作ISO标准。 编码?纯文本的编码标准: ANSI GBK、Unicode、Unicode big endian和UTF-8这几种编码 UTF-3
2、UTF-16和UTF-8 UCS2 中国常用GBK 和gb2312 国际化最好的是utf8
gbk编码是什么?
GBK即汉字内码扩展规范,英文名称为Chinese Internal Code Specification。GBK的相关缩写:
1、原gb2312 HTML编码标签代码如下:;
2、可以缩写为或;
3、缩写兼容性:所有浏览器均兼容,无论新旧版本IE还是不同品牌浏览器均兼容。至于GBK编码简写时候编码填写为gb2312还是填写为gbk,DIVCSS认为没有什么区别,均可。为了符合大家都使用gbk字符编码,大家可以写为“gb2312”。扩展资料:GBK的特点:GBK编码是GB2312编码的超集,向下完全兼容GB2312。GB18030编码向下兼容GBK和GB2312。GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换。GBK,GB2312以及Unicode都既是字符集,也是编码方式,而UTF-8只是编码方式,并不是字符集。参考资料来源:
GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE(高字节从81到FE,低字节从40到FE),剔除xx7F码位,共23940个码位。GBK编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年12月15日正式发布,这一版的GBK规范为
1.0版。扩展资料:全部编码分为三大部分:
1、汉字区。包括:a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。b. GB 13000.1 扩充汉字区。包括:(1)、 GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。(2) 、GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。(3) 、汉字“〇”安排在图形符号区GBK/5:A996。
2、图形符号区。包括:a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“〇”排列在此区。计符号 166 个。
3、 用户自定义区:分为(1)(2)(3)三个小区。(1)、 AAA1-AFFE,码位 564 个。(2) 、F8A1-FEFE,码位 658 个。(3) 、A140-A7A0,码位 672 个。第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。
什么是GBK字库?
GBK是系统的一种字符编码,通常是在国内使用的,能够完善支持简体中文,但是如果在国外的浏览器上则会出现乱码的现象,国外一般使用UTF8,它的通用性比较好,几乎全球通用。关于GBK、GIF
5、和UTF-8这些编码,详细可以到我这里看一下。
GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年10月制定, 1995年12月正式发布,目前中文版的WIN9
5、WIN9
8、WINDOWS NT以及WINDOWS 2000、WINDOWS XP等都支持GBK编码方案。