加拿大华人论坛 美国华人新闻GBK 介绍



在加拿大


(GBK),英文名称 Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会 1995 年 12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司 1995 年 12 月 15 日联合以技监标函 [1995] 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。这一版的 GBK 规范为 1.0 版。GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。[@more@]  GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。  ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称 UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位元编码字元集》,它与 Unicode 组织的 Unicode 编码完全兼容。ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。  ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系。其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜)。而其中的中国部分,包括了源自中国大陆的 GB 2312、GB 12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的 CNS 11643 标准中第 1、2 字面(基本等同于 BIG-5 编码)、第 14 字面的汉字和符号。  一、字汇  GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充。具体包括:  1. GB 2312 中的全部汉字、非汉字符号。  2. GB 13000.1 中的其他 CJK 汉字。以上合计 20902 个 GB 化汉字。  3. 《简化字总表》中未收入 GB 13000.1 的 52 个汉字。  4. 《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件。  5. 13 个汉字结构符。  6. BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号。  7. GB 12345 增补的 6 个拼音符号。  8. 汉字“○”。  9. GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收)。  10. 从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字。  11. GB 13000.1 收入的 31 个 IBM OS/2 专用符号。  二、码位分配及顺序  GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。  全部编码分为三大部分:  1. 汉字区。包括:  a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。  b. GB 13000.1 扩充汉字区。包括:  (1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。  (2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。  2. 图形符号区。包括:  a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。  b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。  3. 用户自定义区:分为(1)(2)(3)三个小区。  (1) AAA1-AFFE,码位 564 个。  (2) F8A1-FEFE,码位 658 个。  (3) A140-A7A0,码位 672 个。  第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。  三、字形  GBK 对字形作了如下的规定:  1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。  2. 在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。  3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形。这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形。  4. 非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致。  5. 带声调的拼音字母取半角形式。  四、GBK 代码表  见 下一页。  五、目前应用  在基本操作环境方面,微软公司自 Windows 95 简体中文版始,系统采用 GBK 代码,它包括了 TrueType 宋体、黑体两种 GBK 字库(北京中易电子公司 提供),可以用于显示和打印,并提供了四种 GBK 汉字输入法。此外,浏览器 IE 4.0 简体、繁体中文版内部提供了一个 GBK-BIG5 代码双向转换的功能。  微软公司为 Internet Exporer 提供的语言包中,简体中文支持(Simplified Chinese Languege Suport Kit)的两种字库宋体、黑体,也是 GBK 汉字(珠海四通电脑排版系统开发公司 提供)。其他一些中文字库生产厂商,也开始提供 TrueType 或 PostScript GBK 字库。  许多外挂式的中文平台,如南极星、四通利方(Richwin)等,提供 GBK 码的支持,包括字库、输入法和 GBK 与其他中文代码的转换器。  在互联网方面,许多网站的网页使用了 GBK 代码,如《人民日报》等。  但是,多数搜索引擎,都不能很好地支持 GBK 汉字的搜索。大陆地区的搜索引擎,有些能够不完善地支持 GBK 汉字检索。比如,检索 GBK 汉字“槠”(),只有在 网易 等极个别的两三个搜索引擎中能查到,而检索“朱槠基”(朱基)总理三个字,则能在 搜索客(Cseek)、天网等更多的几个搜索引擎中查到。而港台和国外的搜索引擎,甚至是知名的、具有简体中文查询能力的搜索引擎,如 Yahoo!、Openfind、AltaVista 等,都不支持 GBK 搜索。  其他应用方面,微软公司的 Office 95 简体中文版以上版本,提供 GBK 码的检索和排序(按笔划和拼音两种方式)。  关于 GBK 码的输入,请参考本站《查询指南》单元 GBK 码汉字及输入法 。

  ·中文新闻 工党政府赋予工会“巨大的权力”
·中文新闻 莉莉·詹姆斯 (Lily James) 凌晨 4 点被发现与身价 65 亿英镑的 Air

美国华人新闻-加拿大

富坚义博开通推特

华人网摘要:经漫画家村田雄介和集英社确认,该账号为富坚本人。 图源:twitter 5月23日,推上出现了一个ID为富坚义博的新账号,简介上写着这是一个报告原稿进度的“官方()”并发布了一 ...

美国华人新闻-加拿大

日本议员提议立法禁止AV

华人网摘要:日本立宪民主党众议员堤かなめ在25日众议院内阁委员会上表示,立宪民主党将 "禁止涉及性行为的色情制品 "为目标制定法律。 日本立宪民主党众议员堤かなめ在25日众议院内阁 ...

美国华人新闻-加拿大

师村妙石的创新篆刻作品

华人网摘要:师村妙石,日本著名艺术家、篆刻家、书法家,一直致力于中日友好活动和文化交流,长期专攻中国传统篆刻技法。师村妙石先生曾223次访问中国进行书法研究和文化交流(截至 ...

日本,每年一次全民体检
美国华人新闻-加拿大

日本,每年一次全民体检

华人网关注我,带你看看普通人的日本生活。我家附近每隔两三百米就有一块告示板,类似于国内“居委会”或者“社区”的通知,平时大事小情都能在这里看到。前几天看到了有免费筛查宫 ...

美国华人新闻-加拿大

师村妙石的编著书影

华人网摘要:师村妙石,日本著名艺术家、篆刻家、书法家,一直致力于中日友好活动和文化交流,长期专攻中国传统篆刻技法。师村妙石先生曾223次访问中国进行书法研究和文化交流(截至 ...