一、一个汉字在计算机中占两个字节的位置
三、汉字信息处理过程
西文字符中的ASCII码表示西文字符是,用的是7位的ASCII码,为了在计算机中存储,最高位(第八位)默认为0,所以可以表示27个不同的字符;扩展的ASCII码,使用的第八位,不在默认为0,所以最多可以表示28个字符。
中文跟西文不大一样。中文的一个汉字占16位,也就是两个字节的位置。编码方式跟ASCII码类似,但是为了与ASCII码区别开来,最高位默认为1.
二、汉字编码的过程汉字编码分为外码、机内码、字形码、矢量汉字四个阶段。 外码是输入码,就像搜狗那样的输入法。机内码有国标码、BIG5等,这个过程是不会在电脑屏幕上显示的。字形码以点阵形式表示一个汉字。矢量汉字是用一种软件在屏幕上显示汉字字形,可以随意的放大缩小。 国标码是 用于计算机之间或与终端之间信息交换时的汉字代码(GB2312,GBK,GB18030), 由连续的两个字节组成,每个字节七位有效,最高位为1。 字形码是确定一个汉字字形点阵的代码, 汉字字形点阵中的每个点对应一个二进制位。 矢量汉字是用软件描述汉字 ,矢量字库保存对每一个汉字的描述信息,比如一个笔划的起始、终止坐标,半径、弧度等等。在输出时要经过一定的数学运算。 矢量汉字可随意放大、缩小而不变形。 Windows使用的字库为以上两类。在FONTS目录下,扩展名为FON的文件为点阵字库;扩展名为TTF为矢量字库。
三、汉字信息处理过程
点击查看更多内容
15人点赞
评论
共同学习,写下你的评论
评论加载中...
作者其他优质文章
正在加载中
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦