要技术指标,字长越长,性能越好。计算机型号不同,其字长也不同,常用的字长有8位、16位、32位和64位。
计算机存储容量的大小是用字节的多少来衡量,通常使用的衡量单位是B、KB、MB、GB或TB,其中B代表字节,这些衡量单位之间的换算关系如下:
1B=8bit,1KB=1024B,1MB=1024KB;1GB=1024MB;1TB=1024GB。 1.4.2小数的表示(定点数和浮点数)
1.机器数
机器数是指数在计算机中的表示形式;机器数真正表示的数值称为这个机器数的真值。机器数有三个特征:
1)机器数据表示的数的范围受计算机字长的限制
例如:82=(255)10,运算时如果数值超过机器所能表示的范围,运算就会因出错而终止。这种情况称为“溢出”。
2)机器数的符号位被数值化
数值数据有正负之分,机器数也有正有负。在计算机中,总是用数的最高位表示数的符号,并且规定0表示正数,1表示负数。
3)机器数的小数点处于约定的位置 小数的表示两种表示方法:定点数和浮点数。定点数是指小数点位置固定不变;浮点数:允许小数点位置浮动。
2.定点数的表示
规定一个小数点固定的位置,采用把小数点固定在最低位的右边或符号位的右面,即把参加运算的数化为纯整数或纯小数。
例如:二进制数N可以写成 N=2p×S
式中:S称为数N的尾数;P称为数N的阶码;2称为阶码的底。S表示数N的全部有效数字,阶码P指明了小数点的位置,定点数的阶码P值是固定的。
1)定点整数的表示法
P=0,而S为纯整数,则小数点的位置定在S之后:
符号位 尾数S · 小数点 2)定点小数的表示法 S为纯小数,小数点固定在符号位的右面: 符号位 尾数S ·3.浮点数的表示 小数点 浮点数的阶码P值不是固定的,而是可以浮动的。这时: N=2p×S
式中:阶码为可变的整数,并且可以是正数,也可以是负数;尾数S也可正、可负。
通常用一位二进制数Pf表示阶码的符号位,用一位二进制数Sf表示尾数的符号位。
浮点数表示法:阶码部分为定点整数,尾数部分为定点小数。
Pf 阶码P Sf 尾数S
1.4.3原码、反码、补码的表示
数在计算机中是以二进制形式表示的,它分为有符号数和无符号数。原码、反码、补码都是有符号定点数的表示方法,一个有符号定点数的最高位为符号位,0表示正,1表示负。在计算机内,定点数有3种表示法:原码、反码和补码。
1.原码的表示
原码表示法是机器数的一种简单的表示法。其符号位用0表示正号,用:表示负号,数值一般用二进制形式表示。设有一数为X,则原码表示可记作:[X]原。
1)小数原码的定义 X 0≤X<1 2)整数原码的定义 [X]原= 1-X -1 2.反码的表示 机器数的反码可由原码得到。如果机器数是正数,则该机器数的反码与原码一样;如果机器数是负数,则该机器数的反码是对它的原码(符号位除外)各位取反而得到的。设有一数X,则X的反码表示记作[X]反。 1)小数反码的定义 X 0≤X<1 2)整数反码的定义 [X]反n-1n = 2-2X -X -01 3.补码的表示 机器数的补码可由原码得到。如果机器数是正数,则该机器数的补码与原码一样;如果机器数是负数,则该机器数的补码是对它的原码(除符号位外)各位取反,并在未位加1而得到的。设有一数X,则X的补码表示记作[X]补。 1)小数补码的定义 X 0≤X<1 2)整数补码的定义 [X]补 = 2+X -1 X 0≤X<2 0补码是00000000 [X]反补码没有正0与负0之分。表示方法如下: n+12+X 0,其余照抄;-2n 若X≤0,符号位为1,其余取反后,最低位加1。 例如,X=+1001001,?[X]补=01001001 3)补码的性质 ①[X+Y]补=[X]补+[Y]补,即两数之和的补码等于各自补码的和。 例如,X=+0110011,Y=-0101001,求[X+Y]补。 [X]补=00110011???[Y]补 [X+Y]补=[X]补+[Y]补 注:因为计算机中运算器的位长是固定的,上述运算中产生的最高位进位将丢掉,所以结果不是 ②[x-y]补=[x]补+[-y]补,即两数之差的补码等于被减数的补码与减数相反数的补码之和。 例如,X=+0111001,Y=+1001101,求[X-Y]补。 [X]补=00111001[Y]补=01001101[-Y]补 [X-Y]补=[X]补+[-Y]补 ③[[x]补]补=[x]原,即按求补的方法,对[x]补再求补一次,结果等于[x]原。 4.反码的表示 正数的反码与其原码相同;负数的反码是对其原码逐位取反,但符号位除外。补码表示法规定:正数的补码与其原码相同;负数的补码是在其反码的末位加1。拿单字节整数来说,无符号型,其表示范围是[0,255],总共表示了256个数据。有符号型,其表示范围是[-128,127]。 1.4.4 ASCII编码 字符是用来组织、控制或表示数据的字母、数字以及计算机能识别的其他符号,使用最广泛的编码,即 (AmericanStandardCodeforInformationInterchange)。如表1-3所示。 b7b6000 001 010 011 100 101 110 111 b5 (0) (1) (2) (3) (4) (5) (6) (7) b4b3b2b1 0000(0) 0001(1) 0010(2) 0011(3) 0100(4) 0101(5) 0110(6) 0111(7) ETB ‘ 7 G W g w CA1000(8) BS ( 8 H X h x N 1001(9) HT EM ) 9 I Y i y 1010(A) LF SUB * : J Z j z 1011(B) VT ESC + ; K [ k { 1100(C) FF FS , < L \\ l | 1101(D) CR GS - = M ] m } 1110(E) SO RS . > M ^ n ~ 1111(F) SI US / ? O - o DEL 表1-3 ASCII字符编码 ASCII码用7位二进制数表示一个字符,排列顺序为b7b6b5b4b3b2b1,并且规定用一个字节的低7位表示字符编码,最高位恒为0。7位二进制数共可以表示128个字符,这些字符包括26个大写英文字母、26个小写英文字母、10个十进制数字、32个标点符号、运算符、专用字符以及34个通用控制字符。 例如:“CR”符的ASCII码的十六进制为“0DH”,“LF”符的ASCII码的十六进制为“0AH”,“SP”符的ASCII码的十六进制为“20H”,“9”的ASCII码的十六进制为“39H”,“W”的ASCII码的十六进制为“57H”等等。 NUL SOH STX ETX EOT ENQ ACK BEL DLE DC1 DC2 DC3 DE4 NAK SYN SP ! “ # $ % & 0 1 2 3 4 5 6 @ A B C D E F P Q R S T U V ` a b c d e f p q r s t u v 1.5汉字信息的处理 每个国家使用计算机都要处理本国语言。1980年我国颁布了《信息交换用汉字编码字符集-基本集》,即国家标准GB2312-80。共收集汉字6763个,分为两级。第一级3755个汉字,属常用汉字,按汉字拼音字母顺序排列。第二级3008个汉字,属次常用汉字,按部首排列。 1995年我国又颁布了《汉字编码扩展规范》(GBK)。GBK与GB2312-1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646-1和GB13000-1的全部中、日、韩(CJK)汉字,共计20902字。 1.计算机处理汉字的关键
相关推荐: