计算机中的信息表示.docx

资源描述

计算机中的信息表示.docx

《计算机中的信息表示.docx》由会员分享，可在线阅读，更多相关《计算机中的信息表示.docx（9页珍藏版）》请在冰豆网上搜索。

计算机中的信息表示.docx

计算机中的信息表示

1.进位计数制

1.常见的进位计数制

Binary二进制Octonary八进制Decimalism十进制Hexadecimal十六进制

进位计数制：

利用固定的数字符号和统一的规则来计数的方法。

有3个基本要素：

基数->指数制中可以使用的基本符号个数。

进位规则->R进制数逢R进1。

位权->不同位置上数字表示的单位数值

2.常见的进位计数制的数的转换

1.二、八、十六进制转成十进制

多项式展开直接求和

2.十进制转换成二进制

整数部分：

除基到零，反向写余

小数部分：

乘基到精，正向写整

3.二进制转成八、十六进制

小数点为界，向两边分组。

八进制3个一组，十六进制4个一组，不足添0。

各组二进制转成十进制再转成八（十六）进制即可。

2.计算机中的数据

1.二进制与计算机

位（bit）：

计算机中最基本的单位，一个二进制数字0/1。

字节（Byte）：

8个位。

字：

字节的集合。

字长：

一个字中二进制的位数。

字长是计算机一次能同时进行运算的二进制位数。

现在一般为32bit、64bit。

一般来说，n位的二进制数字能够表示种状态。

2.模拟数据和数字数据

模拟数据：

一种连续表示法，模拟它表示的真实信息。

数字数据：

一种离散表示法，把信息分割成了独立的元素。

阈值：

大于阈值的电压看成高电压，小于阈值的电压看成低电压。

计算机不能处理模拟数据，要对模拟数据进行数字化。

3.数据及其分类

数值、文本、音频、视频、图像、图形。

4.数值型数据的表示

机器数：

一个数在计算机中的表示形式。

机器数有位数限制，多余的位数将被截断，少的位数将被填充。

（机器数的）真值：

带有正负号的数。

1.数值型数据的分类

根据是否带小数点分为实数和整数。

按照是否带有符号，整数分为带符号和无符号。

对于带符号的整数要对符号进行编码。

数值数据可以用原码和补码表示。

为了表示实数中的小数点的位置，可以表示为定点数或浮点数。

2.整数的表示

无符号整数表示：

转成二进制数，对不足机器字长的在前面补0。

最小值全是0，最大值全是1。

带符号整数表示：

0表示正，1表示负。

符号位占用一位二进制数位。

原码：

最高位符号位，其余位数是数值的绝对值。

补码：

正数同原码，负数补码除符号位外其他位取反，末尾位加1。

+、-0的补码一致。

3.实数的表示

定点数的表示：

定点数就是在运算过程中小数点的位置固定不变。

小数点位置不一定是明确指定的。

由于小数点位置固定，计算时可以直接进行加减运算。

浮点数的表示：

任何一个数都可以用科学计数法来表示，这种表示方法称为浮点表示法。

浮点数的一般表示形式：

单精度（32b）

IEEE754规定单精度浮点数（32b）双精度浮点数（64b）。

对于二进制实数，现将其写成尾数是定点小数的科学计数法的形式。

再将其尾数扩充为23位，阶码扩充为8位，再把尾数转换成补码形式。

溢出

计算机中n位有符号数的表示范围（

）。

超出范围会产生溢出。

5.文本表示

一个文本是由一系列字符构成的。

要处理一个文本，必须表示和存储每个可能出现的字符。

内码：

字符在计算机中存储和处理时的编码。

1.文本类型

1.简单文本：

仅由一串字符代码组成，没有字体字号的变化和其他媒体。

文件扩展名为txt。

2.丰富格式文本：

允许在文档中设置格式（字体、颜色、页边距、自选图形、公式等）的文本。

3.超文本（HTML文本）：

有声音、视频等多媒体信息，还有链接。

不管是哪种类型，核心问题是要表示字符本身，格式符号需要单独表示。

最早也是最常用的方法是列出所有字符，给每个字符编一个二进制位串。

要表示的符号数决定了需要多少二进制位数来表示。

西文字符——>ASCII码

汉字字符——>GB2312-1980

全世界所有字符——>Unicode码

2.文本内码

1.ASCII码

美国标准信息互换标准代码。

最初，ASCII字符集中每个字符由7个二进制位表示，总共有128个不同字符。

用一个字节存储，第8位用作校验位。

ASCII码表中特殊的33个字符（0~31和127）是不可显示和打印的控制码。

比如CR（回车）。

2.Unicode编码

表示世界上使用的所有语言的所有字符。

Unicode使用16位表示每个字符，能够表示

个字符。

Unicode字符集是ASCII字符集的超集。

Unicode常用的两种编码方案如下：

1）UTF-8单字节可变长编码：

每个字符占1~4个字节。

有单、双、三、四字节。

2）UTF-16双字节可变长编码：

每个字符占2或4个字节。

3.汉字编码

汉字内码是计算机内部使用的用二进制表示的汉字编码。

i）区位码

94x94个ASCII字符为基础构成二维平面，行为区，列为位。

每一个汉字/字符都对应唯一一个区（左）位（右）号。

每个汉字用2个字节表示。

ii）

汉字内码GB2312标准

ASCII码用1个字节表示，最高位为0。

汉字内码用2个字节来表示，每个字节最高位是1。

为了与ASCII码的可打印字符位置一致，在区号和位号上分别加上20H（32），称为国标码。

区位码转换成机内码的方法是：

将十进制的区码和位码转成十六进制的，将他们分别加上20H得到国际码。

再在高低字节上加上80H。

Ex:

中国OK!

占2+2+1+1+1=7个字节

iii）

汉字内码GBK标准编码

1995年汉字内码扩充标准。

要求双字节最高位为1。

iv）汉字内码GB18030汉字编码标准

国家发布过GB18030-2000和GB18030-2005，现已强制贯彻执行。

4.文本输入

1．键盘输入

2．联机手写输入

3．语音输入

4．印刷体识别

5.文本输出

1.字符点阵描述

每个字符按照图形符号设计成点阵图，用一位二进制对应屏幕上的一个点，亮为1暗为0，就得到相应的点阵代码（字形码）。

2.字符轮廓描述

以字符轮廓的转折点为特征来描述字符，又称矢量字体。

用一组直线和曲线命令以及一些参数来描述字体的轮廓。

3.字库

把所有可显示和打印的ASCII字符和汉字的字形信息放在一个文件中，称为字形库。

C：

\windows\fonts

4.文本压缩

数据压缩：

又称数据编码。

是为了在存储和传输数据时减小数据所占空间大小的方法。

分为有损/无损。

压缩率：

原始数据大小/压缩后大小。

1.关键字编码：

用单个字符代替常用单词。

2.行程长度编码：

又称迭代编码。

将重复的字符序列替换为标志字符。

后面加重复字符和说明重复次数的数字。

Ex：

*A7就是AAAAAAA。

3.赫夫曼编码

用不同长度的二进制位串表示不同字符。

把较少的位串表示经常出现的字符，而较长的位串表示不常出现的字符。

郝夫曼编码的重要特征：

用于表示一个字符的位串是表示另一个字符的位串的前缀。

从左到右扫描一个位串事，每当发现一个位串对应一个字符时，他就一定表示这个字符，他不可能是更长的位串的前缀。

5.图像和图形的表示

1.颜色表示

三基色原理：

人眼可以觉察到得颜色都能由红、绿、蓝三种颜色按照不同的比例混合而成。

计算机中颜色表示：

用RGB指表示。

RGB是3个数（0~255），表示每种颜色占的比例。

对颜色编码：

把一种颜色分解为RGB值的过程。

颜色深度：

用于表示颜色的数据量。

通常用表示颜色的位数来表示。

现在用24位的真彩色表示（3x8），即RGB值中的每个数字由8位表示，范围是0~255。

能表示1670万种颜色。

2.图像数字化

数字化图像：

将图像按照行和列的方式均匀地划分为若干个小格子（像素）。

分辨率：

水平像素点x垂直像素点。

图像：

像素点的集合。

存储一幅图像就是要存储图像上每个像素点的信息。

图像的编码：

每个像素呈现一种颜色（灰度层次），对每个像素进行RGB编码，再把所有行列的像素编码连接起来。

图像的获取：

是模拟信号数字化的过程。

扫描、分色、取样、量化、编码。

3.数字图像的表示

根据图像中每个像素点的信息位数，可将图像分为彩色图像、灰度图像和黑白图像。

1.彩色图像：

由RGB3个彩色分量组成，需要用3个矩阵分别表示每个彩色分量的亮度值。

2.灰度图像：

每个像素只有1个灰度分量。

通常8位表示，代表256个灰度。

人眼能识别的灰度大概是100个。

3.黑白图像：

每个像素只有1个黑色分量。

只用一个二进制位表示。

取值只有0（黑）1（白）。

二值化：

把图像转换成黑白图像的操作。

二值化选定一个阈值，高于它为黑，反之为白。

4.图像的存储和压缩

图像数字化后的大小=水平分辨率x垂直分辨率x颜色深度/8

1024x1024x24/8=3.75MB

图像压缩：

提高在网络上传输的速度。

流行的图像压缩都遵循静态图像压缩国际标准JPEG。

流行的逐个像素存储图像方法有位图（BMP）、GIF、PNG、JPEG、TIFF、PSD，他们都采用了不同方式的压缩方式。

5.图形的表示

图形：

由点、线、面体等集合元素和灰度、色彩、线型、线宽等非几何属性组成。

分为平面图形和三维图形。

矢量图形：

计算机图形一般用矢量图形格式来描述。

它不适用于描述真实世界的图像，是用于艺术线条和卡通绘画。

图像效果差，但是放大不失真。

常见格式：

3DS\DXF\WMF\FLASH\SVG。

6.音频信息表示

1.声音数字化

采样：

周期性测量模拟信号的电压，记录合适的数值。

将模拟信号数字化。

量化：

把采样的结果用有限个数字表示出来。

量化精度：

量化的二进制数值的位数。

每秒声音的数据量可以用声音的码率来表示（每秒二进制位b/s）

声音码率=采样频率x量化精度x声道数

声音数据量=声音的码率x时间/8

编码：

声音经过量化后数据量比较大，需要进行数据压缩，以减小数据量。

失真：

采样频率低于每秒40000次，不足以复原原始声音，人耳听到就会失真。

2.音频格式

WAV、AU、AIFF、VQF、MP3、MID。

视频表示

视频是一系列压缩的静态图像组成的，每一幅镜头图像成为帧。

常用的两种压缩方式：

时间压缩和空间压缩。

常见格式：

rm、rmvb、wmv、asf、mpeg、dat、avi。

WelcomeTo

Download!

欢迎您的下载，资料仅供参考！

展开阅读全文