多媒体计算机技术笔记共11页word资料.docx

上传人:b****6 文档编号:15845403 上传时间:2023-07-08 格式:DOCX 页数:23 大小:33.17KB
下载 相关 举报
多媒体计算机技术笔记共11页word资料.docx_第1页
第1页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第2页
第2页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第3页
第3页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第4页
第4页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第5页
第5页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第6页
第6页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第7页
第7页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第8页
第8页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第9页
第9页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第10页
第10页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第11页
第11页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第12页
第12页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第13页
第13页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第14页
第14页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第15页
第15页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第16页
第16页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第17页
第17页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第18页
第18页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第19页
第19页 / 共23页
多媒体计算机技术笔记共11页word资料.docx_第20页
第20页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

多媒体计算机技术笔记共11页word资料.docx

《多媒体计算机技术笔记共11页word资料.docx》由会员分享,可在线阅读,更多相关《多媒体计算机技术笔记共11页word资料.docx(23页珍藏版)》请在冰点文库上搜索。

多媒体计算机技术笔记共11页word资料.docx

多媒体计算机技术笔记共11页word资料

第一章多媒体技术概述

要练说,得练看。

看与说是统一的,看不准就难以说得好。

练看,就是训练幼儿的观察能力,扩大幼儿的认知范围,让幼儿在观察事物、观察生活、观察自然的活动中,积累词汇、理解词义、发展语言。

在运用观察法组织活动时,我着眼观察于观察对象的选择,着力于观察过程的指导,着重于幼儿观察能力和语言表达能力的提高。

1、什么是媒体?

1)一是指用以存储信息的实体,如磁盘、磁带、光盘和半导体存储器;2)一是指信息的载体,如数字、文本、声音、图形图像和视频等。

与当今“教师”一称最接近的“老师”概念,最早也要追溯至宋元时期。

金代元好问《示侄孙伯安》诗云:

“伯安入小学,颖悟非凡貌,属句有夙性,说字惊老师。

”于是看,宋元时期小学教师被称为“老师”有案可稽。

清代称主考官也为“老师”,而一般学堂里的先生则称为“教师”或“教习”。

可见,“教师”一说是比较晚的事了。

如今体会,“教师”的含义比之“老师”一说,具有资历和学识程度上较低一些的差别。

辛亥革命后,教师与其他官员一样依法令任命,故又称“教师”为“教员”。

2、CCITT给媒体做的分类?

1)感觉媒体:

指能直接作用于人的感官,使人能直接产生感觉的一类媒体2)表示媒体:

为了加工、处理和传输感觉媒体而人为地研究、构造出来的一种媒体。

其目的是将感觉媒体从一个地方向另一个地方传送,以便于加工和处理。

表示媒体包括各种编码方式。

3)显示媒体:

指感觉媒体与用于通信的电信号之间转换用的一类媒体。

包括输入显示媒体和输出显示媒体。

4)存储媒体:

用来存放表示媒体,以方便计算机处理加工和调用,主要指与计算机想着的外部存储设备。

5)传输媒体:

用来将媒体从一个地方传送到另一个地方的物理载体,是通信的信息载体。

“教书先生”恐怕是市井百姓最为熟悉的一种称呼,从最初的门馆、私塾到晚清的学堂,“教书先生”那一行当怎么说也算是让国人景仰甚或敬畏的一种社会职业。

只是更早的“先生”概念并非源于教书,最初出现的“先生”一词也并非有传授知识那般的含义。

《孟子》中的“先生何为出此言也?

”;《论语》中的“有酒食,先生馔”;《国策》中的“先生坐,何至于此?

”等等,均指“先生”为父兄或有学问、有德行的长辈。

其实《国策》中本身就有“先生长者,有德之称”的说法。

可见“先生”之原意非真正的“教师”之意,倒是与当今“先生”的称呼更接近。

看来,“先生”之本源含义在于礼貌和尊称,并非具学问者的专称。

称“老师”为“先生”的记载,首见于《礼记?

曲礼》,有“从于先生,不越礼而与人言”,其中之“先生”意为“年长、资深之传授知识者”,与教师、老师之意基本一致。

3、多媒体定义:

所谓多媒体,是指信息表示媒体的多样化,常见的多媒体有文字、图形、图像、声音、音乐、视频、动画等多种形式。

4、多媒体技术:

就是利用计算机技术把文本、声音、视频、动画、图形和图像等多种媒体进行综合处理,使多种信息之间建立逻辑连接,集成为一个完整的系统。

5、多媒体的特征?

1)多维化:

信息媒体的多样化。

2)集成性:

不仅指多媒体设备集成,也包含多媒体信息集成或表现集成。

3)交互性:

是使人们获取和使信息变被动为主动的最为重要的特征。

4)实时性:

主要指类似声音和视频这样的媒体,与时间密切相关,要求多媒体技术必须支持实时处理。

6、多媒体计算机技术及发展?

1)MPC1:

1990年2)MPC2:

1993年3)MPC3:

1995年

7、多媒体系统的关键技术可以分为如下几个方面:

a.多媒体数据的处理:

软\硬件平台,数据压缩技术,多媒体信息转换及融合理论b.多媒体数据的存储:

存储设备,数据存储与管理c.多媒体数据的传输:

多媒体计算机网络,服务质量控制,分布式多媒体系统d.多媒体输入\输出技术:

输入输出设备,人机界面,虚拟现实技术

8、多媒体技术主要内容:

1)多媒体软硬件平台:

是实现多媒体系统的物质基础

2)专用芯片:

归纳为两种类型:

固定功能的芯片;可编程处理器。

DSP处理器是一种非常适合进行数字信号处理的微处理器,特别适于高密度、重复运算及大数据流量的信号处理。

3)数据压缩及编码技术

4)多媒体同步:

集成模式:

制约式、交互式和协作式。

制约式是指一种媒体的状态转移或激活影响到另一种媒体;协作式指两种以上的媒体信息同时存在,这两种模式要求按事件发生的顺序同步,属于基本同步型;交互式指某媒体上含有的信息变换成另一种媒体。

5)多媒体网络与分布式处理技术

6)信息的组织与管理:

是信息系统的核心问题之一。

处理大批非规则数据主要有两个途径:

一是扩展现有的关系数据库,二是建立面向对象的数据库系统,以存储和检索特定信息。

超媒体:

称之为天然的多媒体信息管理方法,它一般也采用面向对象的信息组织与管理形式。

7)多媒体数据存储

8)虚拟现实技术:

虚拟现实就是采用计算机技术生成一个逼真的视觉、听觉、触觉及嗅觉的感觉世界,用户可以用人的自然技能对这个生成的虚拟实体进行交互考察。

9)人机界面设计:

其目的是通过对用户需求的解释达到一种人机之间较好的通信能力。

10)高速多媒体通信技术:

是指为满足新一代信息系统中实时多媒体信息传输的需要,网络的宽带可能要在1000Gbps以上,而且能支持服务质量控制(Qos),以适应不同媒体对传输质量的要求。

9、多媒体技术的应用

1)音频\视频流点播

2)电子出版物:

压缩只读光盘(CD-ROM)可广泛用于游戏、教育、资料存储等方面,是一种优良的信息源,也是目前最重要的电子出版物。

一张CD光盘的容量大约为650MB。

3)医疗卫生;4)游戏与娱乐;5)计算机视频会议;6)多媒体展示和信息查询系统;7)MIS与OA(管理信息系统和办公自动化系统);8)传媒、广告

9)教学管理系统:

包括信息发布平台、多媒体教学系统、多媒体考试系统、多媒体交流系统、信息管理系统。

10)移动卫星:

移动卫星多媒体应用系统在系统设计、数字闭环控制、智能识别、跟踪及快速动态捕获等方便的关键技术在卫星信息技术领域都是代表了最先进的技术。

10、多媒体技术的发展趋势:

智能化和三维化

第二章多媒体计算机系统的组成

1、多媒体接口卡:

是根据多媒体系统获取、编辑音频或视频的而需要而插接在计算机上,以解决各种媒体数据的输入、输出的问题。

常用的接口卡有声卡、显卡、视频压缩卡、视频捕捉卡、视频播放卡、光盘接口卡等。

多媒体外部设备按功能分为:

视频音频输入设备,视频音频输出设备,人机交互设备,存储设备。

2、输入设备:

除了基本的键盘、鼠标等以外,还包括手写板、磁卡设备、IC卡设备、条码设备、图像扫描仪、数字化仪、触摸屏、视频卡和视频捕捉卡等。

3、手写板:

电阻压力板、电磁感应板和电容触控板。

电阻压力板:

其工作原理是当笔或手指对上层电阻加压使之变形并与下层电阻接触时,下层电阻薄膜就感应出笔或手指的位置。

电磁感应板:

通过手写板下方的布线电路通电后,在一定空间范围内形成电磁场,来感应带有线圈的笔尖的位置进行工作。

电容触控板:

工作原理是通过人体的电容来感知手指的位置,其表现出了更加良好的性能:

由于轻触即能感应,用手纸和笔都能操作,使用方便。

4、图像扫描仪主要性能指标:

1)分辨率:

以每英寸上扫描象素点数(DPI)表示,通常在300DPI到1200DPI之间。

2)灰度:

图像亮度层次范围,灰度级数越多,图像层次越丰富。

目前可达250。

3)色彩度:

指彩色扫描仪支持的色彩范围,用象素的数据位表示,如24位支持16M色。

4)速度:

在指定的分辨率和图像尺寸下的扫描时间。

5)幅面:

支持的幅面大小,如A4、A3。

扫描仪按幅面大小份为台式和手持式,按图像类型分为灰度和彩色扫描仪。

5、触摸屏:

一般由两部分组成:

触摸屏控制卡和触摸检测装置。

按介质及工作原理,可分为电阻式、电容式、红外线式和声表面波式。

6、视频捕捉卡:

是把输入的模拟视频信号,通过内置芯片提供的捕捉功能转换成数字信号的设备,一般以内置PCI插卡为主。

将模拟视频信号转换为数字视频信号的转换卡。

选择时要考虑的问题:

1)是否有Overlay(叠加)功能,可直接把视频信号送到VGA显示器。

2)支持的输入视频标准、视频源和图形文件格式。

NTSC、PAL和S-Video。

3)与VGA卡的兼容性4)是否采用了硬件压缩5)“录像”质量:

图像尺寸、支持的颜色数、丢帧。

7、输出设备

1)CRT:

两大类:

图像显示、矢量方式图形。

种类:

存储型、随机扫描型、光栅扫描型。

2)液晶显示器(LCD):

一种低电压、低功耗器件。

其优点是平面型,结构简单,轻薄短小,相当省电且没有辐射,不伤人体,画面也不会闪烁,可以保护眼睛。

按技术性质分单纯矩阵驱动和主动矩阵驱动,TFT是主要发展方向。

3)等离子体显示器(PDP):

基本原理是显示屏上排列有上万个密封的小低压气体室,电流激发气体,使其发出肉眼看不见的紫外光,这种紫外光碰击后面玻璃上的红、绿、蓝三色荧光体,它们再发出在显示器上能看到的可见光。

4)背投电视:

分为CRT、LCD、DLP(数字光处理器)、LCOS(反射液晶)。

CRT背投具有技术成熟、亮度高、连续使用时间长、价格较低的优点。

LCD背投利用成熟的液晶投影技术,其色彩还原性好,色彩饱和度优于CRT背投,且无辐射、能耗低。

DLP背投亮度高,清晰度高,画面均匀,色彩锐利,连续使用时间长,功能完备。

LCOS是一种全新的数码成像技术,LCOS背投具有高亮度、高解析度、低功耗的优点。

5)显示卡:

主要作用是对图形函数进行加速。

影响显存性能的参数包括:

①显存的容量:

所需显存=图形分辨率*色彩精度/8;②显存的数据位数与宽带:

运行频率*数据带宽/8;③显存的速度:

显存的速度一般以ns为单位。

常见显存有7ns、6ns、5.5ns、5ns、4ns和2.5ns其对应的额定工作频率分别是143、166、183、200、250和400MHz。

6)打印机:

是一种最传统的标准计算机输出设备。

主要分为击打式(点阵式具有结构简单、体积小、重量轻、价格低和维护方便、可靠性好等优点))和非击打式(激光最大的特点是打印功能极强,输出质量高,速度快,噪音低;喷墨其打印的精度大大高于点阵式,其弱点是墨水质量要求高,消耗品的费用高)

7、通信设备

1)调制解调器:

(Modem)的作用是利用模拟信号传输线路传输数字信号。

2)网卡,局域网最基本的部件之一,又称网络卡或网络接口卡,简称NIC。

主要工作是整理计算机上发往网线上的数据,并将数据分解为适当大小的数据包之后向网络上发送出去,还负责网线上传过来的数据。

3)传真/通讯卡

8、存储设备

1)软盘、硬盘、光盘

2)NAS:

网络附加存储,以数据为中心,将存储设备与服务器彻底分离,集中管理数据。

3)SAN:

存储局域网,以数据存储为中心,采用伸缩的网络拓扑结构,通过具有高传输速率的光通道的直接连接方式,提供SAN内部任意结点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储区域网内。

9、USB设备

通用串行总线,主要特点:

即插即用、可热插拔,并具有自动配置能力。

1.1版12Mb/s,2.0版480Mb/s。

USB采用四线电缆,其中两根是用来传递数据的串行通道,另两根为下游设备提供电源。

USB支持4种基本的数据传输模式:

控制传输、等时传输、中断传输及数据块传输。

10、多媒体与CPU芯片

MMX技术:

重要特色是使用了单指令多数据流技术(SIMD),即一条指令并行处理多个数据,从而成倍地提高了机器计算速度。

第三章数字图像处理技术

1、彩色空间及变换

图像处理技术中最基本的问题是对颜色的处理。

颜色模式主要有:

1)RGB:

红、绿、蓝2)Lab:

是由RGB转为HSB或CMYK模式的桥梁,发光率、颜色A、B。

3)HSB:

色泽、饱和度、亮度4)YUV:

电视系统常用模式,亮度Y和色差U、V组成。

Y与U、V独立变化,可用于压缩。

5)CMYK:

彩色印刷使用。

2、冗余数据压缩

对多媒体数据进行压缩的前提是数据存在大量的冗余,压缩的目的就是尽可能消除这些冗余,分为:

1)统计冗余:

大量统计特征上的重复

2)信息熵冗余:

信息熵定义为一组数据所表示的信息量,等于各记录码元的二进制位数(即编码长度)与该码元出现的概率乘积之和。

3)结构冗余:

图像纹理

4)知识冗余:

5)视觉冗余:

人的视觉对某些细节不敏感

3、压缩算法评价

1)压缩比2)算法的复杂性和运算速度3)失真度:

无损编码、有损编码

4、行程长度编码(重点掌握并应用)

RLE,又称游程编码,就是把一系列的重复值用一个单独的值加上一个计数值来取代。

5、哈夫曼编码(重点掌握并应用)

基本思路:

出现频率越高的值其对应的编码长度越短,反之出现频率越低的值,其对应的编码长度越长。

步骤如下:

1)统计信源符号出现的概率2)将信源符号按概率递减顺序排列3)将两个最小的概率值加起来,作为一个新组合符号的概率。

4)重复2、3步,直到概率和达到1为止5)在每次合并信源时,将合并的信源分别标记为“1”和“0”(例如,概率小的标记为“1”,概率大的标记为“0”)6)寻找从每一信源符号到概率为1的路径,记录下路径上的“1”和“0”7)对每一版本号写出“1”和“0”序列

缺点:

1)必须精确统计出每个值出现的频率,通常需要两遍操作,速度慢。

2)译码过程比较复杂,对于位的增删比较敏感。

6、预测编码

可分为线性预测和非线性预测编码。

前者常被称为差分脉冲编码调制,即DPCM。

其基本原理是基于图像中相邻象素之间的相关性,每个象素可通过与之相关的几个象素来进行预测。

7、变换编码

就是将时域信号变换到频域信号上进行处理的方法。

常用有K-L和DCT(离散余弦变换)。

8、模型法编码

预测编码、矢量量化编码以及变换编码都属于波形编码。

其理论基础是信号理论和信息论,其出发点是将图像信号看作不规则的统计信息,从象素之间的相关性这一图像信号统计模型出发设计编码器。

而模型编码则是利用计算机视觉和计算机图形学的知识对图像信号的分析与合成。

模型编码的关键是对特定的图像建立模型,并根据这个模型确定图像中景物的特征参数,如运动参数,形状参数等。

解码时则根据参数和已知模型用图像合成技术重建图像。

9、混合编码

以两种或两种以上方法对图像进行编码称为混合编码。

10、图的分类:

1)矢量图:

用数学方法描述的一系列点、线、弧和其它几何形状。

2)位映像图:

也称光栅图,由像点组成。

11、BMP格式

位图文件格式,三部分组成:

位图文件头数据结构、位图信息数据结构和位图阵列。

位图阵列数据支持RLE4和RLE8压缩格式。

12、GIF格式

CompuServe公司开发的格式,称为图形交换格式。

以数据块为单位来存储图像的相关信息,使用LZW压缩算法来存储,支持透明属性,可以在一个文件中存放多幅图像。

13、TIF格式

TIFF格式,与硬件无关,可以用几种不同的压缩方法压缩。

文件组成:

文件头、参数指针表、参数数据表。

14、PNG格式

便携网络图形格式,使用LZ77派生的无损数据压缩算法,目的是替换GIF和TIFF。

15、PNGvsGIFvsJPEG(掌握)

1)PNG兼有GIF和JPEG的色彩模式,GIF用256索引色,JPEG用真彩色,PNG都支持。

2)PNG能把图像压缩到极限,但又保留图像品质。

文字线条类图形用类GIF方式,相片类用类JPEG方式处理,但采用非破坏性压缩。

3)PNG更优化的传输显示。

支持类GIF的交错模式。

4)GIF只支持0/1透明,JPEG不支持透明,PNG支持“a”频段0-255的透明信息。

5)GIF在不同系统上显示的画面可能不同,PNG则可完全相同。

6)GIF支持一个文件多图像,PNG不支持。

7)PNG用无损压缩,虽然压缩比高于JPEG,但是JPEG可以牺牲品质换尺寸。

8)PNG不支持CMYK模式。

(后三个是PNG的缺点)

16、JPEG格式

ISO和CCITT静止图像编码联合专家组。

用于连续色调的静止图像压缩编码的通用算法的国际标准。

两种工作方式:

顺序方式和渐进方式。

顺序方式中,图像被分割成行成列的四方小块,编码时由左而右,由上而下地逐行逐列对每个小块进行运算,直到所有小块都被编码为止。

渐进方式下,先以一种低于最终质量要求的标准进行编码,完成后再以较上次高一级的质量要求再进行一次编译,但仅传送为改善质量所需增加的那部分信息。

重复若干次直至达到所需的最终质量要求。

三种级别编码算法:

基本系统、扩展系统、无失真系统。

基本系统编码以离散余弦变换为核心,采用顺序工作方式,适用于一般精度(8bit)的图像,有良好的压缩效果,压缩比可调。

将基本系统在若干方面增强并减少一些限制条件后就称为扩展系统,支持(4bit-12bit),可采用渐进方式,可选哈夫曼或算法码对离散余弦变换产生的统计事件进行压缩编码。

无失真系统采用二维DPCM技术,实现无失真压缩,压缩比较低。

17、JPEG基本系统编码过程(重点掌握)

1)二维DCT正变换,减少图像数据的相关性

2)系数量化,根据压缩精度将变换系数用较少的比特数表示

3)编码模型与统计事件,压缩系数矩阵中的零数据,从量化后的系数矩阵生成供熵编码的统计事件。

直流分量使用DPCM编码。

4)熵编码:

基本系统中用哈夫曼编码,扩展系统中可用算术编码。

5)数据结构,增加一些附加信息

18、JPEG渐进方式

1)谱选择法,对DCT变换后的系数,先低频后高频按级编码。

2)逐次逼近,第一级只送系数的近似值(如舍弃系数的几个低比特位),后面各级补上。

3)阶梯方式,先用小尺寸编码,再编码原图像与它的差值。

19、JPEG的压缩效果

0.15b/p,可识别,0.25有用,0.75极佳,1.5时基本与原图无区别。

20、JPEG2000

核心算法改用离散小波变换算法的多解析编码方式。

优势:

1)高压缩率,比JPEG高10%-30%

2)无损压缩,支持预测法无损压缩

3)渐进传输

4)感兴趣区域压缩,为感兴趣区域指定不同的压缩质量。

21、MPEG系统

运动图像专家组,下分三个小组:

MPEG-Video(视频组)负责视频压缩、MPEG-Audio(音频组)负责音频压缩、MPEG-System(系统组)解决多信道压缩视频音频和同步及合成问题。

22、MPEG-1标准

运动图像和伴随声音的编码-用于速率约在1.5Mb/s以下的数字存储媒体。

采用CIF视频格式(352x288),帧速率为25或30fps,码率为1.5Mb/s(其中视频约1.2Mb/s,音频约0.3Mb/s)。

1992年正式通过,由5部分组成:

1)MPEG-1System,规定电视图像数据、声音数据及其它相关数据的同步。

2)MPEG-1Video,规定视频数据的编码和解码。

3)MPEG-1Audio,规定音频数据的编码和解码。

4)MPEG-1Conformancetesting,规定如何测试比特数据流和解码器是否满足前3部分中所规定的要求。

5)MPEG-1Softwaresimulation

23、MPEG-1视频压缩算法(重点掌握)

系统参数:

图像宽度、高度、象素长宽比、帧速率、位速率、缓冲区尺寸等。

算法的两个基础:

基于16X16块的运动补偿缩减时间冗余,基于变换域(DCT)的缩减空间冗余技术。

1)缩减时间冗余度:

3种画面:

内帧(I)、预测帧(P)和内插帧(B)。

内帧经过中度压缩,可作为随机访问点,预测帧以参考帧(I或P)为基础进行编码,它又是后面预测帧的参考帧。

内插帧压缩比最高,它需要前后两参考帧,但它本身不能作为参考帧使用。

MPEG选择16X16宏块作为运动补偿单元。

每8个画面有一个内帧:

IBBBPBBBI。

2)缩减空间冗余度:

类似于JPEG,三个阶段:

第一阶段基于DCT的正交变换,计算变换系数,第二阶段对变换系数进行量化,将数据按Z字形扫描顺序重新组合,最后对变换系数按行程编码进行熵编码,以达到进一步压缩的目的。

24、MPEG-2标准

适于高于2Mb/s的视频压缩,基本算法也是运动补偿的预测和带有DCT的帧间内变长编码,与MPEG-1的主要区别:

1)能够有效地支持电视的隔行扫描格式。

2)支持可分级的可调视频编码,适用于需要同时提供多种质量的视频业务的情况。

系统分为9组,除了MPEG-1的五组,还有:

6)MPEG-2数字存储媒体命令和控制扩展协议

7)MPEG-2先进声音编码(AAC),多声道声音编码算法标准。

8)MPEG-2系统解码器实时接口扩展标准

9)MPEG-2DSM-CC一致性扩展测试

GOP-15:

IBBPBBPBBPBBPBBI,允许GOP-1到GOP-15甚至更多,支持变比特率(VBR)编码方案。

25、H.261标准

CCITT制定的国际上第一个视频压缩标准,主要用于电视电话和会议电视,1990年批准。

又称为Px64Kb/s标准,P=1,2时支持QCIF(172x144)。

P=6时支持CIF(352x288)。

核心是运算估值预测和DCT编码。

26、H.263标准

关于低于64Kb/s比特率的窄带通道视频编码建议,其目的是能在现有的电话网上传输活动图像。

提供两种编码模式:

帧内编码、帧间编码。

QCIF每帧分为若干宏块,每个宏块由4个8x8的亮度块、1个8x8的Cb块和1个8x8的Cr块组成,由若干个宏块行组成的块组称为1个GOB,行的数量取决于图像帧的分辨率。

QCIF格式中,1个GOB由一行(11个)宏块组成,每帧图像由9个GOB组成。

二、学习心得

本章内容很重要,估计会有20分以上的题目,特别是几种简单压缩算法可能会出应用题。

JPEG、MPEG的算法和概念也可能出名词解释和简答题。

第四章音频信号和声卡

1、声音分类:

波形声音、语音、音乐

2、声音的3要素:

1)音调:

与声音的频率有关。

人耳对频率的感觉范围:

20Hz-18000Hz。

2)音强:

描述声音的强弱,体现在声音的幅度

3)音色:

由混入基音的泛音所决定

3、采样和量化

声音信号是连续的模拟信号,为了使计算机能够进行处理,必须首先对声音在时间轴和幅度两个方面进行离散化。

时间轴上的离散化称为采样,采样频率高于信号最高频率的2倍。

而对幅度的离散化称为量化,可采用线性量化和非线性量化两种方式。

对声音波形的采样,就是按采样的频率间隔、不断地获取幅度的量值,使离散的声音波形转变为离散的数字量。

4、常见音频文件格式

wav、au、aiff、snd、rm、mp3等。

wav称为波形文件格式,是一种资源交换文件格式(RIFF)。

5、声音质量

客观质量主要用信噪比SNR。

主观质量常用的有平均意见得分(MOS)。

数据语音通信中,分为:

广播质量、网络质量、通信质量和合成质量。

6、心理声学模型

一个基本概念就是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此可以把这部分信号去掉。

听觉阈值的大小随声音频率的改变而改变,各人也不同。

另一个概念是听觉掩饰特性,意思是听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。

7、脉冲编码调制(PCM)

概念上最简单、理论上最完善、最早研制成功、使用最为广泛的编码系统,但也是数据量最大的编码系统。

8、非线性量化

对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数。

声音数据还原时,采用相同的规则

9、增量调制(DM)

是一种预测编码技术。

DM是PCM编码的一种变形。

PCM是对每个采样信号的整个幅度进行量化编码,因此它具有对任意波形进行编码的能力。

DM坚实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”这两种可能的取值之一。

有两个缺点:

1)斜率过载:

增量调制器的输出不能保持跟踪输入信号的快速变化的现象。

2)粒状噪声:

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 自然科学 > 物理

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2