广告传媒媒体及媒体技术.docx
《广告传媒媒体及媒体技术.docx》由会员分享,可在线阅读,更多相关《广告传媒媒体及媒体技术.docx(31页珍藏版)》请在冰点文库上搜索。
广告传媒媒体及媒体技术
第二章媒体及媒体技术
2.1媒体的种类和特点
2.1.1常见的媒体元素
♦文本
–文本是计算机文字处理程序的基础
–文本数据可以在文本编辑软件里制作
–文本文件分类
•非格式化文本
•格式化文本文件文件
–带有各种文本排版信息等格式信息的文本文件
–段落格式、字体格式、文章的编号、分栏、边框
–文字的变化:
格式(sty1e)、字的定位(align)、字体(font)、字的大小(size)
2.1.1常见的媒体元素
♦图形
–图形的概念
一般指用计算机绘制的画面,如直线、圆、圆弧、矩形、任意曲线和图表等。
图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合,在图形文件中只记录生成图的算法和图上的某些特征点,也称矢量图。
–line(x1,y1,x2,y2,color)
–circle(x,y,r,color)
2.1.1常见的媒体元素
♦图形
–图形的特征
•图形是对图象进行抽象的结果(人工或自动);
•图形的矢量化使得有可能对图中的各个部分分别进行控制(放大、缩小、旋转、变形、扭曲、移位等)
•图形的产生需要计算时间
2.1.1常见的媒体元素
♦图像
–图像的概念
•图像是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意画面。
•静止的图像是一个矩阵,由一些排成行列的点组成,这些点称之为像素点(pixel),这种图像称为位图(bitmap)。
2.1.1常见的媒体元素
♦图像
–图像的主要技术参数
•分辨率
–屏幕分辨率
计算机显示器屏幕显示图像的最大显示区
–图像分辨率
数字化图像的大小
–像素分辨率
像素的宽高比,一般为1∶1
2.1.1常见的媒体元素
♦图像
–图像的主要技术参数
•图像灰度
–每个图像的最大颜色数
–2位:
黑白2色;
–4位:
16色;
–8位:
256色;
–24位:
真彩色
•图像文件大小
–(高×宽×灰度位数)/8字节
2.1.1常见的媒体元素
♦图像
–图形与图象的关系
•图形是矢量概念,图元;图象是位图概念,象素;
•图形显示图元顺序;图象显示象素顺序;
•图形变换无失真;图象变换有失真;
•图形以图元为单位修改属性、编辑;图象只能对象素或图块处理;
•图形是对图象的抽象,但在屏幕上两者无异
2.1.1常见的媒体元素
♦视频
–视频的概念
视频源于电视技术,它由连续的画面组成。
这些画面以一定的速率连续地投射在屏幕上,使观察者具有图像连续运动的感觉。
2.1.1常见的媒体元素
♦视频
–视频的制式
•PAL制(625/50)
每秒25帧,水平扫描线为625条,水平分辨率240~400个像素,隔行扫描。
62年诞生于德国,应用于中国、新加坡、欧洲地区等(Pal-B、D、G、H、I、N、NC)。
•NTSC制(525/60)
每秒30帧,水平扫描线为525条,水平分辨率240~400个像素,隔行扫描。
53年诞生于美国,应用于美国、日本、台湾等(NTSC-M、NC、Japan等)。
2.1.1常见的媒体元素
♦视频
–视频的制式
•SECAM制(625/50)
每秒25帧,水平扫描线为525条、水平分辨率625。
由法国人提出,应用于俄罗斯、法国、非洲地区等。
–视频的数字化
指在一段时间内以一定的速度对视频信号进行捕获并加以采样后形成数字化数据的处理过程。
2.1.1常见的媒体元素
♦视频
–视频的技术参数
•颜色空间
–R、G、B(红、绿、蓝)
–Y、U、V(Y为亮度,U、V为色差)
–H、S、I(色调、饱和度、强度)
–可以通过坐标变换而相互转换
•帧速
–每秒钟显示的帧数目,计量单位为帧率(fps)
–视频根据制式的不同:
30帧/秒(NTSC)、25帧/秒(PAL)
2.1.1常见的媒体元素
♦视频
–视频的技术参数
•数据量
–帧速×每幅图像的数据量(不计压缩)
•图像质量
–与数据源质量有关(>:
表示“好于”)
RGB视频>YUV视频>Y/C视频(S视频)>复合视频
–与视频数据压缩的倍数有关
2.1.1常见的媒体元素
♦音频
–分类
•波形声音
–包含了所有的声音形式,它可以把任何声音都进行采样量化,并恰当地恢复出来。
2.1.1常见的媒体元素
♦音频
–分类
•语音
–人的说话声虽是一种特殊的媒体,但也是一种波形,所以和波形声音的文件格式相同。
2.1.1常见的媒体元素
♦音频
–数字声音波形质量的主要技术参数
•采样频率
–等于波形被等分的份数,份数越多,质量越好
•11.025KHZ、22.05KHZ、44.1KHZ
•采样精度
–每次采样信息量
•8位、16位
•通道数
–声音产生的波形数
•单声道、立体声道、5.1声道
2.1.1常见的媒体元素
♦动画
–动画的概念
运动的图画,实质是一幅幅静态图像的连续播放。
动画的连续播放既指时间上的连续,也指图像内容上的连续,即播放的相邻两幅图像之间内容相差不大。
–计算机设计动画方法
•造型动画
•帧动画
2.1.1常见的媒体元素
♦动画
–帧动画
2.1.1常见的媒体元素
♦动画
–帧动画
2.1.2媒体的种类
♦视觉
2.1.2媒体与多媒体
♦听觉
♦触觉
♦其他感觉
2.1.3媒体的性质和特点
♦各种媒体具有不同特点和性质
–媒体是有格式的
–不同媒体表达信息的特点和程度各不相同
–媒体之间可以相互转换
–媒体之间的关系也具有丰富的信息
♦媒体具有空间性质
–表现空间
–媒体按相互的空间关系进行组织
–视觉空间、听觉空间和触觉空间这3者既相互独立又需要相互结合
2.1.3媒体的性质和特点
♦媒体的时间性质
–表现需要时间
–媒体在时间坐标轴上的相互关系
♦媒体的语义
–媒体的语义是有层次的
–抽象的程度不同,语义的重点也就不同
♦媒体结合的影响
–媒体结合是多层次的
–媒体结合有利于信息接受和理解
♦隐喻
–交互的概念模型,也称心智模型
2.2听觉媒体技术
2.2.1声音心理学
1.声音的量纲
声音的振动是一种正弦波,声音的变化必须确定三件事:
频率(变化的速度)、幅度(产生的压力)、相位(何时开始)。
另外一方面,人们可以感觉到声音的强弱,可以感觉到歌唱家音调的高低。
因此,声音的量纲分为声音的物理量纲和心理量纲。
2.2.1声音心理学
物理量纲可以用精确的值来描述,但对某一具体声音得来的心理印象却不容易说明白,因为心理印象要由被测者的经验而定。
声音的心理属性和物理属性不可等同,首先,这些关系不是线性的;其次这些关系不是孤立的;第三这些关系不是不变的。
2.2.1声音心理学
两者之间确有关系:
例如声音的响度取决于强度和频率两个因素,如果频率不变,强声显得比弱声要响些。
但如果强度不变,过高频率的声音和过低频率的声音似乎比中频的声音听起来都要弱一些。
由此可见,响度依赖于频率,原因是人耳能反应的频率范围是有上限和下限的。
2.2.1声音的量纲
2.2.1声音心理学
2.听觉特性
✹等响曲线
由于响度与频率和强度有关,所以在不同频率上的强度是不同的。
先设一个音为标准音,给予固定的频率、强度和持续时间,例如1000Hz、40分贝、持续0.5秒;再给一个音也持续0.5秒,但频率不同,通过调整使其响度听起来一样,得到的这样一组曲线称之为等响曲线。
等响曲线描述的是响度与频率和强度的关系。
从声音心理学考虑,对同一响度的声音在频率上和强度上可以有很大的差别,这对声音表现有重要意义。
2.2.1声音心理学
✹掩蔽(masking)
声音的响度不仅取决于自身的强度和频率,而且也依赖于同时出现的其它声音。
各种声音可以互相掩蔽,也就是说一种声音的出现可能使得另一种声音难于听清。
由于声音的掩蔽效果,可以欺骗人的听觉。
例如,本来是多种频率的声音的复合,但听众以为是另一种声音。
所以,声音的掩蔽特性常常用于声音的压缩。
2.2.1声音心理学
✹临界频带
在频率的某一临界区里,各种声音是相互作用的,合成声音的响度由这些频率共同决定。
如果超出临界区,声音的响度不再相互作用,声音的响度随频率的改变而改变。
这个临界区就是临界频带,其宽度视其中心频率而定。
对于临界频带的确定,使得对声音响度的处理能够有的放矢。
2.2.1声音心理学
✹相位
从声音的波形来看,声音的起点和方向也要反映声音的特性,这就是声音的相位。
当两个声音相同相位完全相反时,它们将相互抵消;当两个声音相同而且相位也相同时,声音就会得到加强。
相位的确定对于多声道声音系统的设计非常重要,其可以应用在回声的消除、会议系统的声音设计上。
2.2.1声音心理学
✹自然声音的时变现象
声音的音调分成三个区域:
起始区、稳定状态区、延迟区。
研究表明,音调的频谱分量随时间改变。
在稳定状态区,频谱保持固定。
在起始区,振幅频谱随时间变化。
因此自然声音的起始部分是非常难识别的。
例如刚听了一小节音调后要识别乐器,专家也会觉得较难。
时变现象用于数字系统中,说明声音中的某些错误是不太容易发现的,但如果出现停顿就很容易引起人的注意。
2.2.1声音心理学
✹听觉空间
人耳可听到来自各个方向的声音,并用不同的因素来判定声源的位置。
声源的位置不论对于增进人们的感受还是增进对声音的理解,都是非常重要的。
通过声音的精确再现,就可以构造出听觉空间。
方位的线索是各种声音到达两耳的精确时间和强度。
2.2.1声音心理学
✹听觉的频谱特性
声音是时间函数,通过傅里叶变换可做出其频谱图。
人耳对频谱成分的波峰和波谷是非常敏感的。
在语言中,元音很少有频谱变速变化的区域。
基频改变,人耳是很敏感的。
例如:
快进的录像,音调会发生变化。
音色非常复杂,目前尚在研究中。
音色的处理将使我们能识别音源,音色也代表和声音有关的主观质量。
2.2.1声音心理学
✹声音的心理模拟
通过人工真实的方法,可以对视觉空间的景物进行再造或虚构,同样也可以对听觉空间的声音进行心理的模拟,这就是所谓的可听化(audiolization)。
用声音可以表达出一些声音的效果。
2.2.2音频的数字化和符号化
从人与计算机交互的角度看,音频信号的处理包括下述3点:
v人与计算机通信,也就是计算机接收音频信号。
包括音频获取、语音的识别和理解。
v计算机与人通信,也就是计算机输出音频。
包括音乐合成、语音合成、声音的定位以及音频视频的同步。
v人-计算机-人通信。
人通过网络与异地的人进行语音通信,相关的音频处理有语音采集、音频的编码和解码、音频的存储、音频的传输、基于内容的检索等。
2.2.2音频的数字化和符号化
1.音频的数字化与再现
在计算机中,所有的信息都以数字来表示。
声音信号也是由一系列的数字来表示的,称为数字音频。
数字音频的特点就是保真度好,动态范围大。
数字声音是一个数据序列。
它是由外界声音经过采样、量化和编码后得到的。
2.2.2音频的数字化和符号化
对声音进行采样用奈奎斯特采样定理来决定采样的频率。
根据该定理,只要采样频率高于信号中最高频率的两倍,就可以从采样中完全恢复原始信号的波形。
因为人耳所能听到的频率范围为20Hz到20KHz,所以实际的采样过程中,为了达到好的效果,就采用44.1KHz作为高质量声音的采样频率。
如果达不到这么高的频率,声音恢复的效果就会差一些,例如电话声音的质量等。
一般来说,声音恢复和采样频率、信道带宽都有关。
2.2.2音频的数字化和符号化
2.2.2音频的数字化和符号化
与数字音频相关的重要特性:
✹采样频率
采样频率与声音的质量关系最为紧密。
采样频率越高,声音质量越接近原始声音,所需的存储量便越多。
标准的采样频率有三个:
44.1KHz,22.05kHz,和11.025kHz。
✹采样位数
存放一个采样点所需的比特数。
一般的采样位数为8位或16位,即把声音采集为256等份或65536等分。
2.2.2音频的数字化和符号化
✹声道数
有单声道、双声道和多声道。
如多种语言音频混存时,需要多声道
✹数据量
2.2.2音频的数字化和符号化
2.声音的符号化
波形声音可以把音乐、语音都进行数据化并且表示出来,但是并没有把它看成音乐和语音。
对于声音的符号化(也可以称为抽象化)表示包括两种类型:
一种是音乐,一种是语音。
2.2.2音频的数字化和符号化
(1)音乐的符号化-MIDI
MIDI(MusicInstrumentDigitalInterface)是指乐器数字接口的国际标准。
MIDI消息,是指乐谱的数字描述。
任何电子乐器,只要有处理MIDI消息的微处理器和合适的硬件接口,就构成了一个MIDI设备。
当一组MIDI消息通过音乐合成芯片处理时,合成器能解释这些符号并且产生音乐。
MIDI的关键是作为媒体能够记录这些音乐的符号,相应的设备能够产生和解释这些符号。
它给出了一种得到音乐声音的方法。
2.2.2音频的数字化和符号化
MIDI的特点:
v与波形声音相比,MIDI不是声音数据而是指令,所以数据量要少得多。
30分钟的音乐,用MIDI文件记录只需200KB,用16位CD品质的未压缩WAV文件记录需317MB
vMIDI可以与其他波形声音配合使用,形成伴乐的效果。
而两个波形声音一般是不能同时使用的
v对MIDI的编辑也很灵活,用户可以自由地改变音调、音色等属性,直到自己想要的效果
vMIDI在音质上还不能与真正的乐器完全相似。
无法模拟自然界中其它非乐曲类声音
2.2.2音频的数字化和符号化
(2)语音的符号化
语音与文字是对应的。
波形声音可以记录表示语音,它是不是语音取决于听者对声音的理解。
对语音的符号化实际上就是对语音的识别,将语音转变为字符,反之也可以将文字合成语音。
语音指构成人类语音信号的各种声音。
在采集和存储上可以与波形声音一样,但由于语音是由一连串的音素组成。
“一句话”中包含许多音节以及上下文过渡过程的连接体等特殊的信息,并且语音本身与语言有关,所以要把它作为一个独立的媒体来看待。
2.2.3音频媒体的三维化处理
1.三维虚拟声空间
所谓三维虚拟声空间(ThreeDimensionalVirtualAcoustic,3DVA),是指用一定的声音设备人为地产生出来的具有空间位置信息的声音空间。
三维听觉的使用明显地依赖于用户对听觉空间中各种信息源的定位能力。
一般说来,三维虚拟声空间要达到以下的一些目标:
①在可听的范围内重现频率分辨度和动态范围;
②在三维空间中精确地呈现声音的位置信息;
③能表达多个静止和移动的声源;
④能和头部的动作具有一定的关联;
⑤能够支持一定程度的交互。
2.2.3音频媒体的三维化处理
2.3DVA的基本理论
人类感知声源位置的最基本的理论是双工理论,该理论基于两种因素:
两耳间声音的到达时间差ITD(InterauralTimeDifferences)和两耳间声音的强度差IID(InterauralIntensityDifferences)。
时间差是由于距离的原因造成的,当声音从正面传来时,距离相等,所以没有时间差;但若偏右3o,则到达右耳的时间就要比左耳约早30ms,而正是这30ms,使得我们辨别出了声源的位置。
强度差是由于信号衰减造成的,信号的衰减是因为距离产生的,在很多情况下是因为人的头部遮挡,使声音衰减,产生了强度的差别,使得靠近声源一侧的耳朵听到的声音强度要大于另一耳。
2.2.3音频媒体的三维化处理
3DVA理论较形象地说明:
人耳对声音定位的特性,通过大脑的综合作用后,对有差别的声音信号进行了相对于空间位置的定位。
人耳对声源方位的判定起决定作用的是耳廓。
当声波从声源传到听者的耳部时,声波会在耳廓发生不断的反射和折射,然后由内耳道传到耳鼓,使人产生音感。
这种反射、折射是依赖于频率的,通过不同频率的变化,使得人耳能够辨别声源的方位。
另外,当声音从声源传到人的内耳并形成听觉时,声音信号已经携带了两个很重要的信息,从而形成了空间真实感和环境真实感。
声源的本身信号特征、声源的空间三维位置、声源所处的环境这三个因素描述了声源的全部信息。
2.2.3音频媒体的三维化处理
3.HRTF方法
实现空间真实感的关键是建立起耳廓模型,这种方法被称为“双耳相关函数法”,也即HRTF(Head-RelatedTransferFunction,与头部有关的转移函数)。
从理论上利用HRTF产生真实空间声音的算法如下图所示。
2.2.3音频媒体的三维化处理
2.3视觉媒体技术
2.3.1视觉心理学
1.视觉的心理特征
视觉是人类最重要的感知能力,通过视觉可以感知到外部世界的形状、大小、色彩、明暗、机理和运动等多方面的信息。
同声音心理学相似,与视觉相对应的光学物理性质和心理知觉也是截然不同的。
虽然光的物理特性与心理知觉有关,但它们的关系并不是线性的。
对光的色调和亮度的感觉不仅和它的频率和强度有关,而且还和它出现的背景有关,和同时出现的周围光有关。
2.3.1视觉心理学
2.3.1视觉心理学
2.视觉特性
✹亮度
亮度是人眼对光强度的感受。
一个物体的亮度不仅跟目标的物理强度有关,而且与周围的背景有关。
假定整个照明增大了,目标和环境的光强就按照比例增大了,两者之间的物理对比就维持不变。
但当照明增强时,目标的亮度可能会亮一些,也可能保持不变,甚至看起来亮度减少一些。
这些都取决于中心和周围之间的相对强度,也就是对比度。
对图像的处理最重要的是亮度的差别。
2.3.1视觉心理学
与声音相似,视觉上也有等亮曲线,反映了视觉在亮度上与波长的关系。
在同一亮度感觉下,不同波长的光具有不同的光强。
视觉也有掩蔽现象,在很亮的高光周围时难以看清的,道理和声音是类似的。
2.3.1视觉心理学
✹视觉的时间特性
建立视觉图像需要时间,而一旦建立起来之后,即使把图像对象拿走,这种反应也要维持一段时间。
这是因为把光转变为神经电需要时间。
正因为视网膜图像时逐渐消退的,所以视觉暂留可以存在十分之几秒。
2.3.1视觉心理学
✹彩色
表示颜色需要考虑三种心理属性:
色调、亮度和饱和度。
色调就是通常意义下的彩色,它随波长的变化而变化,反映颜色的基本特性。
亮度是光作用于人眼所引起的明亮程度的感觉,与光强有关。
饱和度是代表为了产生所感知到的彩色在白光中必须混入的纯单色光的相对数量,或者说是颜色的深浅程度。
对同一色调的彩色光,饱和度越深颜色越鲜艳。
色调和饱和度统称为色度。
2.3.1视觉心理学
颜色是由三种原色光混合而成的。
可见光的波长从380纳米到780纳米。
不同波长呈现出不同颜色,可见光波长从长到短依次为红橙黄绿青蓝紫。
只有单一波长成分的光称为单色光,含有两种以上波长成分的光称为复合光,所有可见光按照一定比例混合就是白色光。
在辐射功率相同的条件下,不同波长的光不仅给人不同的颜色感觉,而且也给人不同的亮度感觉。
人眼一般感到红光最暗,蓝光次之,而黄绿光最亮。
研究表明,人眼对亮度信息敏感,而对颜色的敏感程度相对较弱。
2.3.1视觉心理学
在白色背景下,一般使用红黄蓝作为原色来混合其它颜色,这就是减基色合成彩色系统。
在黑色背景下,一般使用红绿蓝作为基色来混合其它颜色,这就是加基色合成彩色系统。
一般绘画时采用前者,电视中采用后者。
2.3.1视觉心理学
✹注视点和视野范围
人在观察视觉类媒体时,注视点喜欢集中在什么地方?
研究表明,视觉注视点主要集中在图像中黑白交界的部分,尤其是拐角处。
如果是闭合图形,注视点往往向内侧移动。
注视点容易集中在时隐时现运动变化的部分或者图像中特别不规则的地方。
人眼的视野开阔,左右视角约为180度,上下约为60度。
但视力好的部位仅限于2到3度,用于观察视觉媒体的细节。
而在周边,则主要识别特征。
但是需要注意,只有大的视野才有可能制造出临场感。
2.3.2模拟视频原理
✹光栅扫描原理
视频摄像机将图像转换为电信号,电信号是一维的,但图像是二维的,将二维图像转成为一维电信号是由光栅扫描的方法实现的。
快速的扫描线从顶部开始,一行一行地向下扫描,直至显示器的最底部,然后再返回顶部的起点,重新开始扫描。
这个过程产生的一个有序的图像信号集合,就组成了电视显示中的一幅图像,在此称为帧。
连续不断的图像序列就形成了动态视频图像。
2.3.2模拟视频原理
分辨率表现的是电视系统中重现场景细节的能力。
水平扫描线所能分辨出的点数称为水平分辨率。
一般来说,点数越小,线越细,分辨率就越高。
一个系统的水平分辨率为400线,指在对应于图像高度的水平距离内能交替显示200条白线和200条黑线。
相应地,一帧中垂直扫描的行数称为垂直分辨率。
垂直分辨率和每帧中的扫描线有关,扫描线越多,分辨率就越高。
广播电视系统垂直的行数一般是525线(北美和日本)和625线(欧洲和中国)。
2.3.2模拟视频原理
每一秒钟所扫描的帧数称为帧频,一般为25帧(PAL)或者30帧(NTSC)。
由于是隔行扫描,所以垂直频率分别是每秒50帧和60帧。
因此,人眼就不容易看到闪烁。
宽高比是扫描的一个重要的参数。
扫描行的长度与在图像垂直方向上的所有扫描行所跨过的距离之比,就成为宽高比。
目前电视中的宽高比为4:
3,新型电视的宽高比为16:
9,有些电影系统的宽高比为2:
1。
2.3.2模拟视频原理
✹彩色视频
加基系统是彩色视频系统的基础。
彩色电视采用红绿蓝(RGB)作为三基色进行配色,产生出R、G、B三个输出信号,RGB信号可以分别传输,但是要配上相应的同步信号。
在RGB系统中需要三根视频电缆互连,但是三个信号在同步关系方面相当复杂,所以大部分彩色电视不处理RGB,而是将RGB信号组合起来在一条电缆中传输,这就是复合信号。
2.3.2模拟视频原理
现有的几种不同的复合信号有NTSC、PAL和SECAM。
根据亮度/色度原理,任何彩色信号都可以分为亮度和色度。
色度只要使用色差就可以表示颜色信号,而不必使用RGB三个完整的信号。
将亮度和色度交错排列分别放到电缆上,就组成了复合信号。
电视系统的三种制式采用的信号形式也不完全一样。
NTSC的亮度信号称为Y,色度信号为I和Q,即YIQ方式。
PAL制式和SECAM制式的亮度和色度与之相对应为YUV,它们的差别在于编码方式的不同。
YUV、YIQ可以与RGB互换。
RGB、YUV和YIQ等都被称为彩色空间。
2.3.2模拟视频原理
✹视频设备
按照用途不同,视频设备可以分为广播、专业和消费三个级别。
广播级一般是大型的电视