● 音频基础 - 荔园在线 | 深圳大学学生论坛,荔园晨风BBS,深大在线网站

荔园之美，在春之萌芽，在夏之绽放，在秋之收获，在冬之沉淀

发信人: Name (冷雨无晴), 信区: Multimedia
标题: 音频基础
发信站: 荔园晨风BBS站 (Wed Aug 1 10:16:59 2001), 转信

　　多媒体技术中一种重要媒体来自音频，包括语音、音响和音乐。音频的作用是
直接通过讲话表达信息、制造某种效果和气氛、演奏音乐等。

　　音频技术发展比较成熟，其商品化产品(如数字音响)已投入使用。音频技术主
要包括数字化、语音处理、合成及识别等方面。音频数字化是目前比较成熟的技术
，数字音响和多媒体声音卡都是利用这项技术设计的。数字音响由于采用了数字化
音频，获得了非常理想的声响效果，迅速取代了传统模拟方式的音响。

　　音频数字化就是将模拟的(连续的)声音波形数字化(离散化)，以便利用数字计
算机进行处理的过程，主要包括采样和量化两个方面。相应地，数字化音频的质量
取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进采样
的次数。人耳听觉的频率上限在2OkHz左右，根据采样理论，为了保证声音不失真
，采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.
lkHz等。采样频率越高，声音失真越小、音频数据量越大。量化数据位数(也称量
化级)是每个采样点能够表示的数据范围，经常采用的有8位、12位和16位。例如，
8位量化级表示每个采样点可以表示256个(0-255)不同量化值，而16位量化级则可
表示65536个不同量化值。量化位数越高音质越好，数据量也越大。

　　反映音频数字化质量的另一个因素是通道(或声道)个数。记录声音时，如果每
次生成一个声波数据，称为单声道；每次生成二个声波数据，称为立体声(双声道
)，立体声更能反映人的听觉感受。

　　除了上述因素外，数字化音频的质量还受其它一些因素(如扬声器的质量等)的
影响。

　　综上所述，声音数字化的采样频率和量化级越高，结果越接近原始声音，但记
录数字声音所需存储空间也随之增加。可以用下面的公式估算声音数字化后每秒所
需的存储量(假定不经压缩):

　　　　存储量=(采样频率x量化位数)/8(字节数)

　　若采用双声道录音，存储量再增加一倍。例如，数字激光唱盘(CD－DA，红皮
书标准)的标准采样频率为44.lkHz，量化位数为16位立体声，可以几乎无失真地播
出频率高达22kHz的声音，这也是人类所能听到的最高频率声音。激光唱盘一分钟
音乐需要的存储量为:

　　　　　44.1X1000Xl6X2X60/8=10，584，000(字节)

　　数字音频数据的获取可以通过多种途径，如利用市场上己有的数字式音乐或音
响产品；自己录制；需高质量音频时可租用专门的录音设备进行录制。

　　原始音频数据一般需进行编辑加工才能使用。通过编辑可以实现各种声音混合
以及消除或降低声音中的畸变等。一般的音频编辑软件(如WaveEdit等)都具有设置
音量、渐强渐弱处理及多通道的混合等常用功能。

　　多媒体应用中音频数据的另一个重要来源是乐器数字接口(MIDI:Musical
Instrument Digital Interface)文件。国际电子乐器生产厂家达成有关协议，并
于 1988年正式提交给MIDI制造商协会，便成为数字音乐的一个国际标准。 MIDI标
准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间
传送数据的通信协议等规范。 MIDI标准使不同厂家生产的电子合成乐器可以互相
发送和接收音乐数据。随着MIDI标准的施行，计算机成为电子合成乐器间的控制环
节，市场上出现了大量可进行记录、存储、编辑和播放乐谱(音符表或音符序列)的
计算机软件。使用高级语言(如C，Basic或Fortran)编程，根据特定的作曲算法也
可生成ASCII乐谱，并翻译为在合成器上进行演奏的序列文件。

　　音频处理主要集中在音频压缩上，最新的语音压缩算法可将原始声音数据压缩
六~八倍以上。语音合成是指将普通正文合成为语音，国内外一些语音合成系统的
水平均已达到实用阶段，特别是汉语语音合成研究近年来有突飞猛进的发展。音频
技术中难度最大、也最具应用前景的当属语音识别；语音识别目前仍处于实验研究
阶段，虽有少量产品问世，但距实用尚有一定的距离。然而，其潜在的商业应用前
景使之一直成为音频技术研究关注的热点之一。

--
※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 192.168.55.222]

荔园在线首页友情链接：深圳大学深大招生荔园晨风BBS S-Term软件网络书店