音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 19289|回复: 0
收起左侧

[音频] 音频详解,码率采样率、音频帧、位深度、声道编码

[复制链接]

1417

积分

2

听众

21

音贝

音频应用新手发布

Rank: 3

积分
1417
发表于 2006-7-17 22:47:00 | 显示全部楼层 |阅读模式
包括采样率、码率、单双声道、音频帧、编码格式等概念。
3 b* T" E; u  P, p; D% o& Z4 H5 f7 Y0 n3 k5 O$ s
这里先抛出一个关于无损音频的问题。
# j# y: G; _6 H- P
$ ?' N2 z9 |0 I为什么48KHz采样率的.mp3不是无损音乐 ,而48KHz采样率的.wav、.flac音频是无损的呢?
  }6 S6 }7 T- u. _# E: F3 W" n  E! W- y
音频相关概念我们按这样的顺序分类讨论:- X8 w. \- m5 y

8 l5 s& q) m3 y  t2 y$ V& |" w1、 音频采样的概念
& P' r5 y5 J' M1 j: x3 G8 l, @( G) D) O0 o: H3 j% }! ^1 p1 |
2、 单个音频帧的概念
: j0 |. `9 m% ?" P( p$ r4 t2 @. l9 s# u. [4 K" w& q
3、 多个音频帧的概念2 X0 Y: N9 B% ~! c+ G2 H0 {5 \4 i& l

  b: w! r- ^+ F音频采样的概念. a9 s" G: G0 n! F8 `) e0 y% w
相关概念有:采样、位深度、声道、采样率。
" A0 e" r  J+ @2 N
% r# H3 }& V6 E& X  {0 C. c; K, W与视频不同的是,音频的最小单位不是一帧,而是一个采样。
" v* K& E$ {* W& X4 n; l+ E
, H; L. G+ k  T/ p% ?2 K6 }1 T采样是当前一刻声音的声音样本,样本需要经过数字转换才能存储为样本数据。
- T1 ?9 J# Q- _- {  O' U+ y
' F1 T/ V6 ]9 _& r* L; q7 u' H( w/ ?/ i
数字转换时会根据位深度转换,位深度就是存储单个样本数据的大小,位深度越大,记录的样本数据精度就越高。7 i: {5 O' g$ c0 n1 C# ^+ c

8 \& T, {' O5 E" C. T1 k+ D/ s网络视频、音频文件一般位深度为16bit,常用位深度还有8bit、24bit等。
: V3 ]; _5 l* Q" o. P$ Q
' l( z# K- a- F这里需要一提的是,位深度越大虽然意味着声音还原度越高,但是过高的位深度,如32bit、64bit float或以上,可能需要特殊的软件和硬件设备才能播放。+ l1 ]8 N9 f% E5 M' {6 a
2 Z" T7 I" g( L. ^6 X5 ^

, X5 r5 V1 L$ T5 ^接下来是声道,音频有单声道、双声道、立体声等。
% N8 @) s6 Q/ s: S( O) E3 H& C% T& y! o& {6 ?2 Q% s. O
每个声道的声音样本都会单独记录,一般双声道的采样数是单声道的两倍,多声道同理。. ~, I% r% N$ j9 n

, h5 C4 N& Q, V多个声道的样本数据一般会按声道排列顺序记录,播放时,程序会根据排列顺序将声音用不同的扬声器播放。7 X: O, ]; }/ c$ I3 \: A

6 c: Q& c4 I' |- @* \; e( ?8 T
* c9 ?. l! \7 D+ L/ s- [而采样率是采样的频率,与视频的帧率类似,是一秒钟对声音的采样个数,如果是双声道,那么1秒采样的个数是采样率的两倍,多声道同理。5 p0 z' o' n9 N! B" U5 c

. e  R( _& P. e普遍认为,流畅且不失真的音频,要求采样率达到40KHz以上,这个采样率是人类听觉频率上限的两倍,一般CD品质音频的采样率是44.1KHz,网络视频、视频文件一般是48KHz。! G& M" @  R% R- A
2 l. B3 x. X/ L. M" u

8 V+ c8 }7 X1 M( N9 s9 d6 U( M1 s不过,某些具体场景可能会降低采样率要求,如语音通话、监控摄像头等,这些场景下,音频采样率一般只有8KHz,这个频率虽然听音乐是一种折磨,会一卡一卡的,但是对听清别人说话倒是一点问题没有。
% I; c7 M# R% d4 a; T$ _. e' N9 v& S2 k+ W/ R
单个音频帧的概念7 v! A2 v, W1 G! X6 F* d9 U  M
这里我们理解为什么存在音频帧就可以了。
( P  T# F' }$ w! B. u: b6 o/ p/ f& i! x) o  u; D( s
理论上,音频并不需要音频帧的概念,因为音频采样数据和采样率已经可以把音频播放描述清楚了。3 ]/ s/ ^' N" G2 m# I: V  Z2 T
: A. M; }7 G; J# _- x! F  e& E3 `
但是音视频文件播放时,为了保证音视频同步,程序需要根据每帧的播放时间戳进行有序播放。0 X7 g/ @* h8 ?
7 S) Z6 t# b# a" p7 _' ^
但是每个音频采样数据太小了,如果每个采样数据都记录播放时间戳的话,那么就得不偿失了。毕竟一个时间戳数据的大小比一个音频采样数据都大,所以就有了音频帧的概念。5 ]  j* D( s) ?

; _& S  O: S" d: L8 w( F音频帧实际上就是把一小段时间的音频采样数据打包起来,如每20ms的音频采样数据合并成一帧。8 C, \9 z2 Z# @  g6 _( _2 n1 |' }
, F/ e* Y4 E$ }" ?5 j. g
这里的具体时间间隔是具体编码码格式决定的,一般不需要特别关心。: e8 o4 ?; Q0 |& Q

' ?7 l3 q( T+ y4 A: I- [$ u* R4 D& S4 {9 @, @
多个音频帧的概念7 ~) {2 X% H0 @; ~
多个音频帧的概念有播放时间戳PTS、码率、编码格式。与
- D' \* M, \, s4 s
- u5 q6 p  ]: R% N2 Z视频帧一样,每一帧音频帧也会记录播放时间戳PTS,程序播放时会根据播放时间戳PTS播放音频帧。  i9 L7 q3 u" v# e+ g$ V
2 G% U. |8 @' O% Q
音频帧的播放是比较特别的,因为一帧音频包含的是一小段时间的音频采样,所以实际上音频帧的播放时间戳只是这一小段音频的开始播放时间,里面的采样数据会根据采样频率连续播放。# F, }( I8 |% R9 f5 K4 q' S
8 T0 b: j8 \$ b$ n" f

9 M7 V1 O. r1 m同时音频也有码率,也就是常听到的音频比特率,码率就是一秒钟的数据量大小。: o/ E9 b. T/ ~- Y( O
: D' p* U- e6 ]' u/ G- A" b* L
在不压缩的情况下,音频码率的大小=采样率*位深度声*道数。4 Z  E. e0 I# q$ F2 K- }* O; p  N
5 Q- D4 n: m2 F$ Z1 k
, |' `( L) }, Y( t# q
接下来是编码格式,编码格式实际上是压缩数据的方式,常用的编码格式有wav、mp3、aac等,音频编码格式有有损、无损压缩之分。
; o& P, |5 D5 a! b1 o& j# B+ |1 F  z

; n4 Z: b. W. i4 N/ T* K% Z这里可以解释开篇的问题了,为什么采样参数相同的mp3和wav文件会有不同的音质,这实际上是编码格式的问题。
0 e3 a0 K) S% X% b% ^/ V, G$ ^( W5 B, R# x' a5 z8 W3 A8 z
mp3、aac这些编码格式是有损压缩,其中mp3支持的最大码率是320Kbps,而wav编码格式是无损压缩,虽然压缩后的码率可能会比降低,但是它在播放时能无损还原采样数据。5 s6 @# z+ R+ U* x

& u, o" N5 v8 U. w) p3 l9 |" E最后值得一提的是,在网络音频文件、音频直播时,需要考虑限制码率,限制码率的目的是为了限制数据量的大小,避免带宽、流量等问题。
% c1 o8 B# J# t( a) {* }; N! M
( L6 {+ G5 [! v* P音频编码格式一般采用aac,音频码率一般设置为128Kbps就可以了。
4 {0 y6 f& h7 ]3 r9 M% D! p
/ T& K6 S) q0 ?9 E5 ?( m6 {总结
0 V. }2 ^$ k4 n以上是音频的基础概念,音频在很多介绍中都不会说到音频帧,因为普通的视频编辑场景是用不到的,但是在音视频处理中音频帧的概念是十分重要的,不然会出现很多问题,如音频重编码重采样后,出现卡顿、音频播放过快等问题。
# G- v, k8 C9 q& Y1 N2 X4 v  O6 I! f% g2 o) W  F1 Y
介绍完了音频和视频的基础概念,后面我们会介绍关于音视频处理、识别的一些软件和框架。
音频应用
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号-6 )

GMT+8, 2025-7-12 15:38 , Processed in 0.024168 second(s), 6 queries , Redis On.

Powered by Audio app

快速回复 返回顶部 返回列表