音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 18391|回复: 0
收起左侧

[音频] 音频详解,码率采样率、音频帧、位深度、声道编码

[复制链接]

1417

积分

2

听众

21

音贝

音频应用新手发布

Rank: 3

积分
1417
发表于 2006-7-17 22:47:00 | 显示全部楼层 |阅读模式
包括采样率、码率、单双声道、音频帧、编码格式等概念。1 e: H$ a+ E9 n2 `% E9 Y! b1 t
7 k4 X6 Y- v# T
这里先抛出一个关于无损音频的问题。7 D- C& i2 ]7 n4 m2 {: Z

% a8 j0 ]; e0 S; F为什么48KHz采样率的.mp3不是无损音乐 ,而48KHz采样率的.wav、.flac音频是无损的呢?
( e, j$ {2 p, U
4 I! q& p$ P& h4 |音频相关概念我们按这样的顺序分类讨论:
; Y; j, q2 F0 j1 B% D! T) l" v& T
  b. _( ^5 h: o1、 音频采样的概念
! h. a' m9 j7 x+ f0 ^2 g, Z* Z& i; f0 m$ T
2、 单个音频帧的概念
0 |8 B" z' g6 G+ F
5 M$ J, ^6 P; Z0 Z! S3、 多个音频帧的概念, R# R8 e' R3 n% u

5 i9 a6 b- v  P: r4 J7 h, ?音频采样的概念  |9 m2 a! d  H' {( l% D. O
相关概念有:采样、位深度、声道、采样率。
+ m( R" }, |/ s& ?4 J5 O
" h1 V9 A& l" d. g! U* O9 i与视频不同的是,音频的最小单位不是一帧,而是一个采样。
8 r; H' W  ?0 `
+ r# s- ]: x) _4 @1 x1 o6 V采样是当前一刻声音的声音样本,样本需要经过数字转换才能存储为样本数据。
% m6 ~, ^# R" P/ p
  ~/ h; M+ j, N$ L. B: c) ]
, C+ O: Y' \7 K9 L. t4 `* ?% b2 y数字转换时会根据位深度转换,位深度就是存储单个样本数据的大小,位深度越大,记录的样本数据精度就越高。
. o/ `% o6 c. K3 `" i! P2 n& k
% Y. N8 \/ ?* c; [% n& |* j5 R网络视频、音频文件一般位深度为16bit,常用位深度还有8bit、24bit等。
1 ^4 P* ?  p, M& Q7 H
& H+ Z( y  T) ~; H这里需要一提的是,位深度越大虽然意味着声音还原度越高,但是过高的位深度,如32bit、64bit float或以上,可能需要特殊的软件和硬件设备才能播放。
- g9 O* N0 D# g5 Y
  w! X/ @6 h% D; L7 a/ L* r/ A* Z0 S( H8 a9 \; @1 Z
接下来是声道,音频有单声道、双声道、立体声等。
2 a! m5 ]7 ~" u3 b" _7 Q& S
: W" r4 H' d1 L" N每个声道的声音样本都会单独记录,一般双声道的采样数是单声道的两倍,多声道同理。- e. {6 Z. b: J2 s0 u/ G
. i/ q6 b+ ^' p2 `, P; V% a
多个声道的样本数据一般会按声道排列顺序记录,播放时,程序会根据排列顺序将声音用不同的扬声器播放。4 w5 E0 M  p( v. u

. c' L! e+ t7 d' |
2 b3 x/ u1 a# T: a而采样率是采样的频率,与视频的帧率类似,是一秒钟对声音的采样个数,如果是双声道,那么1秒采样的个数是采样率的两倍,多声道同理。  ?: u2 j6 m3 g2 \- q9 b/ c
- K% [3 N( H+ g3 O; i- u& w9 a
普遍认为,流畅且不失真的音频,要求采样率达到40KHz以上,这个采样率是人类听觉频率上限的两倍,一般CD品质音频的采样率是44.1KHz,网络视频、视频文件一般是48KHz。: d4 a; c4 `! e+ @1 d# _+ Y. B

/ I2 |; b# g& i, Q: V0 t# ?' F+ t  U: Y
不过,某些具体场景可能会降低采样率要求,如语音通话、监控摄像头等,这些场景下,音频采样率一般只有8KHz,这个频率虽然听音乐是一种折磨,会一卡一卡的,但是对听清别人说话倒是一点问题没有。
" N: b4 v5 X8 q8 I7 B$ ^! G9 m8 Y9 {/ N# j& f
单个音频帧的概念
  A; n& h6 q" E5 ?( b这里我们理解为什么存在音频帧就可以了。
# B! h2 D1 R4 O/ a
" i2 n- X1 `0 k2 m; D- H理论上,音频并不需要音频帧的概念,因为音频采样数据和采样率已经可以把音频播放描述清楚了。
  V1 E5 g. e! y5 Y2 l0 X, ^
$ e  i. S8 F6 l& k但是音视频文件播放时,为了保证音视频同步,程序需要根据每帧的播放时间戳进行有序播放。4 e* w  N6 I; }

2 Y) {6 I  V. j1 ^: J/ ^% j但是每个音频采样数据太小了,如果每个采样数据都记录播放时间戳的话,那么就得不偿失了。毕竟一个时间戳数据的大小比一个音频采样数据都大,所以就有了音频帧的概念。& y: A/ I$ f* r# J. q$ F7 w

1 F$ J1 M8 [" W3 h音频帧实际上就是把一小段时间的音频采样数据打包起来,如每20ms的音频采样数据合并成一帧。
, p; n" N; t! Q- h# i" R+ o
  h1 }/ w5 m9 _! a0 s1 i% {. b这里的具体时间间隔是具体编码码格式决定的,一般不需要特别关心。
% {! ^9 X6 m& w5 m# B* f( }, q" R# A
$ Z  c! D6 g$ }; f. Q( F
多个音频帧的概念' ]- }$ ?5 f5 t/ i5 G
多个音频帧的概念有播放时间戳PTS、码率、编码格式。与$ `6 Y" X3 S' c: w7 P. [
5 g9 O% Q) k6 g" i* H
视频帧一样,每一帧音频帧也会记录播放时间戳PTS,程序播放时会根据播放时间戳PTS播放音频帧。$ j& A, z/ g3 k! g
& F% r2 F7 D4 F2 `6 `. C
音频帧的播放是比较特别的,因为一帧音频包含的是一小段时间的音频采样,所以实际上音频帧的播放时间戳只是这一小段音频的开始播放时间,里面的采样数据会根据采样频率连续播放。" ]3 s, s* E! r5 Z5 M' N
5 J0 i* R8 B' s! Z- g1 |

, p; [' U( D) t+ `同时音频也有码率,也就是常听到的音频比特率,码率就是一秒钟的数据量大小。
* u' T2 X: u, {* f& \( N+ x4 f8 d' i- u) U4 Y; d8 L% D- S8 a
在不压缩的情况下,音频码率的大小=采样率*位深度声*道数。
+ ?0 A! z; u. L/ K8 K* t# R4 V5 X. `) ?1 m: ~

3 o# r1 L0 c7 H  E; s0 N% c6 d接下来是编码格式,编码格式实际上是压缩数据的方式,常用的编码格式有wav、mp3、aac等,音频编码格式有有损、无损压缩之分。
- L: }3 H. K7 Y
- B( _% N. c2 S6 ^2 m  e% B5 `
% n5 N: I7 i$ q9 h& d+ ~' \) W1 V这里可以解释开篇的问题了,为什么采样参数相同的mp3和wav文件会有不同的音质,这实际上是编码格式的问题。/ a! s, z" I6 K
1 A% R* B4 h% y! W5 h) U& H
mp3、aac这些编码格式是有损压缩,其中mp3支持的最大码率是320Kbps,而wav编码格式是无损压缩,虽然压缩后的码率可能会比降低,但是它在播放时能无损还原采样数据。
. x$ c) ?% b( E! u$ j6 c" t9 Y8 G
最后值得一提的是,在网络音频文件、音频直播时,需要考虑限制码率,限制码率的目的是为了限制数据量的大小,避免带宽、流量等问题。
' N4 R1 }# T, L. }/ G/ S
% y; o1 s( r" H0 l  g% G$ B" a音频编码格式一般采用aac,音频码率一般设置为128Kbps就可以了。
/ X7 a5 Y: A6 S8 J8 l/ l/ V
* m  ^6 _& ]0 ~总结* M% c4 }6 X6 P7 k9 L
以上是音频的基础概念,音频在很多介绍中都不会说到音频帧,因为普通的视频编辑场景是用不到的,但是在音视频处理中音频帧的概念是十分重要的,不然会出现很多问题,如音频重编码重采样后,出现卡顿、音频播放过快等问题。$ O3 z3 C  ]- L  Q( @- {/ q5 y( ]
4 z4 c' n: c6 @+ j+ U
介绍完了音频和视频的基础概念,后面我们会介绍关于音视频处理、识别的一些软件和框架。
音频应用
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号 )

GMT+8, 2025-6-9 21:37 , Processed in 0.023348 second(s), 6 queries , Redis On.

Powered by Audio app

快速回复 返回顶部 返回列表