|
![](static/image/common/ico_lz.png)
楼主 |
发表于 2010-5-31
|
三、音视频转换时常见到的格式
(一)音频转换
音频转换中常用的格式主要有APE、FLAC、midi、WAV、MP3、WMV、RA、OGG等,于视频不同,音频转换的格式往往是与编码方式相对应的。
1、WAV
WAV是微软公司开发的一种声音文件格式,它符合 PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。WAV格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道。标准格式的WAV文件音质和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。播放这种文件,推荐使用Winamp、foobar2000等专业级的播放器,并配备好一些的音箱和耳机。
2、FLAC及APE
FLAC即是Free Lossless Audio Codec的缩写,中文可解为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩,也就是说当你将从音频CD上读取的音频数据文件压缩成FLAC格式后,你还可以再将FLAC格式的文件还原,而还原后的音频文件与压缩前的一模一样。APE也是一直无损压缩音频技术。这两者格式的文件大小大概为CD的一半,但是随着宽带的普及,它们受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,二者可以帮助他们节约大量的资源。
现在二者已被很多软件及硬件音频产品所支持。播放这两种文件,同样推荐使用Winamp、foobar2000等专业级的播放器,并配备好一些的音箱和耳机。
这两者中,APE的压缩率更高一点,但容错性稍低,解码速度稍慢。
3、MP3
MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。
MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式、WAV格式及无损的声音文件。
由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为mp3格式的发展提供了良好的条件。直到现在,这种格式还是风靡一时,作为主流音频格式的地位难以被撼动。但是树大招风,MP3音乐的版权问题也一直是找不到办法解决,因为MP3没有版权保护技术,说白了也就是谁都可以用。
MP3格式压缩音乐的采样频率有很多种,可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。
4、WMA
WMA (Windows Media Audio) 格式以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右。
WMA这种格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。此外WMA的支持内容提供商通过DRM方案如Windows Media Rights Manager 7加入防拷贝保护。这种内置了版权保护技术可以限制播放时间和播放次数甚至于播放的机器等等;另外WMA还支持音频流技术,适合在网络上在线播放。
Windows操作系统和Windows Media Player无缝集成,直接使用Windows Media Player播放即可。
5、RealAudio
RealAudio主要适用于在网络上的在线音乐欣赏,主要有这么几种:有RA、RM、RMX,还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。
但由于随着网络带宽的普遍改善,RealAudio又不能提供同等大小下的更好音质,目前已很少看见了。
6、OGG
OGG格式完全开源,完全免费, 和mp3不相上下的新格式。 与MP3类似,OGGVorbis也是对音频进行有损压缩编码,但通过使用更加先进的声学模型去减少损失,因此,相同码率编码的OGGVorbis比MP3音质更好一些,文件也更小一些。
另外,MP3格式是受专利保护的。发布或者销售MP3编码器、MP3解码器、MP3格式音乐作品,都需要付专利使用费。而OGGVorbis就完全没有这个问题。目前,OGGVorbis虽然还不普及,但在音乐软件、游戏音效、便携播放器、网络浏览器上都得到广泛支持。
7、MIDI
MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。
当前,MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。mid文件重放的效果完全依赖声卡的档次。mid格式的最大用处是在电脑作曲领域。mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成mid文件。
8、AAC
AAC(Advanced Audio Coding)是一种专为声音数据设计的文件压缩格式。利用AAC格式,可使人感觉声音质量没有明显降低AAC标志的前提下,更加小巧。相对于MP3,AAC可提供最多48个全音域声道,最高支持96KHz的采样频率,解码播放所占的资源更少。
在杜比实验室的测试中,128Kbps的AAC立体声音乐被专家认为不易察觉到与原来未压缩音源的区别;AAC格式在96Kbps码率的表现超过了128Kbps的MP3格式;同样是128Kbps,AAC格式的音质明显好于MP3;AAC是目前唯一一个,能够在所有的EBU试听测试项目的获得“优秀”的网络广播格式。
目前该编码格式广泛运用于电影、电视剧、动漫新番的封装中。
9、AC-3
AC-3全称“杜比AC-3”(Dolby Surround Audio Coding-3),是杜比公司开发的新一代家庭影院多声道数字音频编码方式。杜比数字AC-3是根据感觉来开发的编码系统多声道环绕声。它将每一种声音的频率根据人耳的听觉特性区分为许多窄小频段,在编码过程中再根据音响心理学的原理进行分析,保留有效的音频,删除多作的信号和各种噪声频率,使重现的声音更加纯净,分离度极高。
杜比数字AC-3系统可用前置的左、右音箱,中置音箱产生极有深度感和定位明确的音场,用两个后置或侧置的环绕音箱和超低音箱表现宽广壮阔的音场,而六个声道的信息在制作和还原过程中全部数字化,信息损失的很少。
目前它已被美国采用作为高清晰电视(HDTV)音频系统,最新DVD机也包含杜比数字AC-3。相当多的MKV高清视频封装时也会采用AC-3格式。
(二)、视频转换中的常见格式
常用到的格式主要有AVI、MP4、MKV、WMV、RMVB、FLV、MOV等。
1、AVI
AVI即音频视频交错格式。是将语音和影像同步组合在一起的文件格式。采用一种有损压缩方式,压缩比较高,画面质量不是太好,但由于绝大多数视频编辑及转换软件导入导出avi格式较快,有些可以直接编辑AVI格式。因此这个格式在某些领域运用的非常广泛。
另外,AVI格式也是一般的设备和系统都能支持的基础格式。
2、MP4和RMVB
MP4大多使用mpeg-4或H.264视频编码器压缩。RMVB使用Real Media视频编码器压缩。这几种的优劣楼上已说明,就不再说了。
这两个在现在一般是电影、电视剧、动漫在刚出来时,发布资源时用的。其中RMVB格式用的越来越少了。
MP4格式一般的手机或其他设备、播放器、系统都可以直接播放(不一定流畅)。
3、MKV
MKV严格的来说并不是一个视频格式,它是多媒体封装格式,最大的特点就是能容纳多种不同类型编码的视频、音频及字幕流,它可将多种不同编码的视频及16条以上不同格式的音频和不同语言的字幕流封装到一MKV文件当中。
大多数字幕组发布DVD片源及BD片源的日漫、欧美大片时,特别是发布该资源的最终版本时,基本上都会使用这个格式。
目前绝大多数播放器都能支持该格式。
4、FLV
FLV 是FLASH VIDEO的简。由于形成的文件极小、加载速度极快,在网络视频中,运用极为广泛,是目前增长最快、最为广泛的视频传播格式,但基本仅用于网络视频。
同样,绝大多数播放器都支持该格式。
5、MOV
QuickTime具有跨平台、存储空间要求小等技术特点,采用了有损压缩方式的MOV格式文件,画面效果较AVI格式要稍微好一些。
目前基本仅见于IOS、Mac和专门面向二者的网站上,但大多数播放器仍然支持该格式。
6、其它格式
以上这些就是具有代表性的几种格式。除了这些还有RM、ASF、3GP等。
四、影响转码速度某些设置及其他相关
相当多的播放器为获得更好的转换效率,都有写加快转换效率的设置,主要有硬件加速、流直通等。同时还会有一些提升播放体验的设置,但其中的某些功能会导致视频转换速度大大降低,如将字幕硬性混入视频,二次编码等。
1、硬件加速
硬件加速是指在计算机中通过把计算量非常大的工作分配给专门的硬件来处理来减轻中央处理器的工作量的技术。
使用硬件加速,可以将CPU从视频流的转换中部分解放出来,从而加快视频转换的速度和降低转码时的资源占用。但是开启硬件加速在极少数情况下,可能会导致画质降低。另外,大多数视频转换软件都只支持nVIDIA显卡。
2、流直通
一个视频文件,一般是由一个视频流,可能有的多个音频流,以及可能被封装到视频中的字幕流,在这里面,视频流占了视频文件体积的大部分;但转换视频时,有相当长的时间和CPU资源会消耗在音频转换上面。
很多时候,转换视频格式,都只是因为分辨率、文件大小或者是文件格式的问题,并不一定需要转换音频流,所以大多数稍微专业一点的播放器,都有流直通复制的选项。选中该选项后,音频流将被直接复制新的视频文件中,从而将部分CPU资源解放出来,降低转换时的CPU占用和转换时间。
另外,进行视频合并及视频分割时,如果视频流的编码器、码率、分辨率等,音频流的码率、编码器、采样率等,字幕流格式一致,那么某些音视频转换工具可以直接合并流,而不进行重新编码。这回极大地加快合并或分割速度,一般只需要不到十秒。但我只知道QQ影音自带的转换器可以。
3、字幕硬性混入视频
当视频与字幕放到同一个文件夹下时,有些转换软件可以将字幕硬性混入视频(一般要文件名相同)。这个字幕硬性混入视频是指将字幕文件或字幕流混入到视频流中,也就是将字幕叠加到相应的帧上去,其好处在于,字幕在视频上,只要视频能播放,字幕就能显示。这么做,将会加大视频转换所需的时长和转换时的CPU占用。
4、二次编码
在视频转换时我们会用到一次编码(CBR)或二次编码(VBR)。
一次编码CBR(固定码率):保持码率基本维持在平均码率。实现简单,对复杂场景会因码率不足造成马赛克现象,对于简单场景则不能充分利用编码空间。(这里讲的复杂场景是指细节/边缘丰富以及快速变化场景)。
二次编码VBR, (2-pass VBR), 在第一次其实是检测收集运动啊亮度等相关数据,这样在第二次编码的时候就会针对不同的场景来进行动态的压缩编码。二次编码比一次编码质量要好一些的。但是编码时间也会增加不少。使用二次编码可以把变化不大的画面转换时码率低一些(如静态画面),而变化大的码率高一些(如打斗动作部分),这样码率是变化的,可以使整部影片的清晰度比较均匀。
二次编码将会使转码所需要的时间加大一半还多。 |
|