By 咣輝のま裔http://blog.sina.com.cn/u/1669168344
转载请注明作者信息,谢谢。
无聊做下各种音频格式的测试,发上来给大家分享下,独家首创,不喜勿喷,谢谢。
这次用到的工具主要有Adobe AuditionCS6和BeyondCompare
Adobe Audition CS6精简汉化版下载:
http://soft2.wmzhe.com/download/Ansifa2013/AdobeCS6/Adobe_Dreamweaver_CS6_v2.7z
这是更新到5.0.2的版本,解决了APE加载的问题
BeyondCompare请自行网上搜索下载
首先,打开Adobe AuditionCS6
在首选项里把频谱频率显示的分辨率选到最高,也就是16384,这样做能使频谱变得精致,更精确的反映音频的素质。
接着 右键右边的频率栏
选择完全线性,然后再选择 更多对数 5次左右。
说明:
虽然如果选择完全对数显示比较夸张,但是频率间的差距都是用对数来比较的,而不是差值。100hz和500hz;20100hz和20500hz之间都只差400hz,一个差距很大,一个只是差了一点而已。
大家平常都用着完全线性这种显示来鉴别无损等等,确实高频部分比较直观,但是如果用这个来体现有损音频的品质,就极其的不合适了。(自行脑补声学和对数。。。)
Audition提供了21个级别,如果说完全对数的显示方式为level0 ,完全线性的显示方式为level20的话,Auditioncs5.5 和cs6默认的显示方式为level7,也就是更接近于对数。而Audition3 的默认是完全线性的。
一般来说为了直观的表现音频的整体素质,推荐设置为level10 到level15之间,而不是绝对线性这种不合适的设定。
So,我在这里设为level15,希望大家一定要注意,别跟我说我后面的频谱有问题哦!!!
说到这里大家肯定觉得我又要开始看频谱了。
我只想说看频谱什么的都弱爆了。你能看出什么差距来么?高频被砍了一刀,中频坑坑洼洼。某某某这么小的码率,居然频谱如此好看,真是太强了。看似不错就真的不错了么?
频谱:这是一个音频数据的直观视图。横轴时间,纵轴频率,还用颜色的明暗展现了振幅的大小(声音的大小)声音的要素都在这里了,频谱足以从视觉的角度完全的展现音频的素质。
但是肉眼凡胎,跟你听音乐一样,除了特别明显的地方,你又能看出多少差别。某些看似不错的频谱隐藏着许多你看不出的差别。
废话不多说,这次测试用的无损音频是 杜雯媞和王艺翔唱的 “雪”
这首歌属于男女对唱,频谱比较丰满,直达22k,有低潮,有高潮,高潮部分波形图直达0db,比较适合用来有损格式的测试。
先上原wav文件的频谱图。
接着上无损FLAC的对比图片:
图挂了?这黑压压的是什么?
这是WAV和FLAC频谱的对比图片,黑色表示没有差别。那些能看出无损跟WAV频谱不同的人,我只能说你眼睛的想象力不错,就跟你耳朵的想象力一样。大家看到这句话不要笑:)
这图怎么来的?
首先用Adobe Audition打开wav和flac文件,分别截取频谱图(用qq截得,能根据窗口截图,保证两次截图对齐),保存为无损格式(切记),比如bmp或者png。
接着要介绍我刚刚说的BeyondCompare。这是一个文件对比软件,能比较各种文件。自行搜索下载。
安装完以后,选择刚刚保存的wav和flac频谱的截图,右键比较即可。
打开后记得如下设置。
箭头处选上。
容差:表示允许的颜色差值最大值。最大255,即2的8次方减一,这涉及到位图的结构,我就不详细解释了。
总之,容差相当于你对声音大小的敏感程度。越低的码率,应该设置越大来便于观察。
上面那张FLAC与WAV的对比图设置的容差为0。
为了保持一致性和可对比性,下文全部设为3。大家也可以设置成其他值观察对比。
最后提醒下各位,某些有损格式和wav在时间长度上有毫秒级的差别,这是为了对齐到某个时间长度照成的。这会使得频谱横轴不同,照成显示上的略微差别,虽然AuditionCS6也可以打开各种有损格式,但我们还是应该自己手动转换回wav格式,这时时间长度会恢复。
好了FLAC打完酱油可以走了。。。
256K大混战
文件格式 | 大小 | 平均码率 |
MP3 VBR V0 | 6.85M | 254 kbps |
Ogg q8.2 | 6.96M | 258 kbps |
Nero aac vbr0.69 | 6.93M | 256 kbps |
Qaac tvbr 110 | 6.72M | 248 kbps |
Qaac cvbr 256 | 7.01M | 258 kbps |
接下来我要上各个有损格式的频谱跟原音频频谱的对比图片了,黑色表示基本没差,红色表示有差别,容差一律为3。
MP3 VBRV0
点评:同码率对比,mp3格式在4K以下表现最为优秀,4K以上逐渐削弱,到了16K以上削弱加剧。整体听感略微发闷。
Oggq8.2
点评:19K以后开始削弱,整体平衡,中规中矩,表现好于mp3
Nero aac vbr0.69
点评:10K以下的表现让人眼前一亮,10K到18k表现良好,18K以后基本切掉。如果你的纵轴是完全线性的,那你可能不会觉得Neroaac有多优秀。但在我看来,恰恰得益于抛弃了18k以上,使其在人耳敏感的部分发挥出了最佳的水平,推荐格式
最后再插一句,觉得听不到18k以上的童鞋,推荐用vbrq0.74,其18k以下的水准能达到vbrq0.82左右的水平。
觉得自己能听的到18K以上,又想频谱好看,又想体积小,就用vbrq0.75吧。
附上对比图:
Nero aac vbrq0.74
Nero aac vbrq0.75
Qaac tvbr110
Qaac cvbr256
点评:首先要澄清一点,相同参数下qaac= qtaacenc = iTunesAAC。直接比较ACC文件的2进制值,除了文件头部的信息不同外,音频部分的数据完全相同。
有些童鞋说苹果用的是qtaacenc,苹果用的是qaac,等等,我想你们不要本末倒置了,qaac和qtaacenc充其量只是一个命令行前端(acommand line frontend),真正负责编码的是QuickTime。所以相同参数下编出的音频完全一样是毫无悬念的。
相信看过本文早先版本的同学,肯定知道我使用旧版QuickTime照成的尴尬,我就不说了。还是更新到最新比较好。
Qaac tvbr和Qaaccvbr的区别就体现在低潮的水平上。Qaaccvbr的低潮表现更好一点(红点更少),当然这是多用了10kbps的码率换来的,两者高潮部分一个红点不差,真的是一个红点也不差。
Qaac 在256k的表现胜过同码率的mp3和ogg。至于跟Neroacc比哪个强,我想各位看官心里都有自己的想法。我只告诉你,用耳朵去听吧,哪怕是心理安慰也好。如果连耳朵都分辨不出来,又何必在意这些呢?
320K间的对决
文件格式 | 大小 | 平均码率 |
Faac q500 | 8.04M | 297 kbps |
mp3 cbr 320 | 8.62M | 320 kbps |
Ogg q9.0 | 8.54M | 317 kbps |
Nero aac vbr0.83 | 8.62M | 318 kbps |
Qaac tvbr 127 | 8.48M | 313 kbps |
Qaac cvbr 320 | 8.79M | 324 kbps |
Faacq500
点评:整体比较平庸,但细心观察你就会发现,1k以下水平明显变差,不过16k以上水平不错,结果就是,频谱肉眼看起来很好看。实际上1k以下明显比16k以上来得重要。
实际表现还不如Qaac tvbr110,我实在是不敢恭维。
mp3 cbr320
点评:4k以下的还原依旧无敌,16K以上明显衰减,20K以上被截断。可以看作v0的升级版,谁说v0跟320k没差的?顺便鄙视那些看着频谱说着256kapple aac秒杀320kmp3的童鞋。
同一编码器编出来的音频都比较相似,它们对高中低频段的取舍是一样的,码率就差在还原的精度与闸值上。
Oggq9.0
点评:依旧是中庸的表现,总体胜过前两者。ogg就是这样,比上不足,比下有余。
Nero aac vbr0.83
点评:ogg相对于Faac和mp3来说表现已经很不错了,但跟Neroaac一比就分出了高下。相当优秀有木有?10k以下总是如此抢眼,弄的他10k以上都有点尴尬,其实10k以上表现也是不错的,推荐格式。
Qaac tvbr127
Qaac cvbr320
点评:这,这完全就是ogg的升级版。。。可怜的ogg一直给appleacc欺负。跟Neroaac比谁比较强呢?我只能说风格不同,两者互有胜负,旗鼓相当,难分高下。总之一句话,Neroaac都被推荐了,这没有不被推荐的理由,请看官自行选择。
谁才是AAC最强?
文件格式 | 大小 | 平均码率 |
Nero aac vbr1.00 | 10.7M | 396 kbps |
Nero aac abr512k | 11M | 407 kbps |
Nero aac abr 2-pass512k | 13.2M | 489 kbps |
Nero aac cbr512k | 13.8M | 512 kbps |
在开始对比频谱之前,先跟我做个实验。
随机选20首无损,分别转换为对应格式的整轨,接着用rar最好模式进行压缩
文件格式 | 大小 | RAR文件大小 |
WAV | 864MB | 598MB |
Nero aac vbr1.00 | 246MB | 246MB |
Nero aac abr512k | 251MB | 251MB |
Nero aac abr 2-pass512k | 301MB | 251MB |
Nero aac cbr512k | 314MB | 218MB |
WAV文件可以被压缩,大家都知道,这不是重点。
vbr1.00和abr512k 压缩前后大小基本不变,它们的码率是实打实的。abr 2-pass 512k压缩后和abr512k体积相当,可以想象他们实际水平差不多。亮点来了,cbr512k压缩后体积最小,都能赶上WAV到无损的压缩比了。其实这很容易想象,cbr本来就是为网络传播的兼容性考虑的,算法上自然受到码率限制。而nero的cbr算法并没有让那些低潮部分表现得更好,而只是做了简单的无用数据填充,来达到统一码率的目的。
问题:谁才是最强?
猜测:显然从压缩后的体积上看abr512k和abr2-pass 512k的表现会差不多。由于vbr面向质量的算法,不受最低码率的限制,理论上能达到最佳的音质体积比,效果上应该跟abr512k处于同一水平。至于cbr512k,估计是最差的,那臃肿的体积看了就心痛。
验证我们的猜测
Nero aac vbr1.00
点评:相当给力有木有,红点已经少到一种水平了,绝不是上面那些320k码率能够匹敌的。
Nero aac abr512k
点评:虽然红点的位置有所不同,但你能看出哪个更强一点么?反正我是觉得没什么差距。
Nero aac abr 2-pass512k
点评:点评同上,外加一句,这个增加的体积是在开玩笑么?
Nero aac cbr512k
点评:cbr512k终于害羞的露出了它的真面目,弱爆了有木有?这就是现实,体积大不一定就是最好的,有时候还可能是最差的。
其实很多时候你的耳朵已经无法分辨谁强谁弱了,而你的心理因素起了决定性作用。
结论:Nero aac vbr1.00是当之无愧的aac综合实力最强,我可以信心十足的告诉你。
vbr笑道:cbr512k那丫就是战5渣。
vbr众人附和道:cbr512k什么的弱爆了。
cbr512k党辩到:这一定是图形的载入方式不对。。。
有损极限的对决?
文件格式 | 大小 | 平均码率 |
Ogg q10 | 12M | 447 kbps |
Opus vbr 512 | 12.9M | 480 kbps |
Oggq10
点评:除了20k以上淡淡的一条线以外,整体都没什么红点了,称不上完美,但也不是那么好超越的。
是谁说的faacq500跟oggq10体积差一倍的,水准却差不多来着?一个码率300kbps左右,一个450kbps左右好么。差距明显么?那还真明显,当然faac高频频谱党眼力有限,分辨率再提升10倍也许能够察觉到。
Opus vbr512
点评:12k以下基本黑丫丫一片,我和我的小伙伴都惊呆了。12k到20k跟neroaac vbr q1.00的水平接近。20k以上人耳已经听不见,一律一刀切,这成了高频频谱党最大的遗憾,哈哈哈。
顺便说下,这是从opus48KHz转回44.1KHz后的对比。因为opus会把音频转为48KHz,当然这并不会照成多少失真,从上面的对比图就可以看出来。
Opus是还在不断发展的格式,根据我的测试,各种码率下的综合表现与Neroaac vbr接近,当然除了那20k的一刀切。
总结
码率带来的音质的提升并不像你用肉眼从频谱中看到的那样,简单的弥补那些听不见的超声波,而是高中低全频段的整体提升带来的,这是一个量变到质变的过程。
最后,如果让我给你推荐一个音频有损编码方式的话,我推荐你用Nero AACVBR或者Qaactvbr,这也是本文得出的结论。超过400k码率我建议你直接听无损了吧(如果你把容差设为0的话,上面的对比图将惨不忍睹,当然这已经不是金耳朵的范畴了,这是神耳朵。对于神耳朵,只有无损能满足你)。
终于看完了,如果你觉得本文写的不错,看了之后有所收获,欢迎转载。