音頻格式

音頻格式

音頻格式是指要在電腦內播放或是處理音頻檔案,是對聲音檔案進行數、模轉換的過程。音頻格式最大頻寬是20KHZ,速率介于40~50KHZ之間,採用線性脈沖編碼調製PCM,每一量化步長都具有相等的長度。到2008年音頻格式包括:CD格式、WAV、AIFF、AU、MPEG、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。

  • 中文名稱
    音頻格式
  • 最大頻寬
    20KHZ
  • 速率
    40~50KHZ之間
  • 音頻檔案格式
    1無損格式2有損格式

基本簡介

​音頻檔案格式專指存放音頻資料的檔案的格式。存在多種不同的格式。

一般獲取音頻資料的方法是:採用固定的時間間隔,對音頻電壓採樣(量化),並將結果以某種解析度(例如:CDDA每個採樣為16比特或2位元組)存儲。採樣的時間間隔可以有不同的標準,如CDDA採用每秒44100次;DVD採用每秒48000或96000次。因此,採樣率,解析度聲道數目(例如身曆聲為2聲道)是音頻檔案格式的關鍵參數。

需要厘清楚的是音頻檔案和編解碼器不同。盡管一種音頻檔案格式可以支持多種編碼,例如AVI檔案格式,但多數的音頻檔案僅支持一種音頻編碼。

有兩類主要的音頻檔案格式:

  • 無損格式,例如WAV,PCM,TTA,FLAC,AUAPE,TAK,WavPack(WV)
  • 有損格式,例如MP3,Windows Media Audio(WMA),Ogg Vorbis(OGG),AAC

有損檔案格式是基于聲學心理學的模型,除去人類很難或根本聽不到的聲音,例如:一個音量很高的聲音後面緊跟著一個音量很低的聲音。MP3就屬于這一類檔案。

無損的音頻格式(例如TTA)壓縮比大約是2:1,解壓時不會產生資料/質量上的損失,解壓產生的資料與未壓縮的資料完全相同。如需要保證音樂的原始質量,應當選擇無損音頻編解碼器。例如,用免費的TTA無損音頻編解碼器你可以在一張DVD-R碟上存儲相當于20張CD的音樂。

有損壓縮套用很多,但在專業領域使用不多。有損壓縮具有很大的壓縮比,提供相對不錯的聲音質量。

主要特點

音頻檔案格式常見的特點有:要在電腦內播放或是處理音頻檔案,也就是要對聲音檔案進行數、模轉換,這個過程同樣由採樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻檔案格式的最大頻寬是20KHZ,故而採樣速率需要介于40~50KHZ之間,而且對每個樣本需要更多的量化比特數。音頻數位化的標準是每個樣本16位-96dB的信噪比,採用線性脈沖編碼調製PCM,每一量化步長都具有相等的長度。在音頻檔案的製作中,正是採用這一標準。

發展信息

音頻格式日新月異,到2008年音頻格式包括:CD格式、WAVE(*.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。

CD信息

CD格式的音質是比較高的音頻格式。因此要講音頻格式,CD自然是打頭陣的先鋒。在大多數播放軟體的“開啟檔案類型”中,都可以看到*.cda格式,這就是CD音軌了。標準CD格式也就是44.1K的採樣頻率,速率88K/秒,16位量化位數,因為CD音軌可以說是近似無損的,因此它的聲音基本上是忠于原聲的,因此如果你是一個音響發燒友的話,CD是你的首選。它會讓你感受到天籟之音。CD光碟可以在CD唱機中播放,也能用電腦裏的各種播放軟體來重放。一個CD音頻檔案是一個*.cda檔案,這隻是一個索引信息,並不是真正的包含聲音信息,所以不論CD音樂的長短,在電腦上看到的“*.cda檔案”都是44位元組長。註意:不能直接的復製CD格式的*.cda檔案到硬碟上播放,需要使用象EAC這樣的抓音軌軟體把CD格式的檔案轉換成WAV,這個轉換過程如果光碟驅動器質量過關而且EAC的參數設定得當的話,可以說是基本上無損抓音頻。推薦大家使用這種方法。

音頻格式

WAVE

WAVE(*.WAV)是微軟公司開發的一種聲音檔案格式,它符合PIFFResource Interchange File Format 檔案規範,用于儲存WINDOWS平台的音頻信息資源,被WINDOWS平台及其應用程式所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多種壓縮演算法,支持多種音頻位數、採樣頻率和聲道,標準格式的WAV檔案和CD格式一樣,也是44.1K的採樣頻率,速率88K/秒,16位量化位數,看到了吧,WAV格式的聲音檔案質量和CD相差無幾,也是目前PC機上廣為流行的聲音檔案格式,幾乎所有的音頻編輯軟體都“認識”WAV格式。

音頻格式

AIFF

AIFF(Audio Interchange File Format)格式和AU格式,它們都和WAV非常相像,在大多數的音頻編輯軟體中也都支持它們這幾種常見的音樂格式。AIFF是音頻交換檔案格式的英文縮寫。是APPLE公司開發的一種音頻檔案格式,被MACINTOSH平台及其應用程式所支持,NETSCAPE流覽器中LIVEAUDIO也支持AIFF格式。所以大家都不常見。AIFF是Apple蘋果電腦上面的標準音頻格式,屬于QuickTime技術的一部分。這一格式的特點就是格式本身與資料的意義無關,因此受到了Microsoft的青睞,並據此搞出來WAV格式。AIFF雖然是一種很優秀的檔案格式,但由于它是蘋果電腦上的格式,因此在PC平台上並沒有得到很大的流行。不過由于Apple電腦多用于多媒體製作出版行業,因此幾乎所有的音頻編輯軟體和播放軟體都或多或少地支持AIFF格式。隻要蘋果電腦還在,AIFF就始終還佔有一席之地。由于AIFF的包容特徵,所以它支持許多壓縮技術。

音頻格式

AU

AUDIO檔案是SUN公司推出的一種數位音頻格式。AU檔案原先是UNIX作業系統下的數位聲音檔案。由于早期INTERNET上的WEB伺服器主要是基于UNIX的,所以,AU格式的檔案在如今的INTERNET中也是常用的聲音檔案格式

MPEG

MPEG是動態圖象專家組的英文縮寫。這個專家組始建于1988年,專門負責為CD建立影片和音頻壓縮標準。MPEG音頻檔案指的是MPEG標準中的聲音部分即MPEG音頻層。目前INTERNET上的音樂格式以MP3最為常見。雖然它是一種有損壓縮,但是它的最大優勢是以極小的聲音失真換來了較高的壓縮比。MPEG含有格式包括:MP1、MP2、MP3、MP4

音頻格式

MP3

MP3格式誕生于八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應“*.mp1"/“*.mp2”/“*.mp3”這3種聲音檔案。需要提醒大家註意的地方是:MPEG音頻檔案的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音檔案中12KHz到16KHz高音頻這部分的質量來換取檔案的尺寸,相同長度的音樂檔案,用*.mp3格式來儲存,一般隻有*.wav檔案的1/10,而音質要次于CD格式或WAV格式的聲音檔案。由于其檔案尺寸小,音質好;所以在它問世之初還沒有什麽別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是風靡一時,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的著作權問題也一直是找不到辦法解決,因為MP3沒有著作權保護技術,說白了也就是誰都可以用。

MP3格式壓縮音樂的採樣頻率有很多種,可以用64Kbps或更低的採樣頻率節省空間,也可以用320Kbps的標準達到極高的音質。用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鍾的歌曲,得到2.82MB的MP3檔案。採用缺省的CBR(固定採樣頻率)技術可以以固定的頻率採樣一首歌曲,而VBR(可變採樣頻率)則可以在音樂“忙”的時候加大採樣的頻率獲取更高的音質,不過產生的MP3檔案可能在某些播放器上無法播放。把VBR的級別設定成為與前面的CBR檔案的音質基本一樣,生成的VBR MP3檔案為2.9MB。

MP3是到2008年止使用使用者最多的有損壓縮數位音頻格式了。它的全稱是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,剛出現時它的編碼技術並不完善,它更像一個編碼標準架構,留待人們去完善。早期的MP3編碼採用的的是固定編碼率的方式(CBR),看到的128KBPS,就是代表它是以128KBPS固定資料速率編碼——你可以提高這個編碼率,最高可以到320KBPS,音質會更好,自然,檔案的體積會相應增大。

因為MP3的編碼方式是開放的,可以在這個標準架構的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復雜部分用高bitrate編碼,簡單部分用低bitrate編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing編碼器的VBR演算法很差,音質與CBR(固定碼率)相去甚遠。但是,這種演算法指明了一種方向,其他開發者紛紛推出自己的VBR演算法,使得效果一直在改進。目前公認比較好的首推LAME,它完美地實現了VBR演算法,而且它是是完全免費的軟體,並且由愛好者組成的開發團隊一直在不斷的發展完善。

而在VBR的基礎上,LAME更加發展出ABR演算法。ABR(AverageBitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的檔案體積比和VBR生成檔案大小不定的特點獨創了這種編碼模式。ABR在指定的檔案大小內,以每50(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。

MP3問世不久,就憑這較高的壓縮比12:1和較好的音質創造了一個全新的音樂領域,然而MP3的開放性卻最終不可避免的導致了著作權之爭,在這樣的背景之下,檔案更小,音質更佳,同時還能有效保護著作權的MP4就應運而生了。MP3和MP4之間其實並沒有必然的聯系,首先MP3是一種音頻壓縮的國際技術標準,而MP4卻是一個商標的名稱。

MPEG-4

MPEG-4標準是由國際運動圖像專家組于2000年10月公布的一種面向多媒體套用的影片壓縮標準。它採用了基于對象的壓縮編碼技術,在編碼前首先對影片序列進行分析,從原始圖像中分割出各個影片對象,然後再分別對每個影片對象的形狀信息、運動信息、紋理信息單獨編碼,並通過比MPEG-2更優的運動預測和運動補償來去除連續幀之間的時間冗餘。其核心是基于內容的尺度可變性(Content-basedscalability),可以對圖像中各個對象分配優先權,對比較重要的對象用高的空間和時間分辯率表示,對不甚重要的對象(如監控系統的背景)以較低的分辯率表示,甚至不顯示。因此它具有自適應調配資源能力,可以實現高質量低速率的圖像通信和影片傳輸。 MPEG-4以其高質量、低傳輸速率等優點已經被廣泛套用到網路多媒體、影片會議和多媒體監控等圖像傳輸系統中。中國內外大部分成熟的MPEG-4套用均為基于PC層面的客戶端和伺服器模式,套用在嵌入式系統上的並不多,且多數嵌入式MPEG-4解碼系統大多使用商業的嵌入式作業系統,如WindowsCE、VxWorks等,成本高、彈性差。如以嵌入式Linux作為作業系統不僅開發方便,且可以節約成本,並可以根據實際情況進行裁減,佔用資源少、彈性強,網路性能好,適用範圍更廣。

MIDI

MIDI(Musical Instrument Digital Interface)格式被經常玩音樂的人使用,MIDI允許數位合成器和其他設備交換資料。MID檔案格式由MIDI繼承而來。MID檔案並不是一段錄製好的聲音,而是記錄聲音的信息,然後在告訴音效卡如何再現音樂的一組指令。這樣一個MIDI檔案每存1分鍾的音樂隻用大約5~10KB。MID檔案主要用于原始樂器作品,流行歌曲的業餘表演,遊戲音軌以及電子賀卡等。*.mid檔案重放的效果完全依賴音效卡的檔次。*.mid格式的最大用處是在電腦作曲領域。*.mid檔案可以用作曲軟體寫出,也可以通過音效卡的MIDI口把外接音序器演奏的樂曲輸入電腦裏,製成*.mid檔案。

音頻格式

WMA

WMA (Windows Media Audio) 格式是來自于微軟的重量級選手,後台強硬,音質要強于MP3格式,更遠勝于RA格式,它和日本YAMAHA公司開發的VQF格式一樣,是以減少資料流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優點是內容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內置了著作權保護技術可以限製播放時間和播放次數甚至于播放的機器等等,這對被盜版攪得焦頭亂額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術,適合在網路上線上播放,作為微軟搶佔網路音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows作業系統和Windows Media Player的無縫捆綁讓你隻要安裝了windows作業系統就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光碟轉換為WMA聲音格式的功能,在新出品的作業系統Windows XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現在“狼”又來了。WMA這種格式在錄製時可以對音質進行調節。同一格式,音質好的可與CD媲美,壓縮率較高的可用于網路廣播。雖然現在網路上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網路音樂領域中直逼*.mp3,在網路廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的著作權保護能力。應該說,WMA的推出,就是針對MP3沒有著作權限製的缺點而來——普通使用者可能很歡迎這種格式,但作為著作權擁有者的唱片公司來說,它們更喜歡難以復製拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求。

音頻格式

除了著作權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下檔案體積可以變的更小(當然,隻在MP3低于192KBPS碼率的情況下有效,實際上當採用LAME演算法壓縮MP3格式時,高于192KBPS時普遍的反映是MP3的音質要好于WMA)。

RealAudio

RealAudio主要適用于在網路上的線上音樂欣賞,現在大多數的使用者仍然在使用56Kbps或更低速率的Modem,所以典型的回放並非最好的音質。有的下載站點會提示你根據你的Modem速率選擇最佳的Real檔案。real的的檔案格式主要有這麽幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點是可以隨網路頻寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令頻寬較富裕的聽眾獲得較好的音質。

音頻格式

近來隨著網路頻寬的普遍改善,Real公司正推出用于網路廣播的、達到CD音質的格式。如果你的RealPlayer軟體不能處理這種格式,它就會提醒你下載一個免費的升級包。許多音樂網站 提供了歌曲的Real格式的試聽版本。現在最新的版本是RealPlayer 9.0,第39期《電腦報》也對RealPlayer 9.0作了詳細的介紹,這裏不再贅述。

VQF

雅馬哈公司另一種格式是*.vqf,它的核心是減少資料流量但保持音質的方法來達到更高的壓縮比,VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到18:1左右甚至更高。也就是說把一首4分鍾的歌曲(WAV檔案)壓成MP3,大約需要4MB左右的硬碟空間,而同一首歌曲,如果使用VQF音頻壓縮技術的話,那隻需要2MB左右的硬碟空間。因此,在音頻壓縮率方面,MP3和RA都不是VQF的對手。相同情況下壓縮後VQF的檔案體積比MP3小30%~50%,更便利于網上載播,同時音質極佳,接近CD音質(16位44.1kHz身曆聲)。可以說技術上也是很先進的,但是由于宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從*.wav檔案轉換到*.vqf檔案的軟體。 此檔案缺少特點外加缺乏宣傳。

當VQF以44KHz、80kbit/s的音頻採樣率壓縮音樂時,它的音質優于44KHz、128kbit/s的MP3,當VQF以44KHz、96kbit/s的頻率壓縮時,它的音質幾乎等于44KHz、256kbit/s的MP3。經SoundVQ壓縮後的音頻檔案在進行回放效果試聽時,幾乎沒有人能聽出它與原音頻檔案的差異。播放VQF對電腦的配置要求僅為奔騰75或更高,當然如果您用奔騰100或以上的機器,VQF能夠運行得更加出色。實際上,播放VQF對CPU的要求僅比Mp3高5~10%左右。

音頻格式

VQF即TwinVQ技術雖然是由NTT和YAMAHA開發的,但它們的套用軟體都是免費的。隻是NTT和YAMAHA並沒有公布VQF的原始碼。

OggVorbi

OggVorbis是一種新的音頻壓縮格式,類似于MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限製的。Vorbis是這種音頻壓縮機製的名字,而Ogg則是一個計畫的名字,該計畫意圖設計一個完全開放性的多媒體系統。目前該計畫隻實現了OggVorbis這一部分。

OggVorbis檔案的擴展名是*.OGG。這種檔案的設計格式是非常先進的。這種檔案格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器

VORBIS採用有損壓縮,但通過使用更加先進的聲學模型去減少損失,因此,同樣位速率(BitRate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個原因,MP3格式是受專利保護的。如果你想使用MP3格式發布自己的作品,則需要付給Fraunhofer(發明MP3的公司)專利使用費。而VORBIS就完全沒有這個問題。

對于樂迷來說,使用OGG檔案的顯著好處是可以用更小的檔案獲得優越的聲音質量。而且,由于OGG是完全開放和免費的,製作OGG檔案將不受任何專利限製,可望可以獲得大量的編碼器和播放器。這也是為何現在MP3編碼器如此少而且大多是商業軟體的原因,因為Fraunhofer要收取專利使用費。Vorbis使用了與MP3相比完全不同的數學原理,因此在壓縮音樂時受到的挑戰也不同。同樣位速率編碼的Vorbis和MP3檔案具有同等的聲音質量。Vorbis具有一個設計良好、靈活的注解,避免了象MP3檔案的ID3標記那樣煩瑣的操作;Vorbis還具有位速率縮放:可以不用重新編碼便可調節檔案的位速率。Vorbis檔案可以被分成小塊並以樣本粒度進行編輯;Vorbis支持多通道;Vorbis檔案可以以邏輯方式相連線等。

音頻格式

AMR

?全稱Adaptive Multi-Rate,自適應多速率編碼,主要用于移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質量比較差,由于多用于人聲,通話,效果還是很不錯的。

一、分類

1. AMR: 又稱為AMR-NB,相對于下面的WB而言,語音頻寬範圍:300-3400Hz,8KHz抽樣

2. AMR-WB:AMR WideBand,

語音頻寬範圍: 50-7000Hz 16KHz抽樣

“AMR-WB”全稱為“Adaptive Multi-rate - Wideband”,即“自適應多速率寬頻編碼”,採樣頻率為16kHz,是一種同時被國際標準化組織ITU-T和3GPP採用的寬頻語音編碼標準,也稱為G722.2標準。AMR-WB提供語音頻寬範圍達到50~7000Hz,使用者可主觀感受到話音比以前更加自然、舒適和易于分辨。

與之作比較,現在GSM用的EFR(Enhenced Full Rate,增強型全速率編碼)採樣頻率為8kHz,語音頻寬為200~3400Hz。

AMR-WB套用于窄帶GSM(全速信道16k,GMSK)的優勢在于其可採用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當網路繁忙時C/I惡化,編碼器可以自動調整編碼模式,從而增強QoS。在這種套用中,AMR-WB抗擾度優于AMR-NB。

AMR-WB套用于EDGE、3G可充分體現其優勢。足夠的傳輸頻寬保證AMR-WB可採用從 6.6kb/s到23.85kb/s共九種編碼,語音質量超越PSTN固定電話。

基本比較

作為數位音樂檔案格式的標準,WAV格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或WMA格式。壓縮方法有無損壓縮,有損壓縮,以及混成壓縮。MPEG,JPEG就屬于混成壓縮,如果把壓縮的資料還原回去,資料其實是不一樣的。當然,人耳是無法分辨的。因此,如果把MP3,OGG格式從壓縮的狀態還原回去的話,就會產生損失。然而,APE格式即使還原,也能毫無損失地保留原有音質。所以,APE可以無損失高音質地壓縮和還原。在完全保持音質的前提下,APE的壓縮容量有了適當的減小。拿一個最為常見的38MBWAV檔案為例,壓縮為APE格式後為25MB左右,比開始足足少了13MB。而且MP3容量越來越大的今天,25M的歌曲已經算不上什麽龐然大物了。以1GB的mp3來說可以放入4張CD,那就是40多首歌曲,已經足夠了!

MP3支持格式有MP3和WMA。MP3由于是有損壓縮,因此講求採樣率,一般是44.1KHZ。另外,還有比特率,即資料流,一般為8---320KBPS。在MP3編碼時,還看看它是否支持可變比特率(VBR),現在出的MP3機大部分都支持,這樣可以減小有效檔案的體積。WMA則是微軟力推的一種音頻格式,相對來說要比MP3體積更小。

格式轉換

軟體介紹:狸窩全能影片轉換器是一款非常好用的音頻轉換器,支持各種音頻格式互相轉換。其次它不單提供多種音影片格式之間的轉換功能,它同時又是一款簡單易用卻功能強大的音影片編輯器!利用全能影片轉換器的影片編輯功能,DIY你自己拍攝或收集的影片, 讓它獨一無二、特色十足。在影片轉換設定中,您可以對輸入的影片檔案進行可視化編輯。例如:截取影片片段、剪下影片黑邊、增加水印、影片合並、調節亮度、對比度等。支持格式:aac、ac3、aiff、amr、m4a、mp2、mp3、ogg、ra、au、wav、wma、mka、flac(無損)、wav(無損)等。

狸窩全能影片轉換器狸窩全能影片轉換器

相關詞條

相關搜尋

其它詞條