顯示具有 音響理論 標籤的文章。 顯示所有文章
顯示具有 音響理論 標籤的文章。 顯示所有文章

2015年7月20日 星期一

Floyd Toole 談喇叭設計

從 Linkwitz 的網站上看到 Floyd Toole - Sound reproduction – art and science/opinions and facts 的連結,很好的整理了喇叭設計的目標和對應的實驗依據,以下是我個人的一些筆記。

  1. 認知科學和心理學是處理主觀的部份,至於電學和機械的量測,則是一種客觀的量測。音響設計的一大部份就是要理解主觀和客觀之間的關係。(4:45)

  2. 任何和人有關的測試,都需要 double-blind,否則光看外型我們就會有先入為主的觀念。一個很有趣的例子是喇叭的低音測試,學理上對低音影響最大的是擺位,所以他們也測試了同樣一支喇叭在不同位置的時候,請人評分。Double-blind 的時候同一支喇叭在不同位置分數會不一樣,但當沒有 double blind 的時候,分數幾乎只跟外觀有關係了。(13:59)

  3. 理論上在不同房間,同樣的喇叭也會有很不一樣的表現,但是double-blind 的主觀評分卻總是能準確的評分喇叭。也就是說,好喇叭在大多數房間都是好喇叭,爛喇叭在大多數房間都是爛喇叭。人耳和大腦是可以處理房間造成的影響的。(17:00 - 21:20)

  4. 在低頻,聲音由喇叭輻射出來的總能量為主,在 10kHz 以上,聲音由 on-axis 主導,在兩個頻率中間,聆聽位置的頻率響應可以用直射音和反射音的總和來預測。(29:15 - 33:00)

  5. on-axis 決定了我們聽到的直射音音色,off-axis 決定了我們聽到的反射音色。因此一支 on-axis 平坦的喇叭,如果場型設計不佳導致聆聽位置聽到的直射音和反射音的總合不佳,是「不能」用等化器來修正的。因為等化器會同時改變直射音和反射音,一個 on-axis 平坦的喇叭經過等化就不平坦了,也就是直射音的音色反而變差了。這段他舉例的是 KEF 105.2 (28:00 - 29:08, 34:00 - 34:30)

  6. 因為錄音師用的監聽設備沒有標準,所以錄音的成品就變得百百種,這時候 tone control 其實很有用 。 (45:55 - 46:50)

  7. 喇叭設計的幾個要求。對所有頻率而言,平坦的 On-axis、平順的輻射場型、平順的 Power Response、沒有共振。1/20 Oct 的量測是必要的,傳統的 1/3 Oct 是不足的、低頻要處理好。(57:15 - 60:05)

  8. 有問題的共振在所有方向都存在,但是可以用 EQ 修正,這是主動喇叭的一大優勢。(61:38 - 61:45)

很可惜只有非常少數的喇叭有給完整的場型量測,之後我想用他分享的這些東西,來檢視 LSR305 這隻喇叭。


Edit 1: 修正一些標點符號:﹝「不能」, (45;55 - 46:50), 沒有共振,,(61:38 - ˊ61:45)

2014年5月17日 星期六

小空間喇叭擺位 - 多反射音

延續前兩篇《小空間喇叭擺位 - 衰減常數》《小空間喇叭擺位 - 反射音量和延遲時間》 ,這篇接著討論怎樣的反射音有可能帶來好處。

首先是 Fig. 9,用語音的清晰程度來評分反射的方向和延遲。結果是延遲愈少清晰度愈高,而無論是多少延遲,都是以 60度 (我猜這是該實驗最大的角度) 效果最好。Fig. 12 用樂曲測試來自不同方向的延遲聽者的評分。結果是 40 - 90 度效果比較好,但這和樂曲有關,該測試中的兩個樂曲一個在 90 度最高分,一個在 90 度沒有特別影響。

結論:來自側面的反射很重要,但是一般房間的反射音量不夠大、延遲也不夠久。Toole 以此論證多聲道的潛力。對我來講,則是讓我對 Dipole 喇叭愈來愈不理解。到底為何 Dipole 喇叭能從聽感空間裏面消失呢?!Dipole 的重點不就在於消除側牆音、強化後牆音?

Fig. 14 in "Loudspeakers and Rooms for Sound Reproduction - A scientific Review" by Floyd E. Toole

多反射之下的 Fig. 6 會變怎樣呢?Toole 直接在兩個模擬的客廳重做了這個實驗,結果為 Fig. 14. 我們可以看到這幾條曲線變得比較平坦,甚至是連感受到有變化的曲線都變得平坦。但是不同的模擬客廳被聽出來反射音的絕對音量有所不同。而且音像變大和被聽出來所需要的音量差距變小了。

Toole 在這個小節的結論是: "The basic audible effects of early reflections in recordings, therefore, seem to be remarkably well preserved in the reflective sound fields of ordinary rooms. There may be reasons to attenuate early reflections within listening rooms, but this, it seems, is not one."

我們就算在一個客廳裡,也是可以聽出來錄音本身的空間音!要注意的是,Precedence effect 是針對音源的方向性,反射所造成的音染、音量增加,我們都還是會感受到的。早期反射最糟糕的狀況就是造成音染,而好的影響則是音像變大、語音辨識度提高。


我自己的推論是,針對早期反射使用散射而不是吸收,也許有潛在好處。一來是一個很多吸收的小空間,我們的大腦會傾向無響室的處理,這時候只要有一點點反射音我們就會聽出來 (Fig. 6  vs. Fig. 14)。相對的,如果是一個正常的客廳,我們反而不容易聽出來有反射音!二來是擴散可能可以降低音染。音染的來源是反射來自於固定延遲造成的 comb filter,透過真正用大質數設計的擴散板,只要深度夠深、寬度夠窄,就有可能增加延遲的分布,進而降低 comb filter 和音染。

在我自己的試驗中,把喇叭 toe-out 之後聲音的空間感有比較好。我推論是因為 toe-out 之後喇叭的輻射場型在側牆方向增加不少、又降低了直射音量。如此一來一往可能就讓側牆反射高到足以造成音像增大的效果。

十分可惜這些實驗都針對比較大的延遲,對於 10ms 以內的延遲著墨不多,這才是小空間會遇到的狀況啊!

2014年5月8日 星期四

小空間喇叭擺位 - 反射音量和延遲時間

延續上一篇《小空間喇叭擺位 - 衰減常數》,這一篇我想把重心放在反射音上面,尤其是啟發我非常多想法的圖六。話不多說,直接上圖。Toole 中間用的很多文字討論反射音的各種影響,非常建議仔細閱讀思考,但是這邊我只擷取討論音像的部分,也加上很多我個人的理解和詮釋。


Fig. 6 in "Loudspeakers and Rooms for Sound Reproduction - A scientific Review" by Floyd E. Toole

這張圖橫軸是反射音的延遲,縱軸是反射音的音量。直射音為 0dB。最下面這條曲線是聽不出來有反射音的曲線。上面那條是音像聽起來變大的曲線,再上面兩條幾乎重疊的曲線,則是反射音聽起來像是來自另外一個喇叭的曲線。最上面那條則是反射音和直射音的音量聽起來差不多大的曲線,也就是有名的 Haas Curve。這些曲線代表的其實都是同一個現象,那就是我們的聽覺主要是被直射音影響,現在這個現象稱為 "Precedence Effect"。Haas 的結果告訴我們,反射音要非常大聲才會聽起來和直射音音量一樣,而且相對於不同的延遲,大概都是要大聲 10dB 左右。

剩下幾條曲線就非常有趣了,整體而言隨著延遲越多,越小的音量還是會有影響,斜率大概是 -30dB/80ms。這表示隨著音響室越大 (延遲自然大),越需要吸收反射音,否則反射音很容易被聽出來。這也是我去聽室內現場 Rock 演唱會的心得:音效非常好,但是很明顯是來自於兩支喇叭。不過這裡的討論是針對小空間,當空間大到一個程度,我們就該改用音樂廳的設計方式來調整出 diffused field 讓房間裡的大多數人都有足夠而清晰的音量。

那反射音量到底會多大呢?這受到好幾個參數的影響,牆壁材質、喇叭到側牆的距離、 喇叭本身的輻射場型。讓我用最理想的模型做個估算。就還是假設為全向性點波源,先考慮全反射的側牆造成的反射音量。假設聆聽位置到喇叭連線的距離是 d,正三角形擺位、喇叭離側牆的距離為 h,那可以畫出下面這張圖。其中虛線的星星是利用 Image Theory 求得等效反射波源的位置。

只有一面側牆造成的反射音。

用畢氏定理就可以求得喇叭和鏡像喇叭到聆聽位置的距離,兩個距離可以透過 -3dB/dd 的方式得到音量差,兩個距離的差則可以轉換成延遲的時間。結果如下圖:

離側牆不同距離造成的影響。三條線分別代表喇叭連線到聆聽者的距離。

首先我們可以發現,在我這樣的假設情境中側牆造成的反射音時間差和喇叭到聆聽者的距離關係很小。主要是由喇叭到側牆的距離決定的。音量的變化就比較有趣了,距離越近的時候斜率越大。因此聆聽距離越小,喇叭離側牆可以不用那麼遠就有足夠的衰減,這大概就表現在 Near Field Monitor 的使用建議上。我家客廳聆聽距離大概是 2.5m,左聲道離側牆只有 40cm 左右,右聲道距離牆壁約 1.5m,因此左聲道對應的是 (2ms, -1dB), 這大概是略高於會聽到有另外一支喇叭的曲線。我的右聲道對應的是 (6ms, -2.5dB),這位置大概是略高於音像變大的曲線。

以這樣的估算來看,我應該在左聲道的側牆加上 5dB 以上的吸收,聽起來就不會像另外一個喇叭在牆外。另外一個觀察是反射音量肯定是低於直射音的,因此注意圖上這些曲線和 0dB 的交點,可以發現 3ms 是個非常關鍵的延遲。只要側牆離喇叭有 75cm 以上,聽起來就不會像是牆外有個喇叭了。

複雜的圖,但是簡單的結論:「喇叭離側牆至少 75cm」 。至於喜不喜歡音像變大,這就是個人口味的問題了,不喜歡的話就在側牆增加一些吸收,讓初階反射音低於最下面那條曲線。另外一個方式是使用大質數做出來的大面積無方向性擴散板 (並排多個小質數擴散板會造成整體擴散有方向性)。但是絕對不能完全沒有側牆反射音,這是我們判斷距離最重要的工具。無響室放出來的聲音是沒有距離感的 (請看Toole paper 的 Sec 2.2)。

以上是一個反射音的狀況,多個反射音、反射音來自的角度、和重低音配置,下次再說~~


2014年4月27日 星期日

小空間喇叭擺位 - 衰減常數

在網路找到 Floyd E. Toole 寫的一篇 review paper,主題是 "Loudspeakers and Rooms for Sound
Reproduction - A Scientific Review*",內容非常精彩,對於一般家用空間的喇叭設計、擺放,有很大的啟發,我決定分幾篇 blog 分享我閱讀後的心得感想。


Fig. 2 in "Loudspeakers and Rooms for Sound Reproduction - A scientific Review" by Floyd E. Toole

我們先想像一個在戶外開放空間擺在地上的理想喇叭 (同時可以朝所有方向輻射能量),我們把離喇叭固定距離 R 的一個球面畫出來,根據能量守衡,所有從喇叭發出來的能量,在固定時間 R/c ( c = 340m/s @ 攝氏 15 度 ) 之後,必定要通過這個半球面 (先簡單的假設地板不會吸收能量)。因此,隨著距離增加兩倍,球表面積增加4倍,所以單位面積通過的能量只有原先的四分之一。能量的衰減要換成 dB 用的是 10*log10,這就是 -6dB/(double distance) 的衰減,也就是 Fig. 2 裏面那條 direct sound 的線。

這條趨勢線對應的是,一個聆聽者離所有牆面都很遠又離演奏者很近時,他改變距離時音量的變化。但是在傳統音樂廳裏面,重點在於讓所有人(無論距離) 都接收到的足夠的音量,這樣才能清楚的聽出來台上的人發出的聲音。因此,音樂廳的設計是要利用牆面的形狀和大小,讓所有位置在「統計上」有類似的音量。這就是為何 Fig. 2 在距離很大的時候,音量並不隨著距離而改變了。音樂廳設計的時候,第一排所在的位置必須在  "critical distance" 以上,這個距離和頻率、樂器的指向性都有關係,先不與詳細的討論。

這個現象又隱含了另外兩個意義。第一,聽眾和指揮聽到的聲音會非常不一樣,指揮聽到的幾乎是直射音 (direct sound),我們聽到的是散射音 (diffuse field)。第二是我們在音樂廳裏面享受到的音樂,其實都是反射音啊!搭配我們大家的現實經驗,戶外不插電演奏其實聲音並不好,太乾了。這似乎暗示我們適當的反射音是必要的。無論是錄音師在高級音樂廳錄下來的當時現場反射音、混音師加上的 delay/reverb 效果,或是我們擺放喇叭所在的空間,本身的反射音。

當代的錄音室設計是把所有反射音都吸收掉,全部交給混音師人工製造。但這並不是錄音的唯一選擇,在一個高反射/散射的環境裡,如果聲音本來聽起來就很漂亮,直接這樣錄也是一個選擇啊!以迪士尼放出來的 Let it go 25 國語言錄音為例,加泰隆尼亞語 (Catalan) 就是在音控室而不是錄音室錄的。

Fig. 4 in "Loudspeakers and Rooms for Sound Reproduction - A scientific Review" by Floyd E. Toole
但是我們的客廳又不像音樂廳這麼大,到底聲音是怎麼分佈的呢?量測結果告訴我們是 -3dB/dd 的衰減。這其實跟居家環境天花板相對低有關係。我在開頭的時候以戶外的球面擴散為例,推倒出 -6dB/dd 的衰減。其實室內環境也是可以用類似的方式推導出來的。想像我們的地板和天花板都是結實的水泥,而且面積非常大。這時候能量無法透過上下傳播出去,只能在這個夾心中間往水平的方向傳播。圓柱面積和半徑成正比,我們就得到了 -3dB/dd 的衰減常數了。

類似於音樂廳的例子,當我們離喇叭距離很近、離天花板和地板都很遠的時候,聽到的當然是直射音的 -6dB/dd,等到距離退到一個程度之後,則變成 -3dB/dd。以這張圖的量測結果,距離遠到六七公尺都還是符合這個衰減常數的。

以上是第一部份,表達了反射音的重要性,以及在不同空間環境下,音量和距離的關係。有很多學者利用無響室研究了反射的音量、延遲時間對於聽感的影響,下一篇我想討論如何利用這些學理結果,來理解居家環境中的反射音。

2013年10月26日 星期六

音場的來源

因為我自己就算用耳機聽 binaural 錄音,定位了不起是離頭 30 公分,聲音也無法達到正前方,總而言之就是沒有真實的距離感,所以開始查閱了一些資料。David Griesinger 的網站是主要資料來源,但是 Linkwitz 的文章整理的非常好,而這個過程中我也發現音場重現也跟錄音的方式很有關係,Deltamedia 則是把各種錄音技巧的優缺點整理地很好,值得和 Linkwitz 的文章來回參考。

結論性地講,現場聽音樂,人腦感受到的音場來自三個要素。針對低頻的聲音,人腦會去注意該樂器的聲音抵達兩隻耳朵時間的不一樣,這是 Interaural-Time-Difference (ITD)。針對高頻,兩隻耳朵收到的音量會因為頭的形狀而有不同,這是 Interaural-Level-Difference (ILD)。最後,人只用一隻耳朵其實也是可以聽出方向的,那是因為外耳的形狀使得同樣的樂器從不同方向發出的聲音,抵達耳朵的波形會略有變化,我們就從這個波形的變化聽出方向來。從頻率的角度來看,則表示頻率響應是方向的函數,這是 Spectral difference,最後這個其實人腦在後面做了很多事情,David Griesinger 的投影片解釋的很清楚。

ITD、ILD 則跟很多針對耳機的播放軟體、耳擴裏面內建的 crossfeed 有關係,有很多人說 crossfeed 可以改善用耳機聽一般錄音 (非 binaural) 時候的空間感,有人甚至說能改善音場的前後縱深。但實際玩過就會知道,crossfeed 對於一些早期 ( ~1960) 的雙聲道錄音效果很好,但是對於現代的錄音好像就沒啥特別效果 (至少對我而言)。原因是很多早期的錄音其實是用單聲道 pan 成雙聲道的。把單聲道麥克風收到的聲音,大多數從右邊喇叭放出來,播放的時候就會好像聲音來自右邊,但是如果聲音「只從」右邊喇叭放出來的時候,喇叭聽起來還可以,耳機聽起來就會非常不舒服。

crossfeed 的效果是把左右聲道的高頻和低頻,先經過延遲 (模擬 ITD),再經過不同的衰減 (模擬 ILD) 之後放到對面去,來讓聲音比較接近人耳聽到的樣子。但是現在有很多的雙聲道錄音技巧,其實已經內含 ILD 甚至是 ITD 了。以古典音樂最常見到的 ORTF 來講,兩隻收音場型是心型的麥克風,距離十七公分,開角 110 度,這樣雙聲道收下來的聲音通常用喇叭放出來就非常棒,那個十七公分就是要模擬人耳的距離,因此會在兩耳間產生正確的時間差 (ITD),110 度開角的心型收音場型,則不同方向來的聲音在兩隻麥克風收到的音量會不一樣,根據 Linkwitz 的計算,ORTF 的音量差大約可以區分加減 34 度的以內的方向。這個數字很有趣,不知道是不是為了要和正三角形的喇叭擺位有對應?這部份我需要進一步找資料。

ORTF 的主要缺點也是來自於那個十七公分,早期的雙聲道收音麥克風是擺在同一個平面的 (XY 錄音),只利用角度的不同來達到音量的差異。擺在同一個平面的好處是,直接把兩聲道的聲音相加就可以得到單聲道的聲音,在早期的廣播時代,單聲道的音質也是很重要的。ORTF 則不能這麼簡單的把兩聲道的聲音相加,因為那個十七公分會造成 comb filter,讓聲音的頻率響應改變很多。

比較的起來的話:
Mono pan 到底 = 不舒服。
Mono pan 部份 = 所有頻率的 ILD 都一樣,並不自然,但是比上面好很多。
XY 錄音 = 不需要錄音師控制 pan,直接收到 ILD,但還是所有頻率的 ILD 都一樣。
ORTF 錄音 = ILD + ITD,但是所有頻率的 ILD 都一樣。

我推測用耳機搭配 crossfeed 聽 ORTF 錄音的時候,ITD 應該設為零,因為 ORTF 已經內含了,不過調整頻率點和高低頻不同的衰減,可能還是可以提升定位感。至於聽早期 XY 的錄音品,則應該要加上適當的 ITD。如果遇到 mono pan 出來的 stereo,那設定的 ILD 有可能需要根據不同的錄音品調整,畢竟當時錄音師 pan 了多少,實在沒人知道。最後, http://www.ohl.to/ 上面的 head-fit 是設定 crossfeed 很不錯的工具。他的另外一篇文章用淺顯易懂的方式解釋了 crossfeed,也推荐了用 Charles Mingus 的 Ysabel's table dance 作為調整 crossfeed 的參考曲目。這是 1957 年的錄音但是音質相當好,我是從 Amazon 上買 mp3 單曲回來聽的,雖然不是很理想的檔案格式,但是拿來調整 crossfeed 我覺得夠用了。這個曲子的特點是有很多樂器,涵蓋的頻率範圍非常廣,尤其是右邊的響板可以高到 7-9KHz,適合拿來調整高頻的 ILD,薩克斯風和小喇叭則分別在左右聲道,銅管樂器的基頻處在 crossfeed 的低頻、嘹亮的音色在 crossfeed 的高頻,仔細比較這兩個樂器的音色是否自然可以拿來調整頻率點,最後是左邊的大鼓,可以調整低頻的 ILD 和 ITD,這首曲子真的是相當不錯的調整標的。而調整的目標是要做到定位正確但是音色沒有改變,不過我的腦子拒絕只用 ITD/ILD 把東西放到前面,我不管怎麼調都是在後面 (雖然可以從正側面調整到左右後方),因此效果能有多好,我實在是不知道。


最後講到 spectral difference,唯一能把這個變化正確錄下來的,只有 binaural 錄音。以 David Griesinger 的投影片內容,如果我們把一個麥克風透過管子「接觸耳膜」,直接錄製耳膜上的音壓,然後用這個特殊的麥克風來 EQ 耳機,使得播放的時候能重現耳膜上在錄音時候的聲音,那就可以獲得完整的「原音重現」,包括正確距離和方向的音場。缺點?你要親自錄親自聽,別人聽不一定有這樣的效果。第二,當我們轉頭的時候方向就會崩潰,因為我們的腦子預期聲音還是來自前面,但實際上音場會跟著頭轉,這種時候就需要 head tracking。

Linkwitz 則是基於這個概念,但是用喇叭而不是耳機達成音場。前面說過 spectral difference 來自於外耳的形狀,因此用喇叭播放的時候,兩隻喇叭是在我們的前面左右,他們發出來的聲音自然的會透過每個人自己的耳朵,達到 spectral difference。他個人錄製現場音效的一個方式,就是在眼鏡上裝置兩個無方向性的麥克風,注意是在眼鏡上而不是在耳朵裡,所以錄製的時候會包含 ILD、ITD,也因為他的頭在那,也會包括不同頻率正確的 ILD,但是 spectrum difference 並沒有被錄製進去。他認為這樣的錄製結果用喇叭播放的時候,效果就很好了,他也有賣用類似技巧錄下來的測試 CD。我對這邊其實有點疑惑,因為我們自己的耳朵和自己的頭會提供完整的 ILD、ITD 啊,為什麼 spectral difference ,要用自己的耳朵達成,但是前兩者卻是錄音的時候就要有呢?我可能要繼續研讀 Linkwitz 的網站來理解他的想法。

無論如何,ORTF 錄音搭配 Linkwitz 設計的全頻場型固定的喇叭,似乎已經能達成喇叭在房間裏面消失,就像在現場開了一扇大窗戶一樣,這是 The Audio Critic 的評語

PS. ORTF 部份是我的猜想,因為 Linkwitz 對於很多歐洲網路古典音樂電台的錄音頗滿意,也在我開頭提到的文章中說明某種 XY 錄音是後續調音的 baseline (他並沒有嚴格區分 XY/ORTF )。

2012年6月22日 星期五

Reading: Speaker and Room - 2

The room acoustics wiki page defines things pretty clear. There are four regions regarding the room. The first region is the frequencies below the lowest resonance frequency of the room. The second one starts from the first resonance frequency to the Schroeder frequency. Next one is a transition region and extend about two octives beyond. Lastly, it is the ray-like region.

Schroeder frequency is the critical point between ray-like behavior and room mode behavior. There's a empirical formula to derive the frequency using room volume and the RT60, the time took the signal to decay to a non-audible level, which can be measured using REW, a free software. And these two articles, Part I and Part II, give some recommendation upon using sub-woofer considering the facts about Schroeder frequency and the human capability to localize a sound source. In short, he suggest to use a 80Hz cross-over with equalization. He also pointed out that the amplitude of a room mode across the whole room will vary a lot, thus the EQ will only works at a particular listening position, or a sweet region at best.

Under the lowest mode, the room only experiences static pressure, which means open baffle speaker at this operating range will produce nothing you can hear, cause the two opposite phase waves totally cancelled in the room. We either choose a wall mount speaker to leave the backward wave outside the room or use a closed cabinet to keep the backward wave inside another small box. The latter explains why most sub-woofer are close cabinet design just in case you have a very small room.

From the first resonance frequency to the Schroeder frequency is the mode dominant operating band. Bass trap and room treatment are some tools we can use to tame the crazy null and peaks in this range. I tend to believe a normal living room with all the things you like within will decrease the quality factor of the resonance modes and leads to dull peaks and nulls. A slow variation in the frequency response may be cured by equalization but a small room with a lot of sharp peaks and dulls cannot be cured using EQ. They are so dense in spectrum thus the 1/3 octive EQ cannot catch it. Some room treatment or bass trap is must.

For the last region, the acoustic radiation pattern of the speaker matters and we will try to tame all reflections, but special effort should be put on those reside within 2ms of the direct sound,which will make the image fuzzy. Broadband absorbing panel , carpet and wall decorations will help in this region.

At last, comb filter. It is the inference from a point source in front of a flat wall. The reflected wave will constructively or destructively interfere with the original wave and result in dense peaks and nulls around low frequencies. On cure is to use a diffusive front wall (in listener's point of view). Another is a dipole speaker with optimal listening position, where your distance to the back wall is the same as the speaker to the front wall. I learned this again from Linkwitz Labs Q31. The last resort is to put the speaker right against the wall. This may introduce some unwanted room mode but some speaker really shines at this position, like Big is Better.

Regarding RT60, this article from RealTraps has a few insightful notes. The key point is that audio engineering process the sound with RT60 of the listening room in mind. For a home theater with 5.1 or 7.1 surround system, a short RT60, around 200ms~300ms is appropriate since the "echos" will comes from the satellite speakers but not the room. For most stereo music, 500ms is a good number.

Let me turn back to my one wavelength criteria. I tried to argue that when the wavelength is considerable to the room size, the far field analysis gives us little information and the coupled speaker/room combination must be considered. I feel the criteria is not that appropriate since it is enforce to have a valid large spherical Hankel function approximation but not to deal with room mode. The Schroeder frequency is the better indicator. After reading the two articles regarding Schroeder frequency, I believe that stereo sub-woofer is the way to go but the placement must be corrected. They should be placed to deliver the flattest bass response and the direct path length difference between the sub-woofer and the mid-range to the listener can be corrected by digital delay. I feel this is still a must since it will effect the time step response a lot. I want a fast bass but not listening to a bass single tone that builds up energy in the room. In such an approach, stereo sub-woofer with digital delay should keep the image good beyond 80Hz (I don't know where this number comes from) and also have a smooth bass below Schroeder frequency due to the placement.

2012年6月17日 星期日

Reading: Speaker and Room

I am thinking about to DIY my audio system and digging into the speaker design as the first step. I am intrigued by open baffle design cause people said it gives a very airy and open sound. Linkwitz Lab has a very detailed analysis and discussion about dipole speaker and open baffle is one of many implementations.

He designed the speaker with equalization in mind thus he operate the speaker BELOW the first resonance frequency. This is a very different approach. I heard people around different discussion boards saying that larger baffle gives a deeper bass. It suggests they are operating ABOVE the first resonance frequency.

Once you operate above the first resonance, the oscillation in the frequency response comes naturally. As the length equals to a half wavelength, the waves from the front and back add up. When the length equals a full wavelength, the waves cancel. This issue is not that severe using a real driver comparing to the piston model analyzed since the speaker cone gives an asymmetrical response in front and in the back. The bracket and the magnet of the speaker also reduces the airflow on the back size, although the bracket and the cone may generate another resonance and a notch filer is required.

For my understanding in antenna, the distance from the observer to the source has to satisfy two conditions for the far field approximation to be valid. First, 2D^2/lambda, where D is the largest dimension of the radiating source and lambda is the operating wavelength. Second, they have to be at least one wavelength apart. Assuming the speakers are 2.4m apart, as suggested in the room acoustics section on Linkwitz lab, and a triangle listening position, the one wavelength criteria is about 140Hz. I believe the acoustic property is dominated by room mode and near field property of the speakers below this frequency. It leads to the conclusion that a sub-woofer should be used with a 140Hz crossover frequency. Please bear in mind that I am assuming a pretty small room and a pretty close listening position. Once you move to a large room, not only the room mode frequency decreases but also the far field is still valid. Things are back to acoustic pattern again.

Art Ludwig's website gives excellent discussion about room mode based on his own image theory code. Mr. Ludwig and Mr. Riley are on the two ends of a spectrum regarding listening room. Mr. Ludwig has a nearly empty listening room with a lot of treatment while Mr. Riley uses a normal living room. The analysis performed by Mr. Ludwig shows that a "bad room" is not much worse than a "good room" but both of them are far from an optimal flat response. I didn't find the suggesting regarding this fact. On the other hand, Mr. Riley believes that human brain can process a "uniformly" excited room with normal furniture and decoration inside. Since I don't have a room dedicated for listening, I can only believe what Mr. Riley said and will choose to use stereo sub-woofers along the two side walls at a distance to the listening position the same as from the main speaker to the listening spot. This placement is learned from the Pluto+ sub-woofer. The position is chosen to lower the excitation of the room mode (instead of placed at the corner of the room to excite the mode to the most level) and keep everything symmetrical. Symmetry is a beauty and it even works for near field. I would love to keep it whenever I can.

I take the advice from Mr. Riley and try to keep the main speakers at least 1m away from ANY wall. I will also keep the room as comfortable as I like.