跳转到内容

感覺系統/聽覺系統/音調處理

维基教科书,自由的教学读本

音調感知

[编辑]

本節回顧了聽覺神經科學的一個關鍵主題:音調感知。我們假設對聽覺系統有一些基本的了解,因此鼓勵讀者首先閱讀上述 '聽覺系統剖析' 和 '聽覺信號處理' 部分。

簡介

[编辑]

音高是一種主觀感知,由具有近似週期性的聲音引起。對於許多自然發生的聲音,聲音的周期性是音調的主要決定因素。然而,聲學刺激和音調之間的關係是非常抽象的:特別地,音調對於其他聲學參數(例如響度或音色的變化非常穩健,這兩者可以顯著改變聲學波形的物理特性。例如,在沒有任何共享頻譜分量的聲音可以引起相同音調的情況下,這尤其明顯。 因此,必須從跨多個頻率信道表示的頻譜和/或時間線索中提取與音調相關的信息。

對聽覺系統中的音調編碼的研究主要集中在識別反映這些提取過程的神經過程,或者找到這種過程的“終點”:聽者所感知的音調的明確,穩健的表示。這兩項努力取得了一些成功,有證據表明假設的'音高區域'中的'音高選擇性神經元'。然而,這些區域的活動是否真正與音高有關,或者它們是否僅僅表現出與音高相關的參數的選擇性表示仍然存在爭議。一方面,證明響應於許多音調喚起聲音的特定神經元或神經區域的激活,通常具有其物理特性的顯著變化,提供了令人信服的相關證據,即這些區域確實編碼音高。另一方面,證明這些神經元代表音高的因果證據很難,可能需要結合體內記錄方法來證明這些反應與音高判斷(即心理物理反應,而不僅僅是刺激週期性)的對應關係,以及直接操縱這些細胞中活性的變化表明可以預測的俯仰感覺偏差或損傷。

由於音高相當抽象,我們不會立即深入研究這個尚未解決的活躍研究領域。 相反,我們開始討論音調感知的最直接的物理對應物 - 即聲音頻率(對於純音調),更一般地說,刺激週期性。 具體而言,我們將區分並更具體地定義週期性和音高的概念。 在此之後,我們將簡要概述聽覺系統可以實現的主要計算機制,以從聲音刺激中提取這種與音調相關的信息。 隨後,我們概述了耳蝸中的音高參數的表示和處理,升降的皮質下聽覺通路,以及最後在初級聽覺皮層及其他區域中更具爭議性的發現,並評估這些中的“音高神經元”或“音高區域”的證據。 皮質區域。

週期性和音調

[编辑]

音高是一種新興的心理物理屬性。音高的顯著性和'高度'取決於幾個因素,但在諧波和基頻的特定範圍內,稱為'存在區域',音高顯著性很大程度上取決於聲音片段重複的規律性;通過重複率來調節高度,也稱為調製頻率。能夠引起音調感知的聲音集合是多樣的並且在頻譜上是異構的。許多不同的刺激 - 包括純音,點擊訓練,迭代的波紋噪聲,調幅聲等等 - 可以喚起音調感知,而另一種聲學信號,即使具有與這種刺激非常相似的物理特性也可能不會引起音調。大多數自然發生的音調喚起聲音是諧波複合體 - 聲音包含頻譜的頻譜,它是基頻F0的整數倍。音調研究中的一個重要發現是'缺失基波'現象(見下文):在一定頻率範圍內,F0處的所有光譜能量都可以從諧波複合體中去除,並且仍然會引起與F0相關的音高。人類聽眾[1]。這一發現似乎推廣到許多非人類聽覺系統。[2][3].

缺少基本的音高 音頻攝譜儀為'瑪麗有一隻小綿羊'的旋律。 (左) 旋律演奏純音(基本), (中) 旋律演奏基調和前六音調泛音,(右) 旋律演奏只有諧波泛音,基頻頻譜能量消除。 如在左邊的相應音頻剪輯中所示,這三個旋律的音色不同,但音調不變,儘管缺少基本和純音調旋律沒有共同的頻譜分量。

由於兩個原因,'缺失的基本'現像很重要。 首先,它是評估特定神經元或大腦區域是否專門用於音高處理的重要基準,因為應該預期這些單元顯示反映F0(並因此音高)的活動,而不管其是否存在於聲音和其他聲學參數中。 更一般地,'俯仰神經元'或'俯仰中心'應該響應於引起俯仰高度的特定感知的所有刺激而顯示一致的活動。 正如將要討論的,這已經成為識別假定音高神經元或區域的一些分歧的根源。 其次,我們可以感知到對應於F0的音高,即使它在聽覺刺激中不存在也提供了強有力的證據來反對大腦實現'選擇'F0以直接推斷音高的機制。 相反,音調必須從時間或頻譜提示(或兩者)中提取。[4].

音調提取機制:頻譜和時間線索

[编辑]
已解決和未解決的諧波 複雜音調的示意光譜,激發模式和模擬基底膜(BM)振動,F0為100 Hz,等幅諧波。 從激勵模式和BM振動中可以看出,高階諧波是“未解決的” - 也就是說,沒有單個諧波的有效分離。 (描述改編自原作者。可在: http://www.europeanmedical.info/auditory-nerves/resolved-and-unresolved-harmonics-341-defining-resolvability.html)

這兩個線索(頻譜和時間)是兩類主要音調提取模型的基礎[4]. 第一個是時域方法,它使用時間線索來評估聲音是否由重複段組成,如果是,則重複率。通常提出的這樣做的方法是 自相關。 自相關函數主要涉及找到兩個採樣點之間的時間延遲,這將給出最大相關性:例如,頻率為100Hz(或週期,T = 10毫秒)的聲波如果採樣10將具有最大相關性10相隔幾毫秒。對於200Hz波,產生最大相關性的延遲將是5毫秒 - 但也是10毫秒,15毫秒等等。因此,如果對F0 = 100Hz的諧波複合波的所有分量頻率執行這樣的函數(因此在200Hz,300Hz,400Hz等處具有諧波泛音),並且得到最大相關性的所得時間間隔被求和,它們將集體'投票'10毫秒 - 聲音的周期性。第二類音調提取策略是頻域方法,其中通過分析聲音的頻譜來提取音調以計算F0。例如,“模板匹配”過程 - 例如 ‘諧波篩’ - '建議聲音的頻譜簡單地與諧波模板匹配 - 最佳匹配產生正確的F0[5].

兩類解釋都有局限性。頻域方法要求解析諧波頻率 - 即,將每個諧波表示為不同的頻帶(見右圖)。然而,由於較高頻率的生理表示中較寬的帶寬(基底膜的對數音調排列結構的結果)而未解決的高次諧波仍然可以引起對應於F0的音調。時間模型沒有這個問題,因為自相關函數仍應產生相同的周期性,無論該函數是在一個頻道還是多個頻率信道中執行。然而,難以將音調喚起頻率的下限歸因於自相關:心理物理學研究表明,我們可以從低於30Hz的基本缺失的諧波複合體中感知音調;這相當於超過33毫秒的採樣延遲 - 遠遠超過神經信號通常觀察到的~10毫秒延遲[4].    

正弦相 (左) 交替相 (右) 諧波 這些複合物具有相同的F0(125Hz)和相同的諧波數,但右側複合物的間距比左側複合物的間距高一個八度。 兩種複合物在3900和5400Hz之間過濾。 (原作者的描述。可在: http://www.europeanmedical.info/auditory-nerves/resolved-and-unresolved-harmonics-341-defining-resolvability.html)

確定聽覺系統採用這兩種策略中的哪一種的一種策略是使用交替相位諧波:在正弦相位中產生奇次諧波,在餘弦相位中產生偶次諧波。由於這不會影響刺激的光譜內容,因此如果聽者主要依賴於光譜線索,則不應發生音調感知的變化。另一方面,時間包絡重複率將加倍。因此,如果採用時間包絡線索,則聽眾對交替相位諧波感知的音調將是對具有相同頻譜成分的全餘諧波感知的音調的高度(即,頻率的兩倍)。心理物理學研究已經研究了音高感知對不同F0和諧波範圍內的這種相移的敏感性,提供了人類[6]和其他靈長類動物[7] 採用雙重策略的證據:頻譜線索用於較低階,解析的諧波,而時間包絡線索使用更高階,未解決的諧波。

在上行性聽覺路徑提取音高

[编辑]

據研究,在人類音高辨別最小可覺差 在1%以下[8]. 鑑於對音高變化的高靈敏度,以及頻譜和時間提示都用於音高提取的證明,我們可以預測聽覺系統以高度精確的方式表示聲學刺激的頻譜組成和時間精細結構,直到這些表示最終明確地傳達週期性或音高選擇性神經元。

電生理學實驗已經在上升的聽覺系統中發現了與這一概念一致的神經元反應。從耳蝸的水平,響應於聽覺刺激的全景映射的基底膜(BM)運動建立了沿BM軸的頻率成分的 位置代碼 通過將聽覺神經纖維(ANF) 鎖相 到其響應的頻率分量,進一步增強了這些表示。用於頻率組成的時間表示的這種機制以多種方式進一步增強,例如毛細胞/螺旋神經節細胞突觸的橫向抑制[9],支持這種精確表示對於音調編碼是關鍵的概念。

因此,通過該階段,ANF的鎖相時間尖峰模式可能攜帶週期性的隱式表示。這是由Cariani和Delgutte [10]. 直接測試的。通過分析貓的ANFs中所有階段間穗間隔(ISI)的分佈,他們發現最常見的ISI是刺激的周期性,並且這些分佈的峰均比增加了複雜的刺激喚起更多顯著的音調感知。基於這些發現,這些作者提出了“主導區間假設”,其中全階ISI的匯總代碼對周期性進行“投票” - 當然,這一發現是ANF鎖相響應的必然結果。此外,有證據表明頻率成分的地方代碼也很重要。通過將低頻刺激與高頻載波交叉,Oxenham等人將低頻正弦波的時間精細結構轉換為沿著BM的更高頻率區域。[11]這導致了音高辨別能力的顯著受損。因此,位置和時間編碼都表示ANF中的音調相關信息。

聽覺神經將信息傳遞給耳蝸核(CN)。這裡,許多細胞類型以不同方式表示與音調相關的信息。例如,許多濃密細胞似乎在聽覺神經纖維的射擊特性方面幾乎沒有差異 - 信息可能被帶到更高階的大腦區域而沒有顯著的改變[4]。特別感興趣的是腹側耳蝸核中持續的切碎細胞。根據Winter及其同事的觀點,這些細胞中的一階尖峰間隔對應於迭代波紋噪聲刺激(IRN)的周期性,以及餘弦相和隨機相位諧波複合,與聲級完全不變[12].。雖然需要進一步表徵這些細胞對不同引發音調的刺激的反應,但是因此有一些跡象表明音調提取可以早在CN的水平開始。

在下丘(IC)中,有一些證據表明神經元的平均反應率等於刺激的周期[13]. 。隨後的研究比較了IC神經元對同相和交相諧波複合體的響應,表明這些細胞可能對整體能量水平的周期性(即包絡)有反應,而不是真正的調製頻率,但目前尚不清楚這僅適用於未解決的諧波(如心理物理實驗所預測的)或解決的諧波[4]。關於IC中周期性的表示仍然存在很多不確定性。

在聽覺皮層中進行音調編碼

[编辑]

因此,在整個上升的聽覺系統中存在增強F0表示的趨勢,儘管其精確性仍然不清楚。然而,在上行聽覺通路的這些皮質下階段中,沒有證據表明一致地編碼對應於感知音調的信息。這種表徵可能發生在'較高'的聽覺區域,從初級聽覺皮層向前。

實際上,病變研究已經證明了聽覺皮層在音高感知中的必要性。當然,對聽覺皮層損傷後的音高檢測的損害可能僅僅反映了皮質的被動傳遞作用:皮質下信息必須“通過”以影響行為。然而,惠特菲爾德的研究證明,情況可能並非如此:雖然剝皮貓可以重新訓練(在他們的聽覺皮層消融後)以識別由三個頻率成分組成的複雜音調,但是動物選擇性地失去了這種能力。將這些音調推廣到具有相同音高的其他復合物[14]。換句話說,雖然諧波成分可能影響行為,但諧波關係(即音高線索)不能。例如,受損動物可以正確地響應100Hz的純音,但不會響應由其諧波泛音(200Hz,300Hz等)組成的諧波複合波。這強烈地表明聽覺皮層在進一步提取與音高相關的信息中的作用。

早期對初級聽覺皮層的MEG研究表明A1含有一個俯仰圖。這是基於以下結果:純音及其缺失的基波諧波複合體(MF)在相同位置引起刺激誘發激發(稱為N100m),而MF的分量頻率在不同位置誘發激發[15] 。然而,這些觀點被使用更高空間分辨率技術的實驗結果所掩蓋:局部場電位(LFP)電生理學(MUA) 證明了映射A1是同位素 - 即基於神經元的最佳頻率(BF),而不是最好的'音調'[16].然而,這些技術確實表現出反映提取時間和光譜線索的不同編碼機制的出現:時間包絡重複率的鎖相表示被記錄在音調圖的較高BF區域中,而點擊線的諧波結構被表示。因此,在較低的BF區[17]中,可以通過該階段進一步提高瀝青提取的提示。

多峰神經元的示意圖 藍色虛線顯示了具有最佳頻率(BF)在500Hz附近的“單峰”頻率選擇性神經元的經典調諧曲線,如該神經元對該BF周圍的頻率的最大響應所示。 紅色實線顯示由Kadia和Wang(2003)鑑定的多峰神經元的示意性反應。 除了300Hz的BF之外,該神經元還被600Hz和900Hz的音調激發 - 即與主BF的諧波關係的頻率。 雖然這裡沒有說明,但是這些神經元對諧波複合物的響應(在這種情況下,例如由300,600和900Hz組成)通常具有累加效應,引起響應大於BF處的純音(即, 單獨300Hz)。 見參考文獻[18]

Kadia和Wang在狨猴的初級聽覺皮層中描述了可以促進這種增強的神經元底物的實例[18]。這里大約20%的神經元可以歸類為'多峰'單元:具有多個頻率響應區域的神經元,通常是諧波關係(見右圖)。此外,激發這些光譜峰中的兩個,顯示出對神經元反應具有協同效應。因此,這將有助於提取聲刺激中的諧波相關音調,允許這些神經元充當用於提取頻譜提示的'諧波模板'。此外,這些作者觀察到,在大多數'單峰'神經元(即在其BF處具有單個光譜調諧峰的神經元)中,次級音調可能對神經元對其的響應具有調節(促進或抑制)作用。 BF,同樣,這些調製頻率通常與BF諧波相關。因此,這些促進機制可以適應某些諧波分量的提取,而通過抑制調製來抑制其他頻譜組合可以促進與其他諧波複合或諸如寬帶噪聲的非諧波複合的消歧。

在人顳上平面上推定'音調區'。 (A)左半球的側視圖,STG顯示為紅色。 (B-D)去除大部分頂葉皮質後左側顳上平面的俯視圖。 PP,HG和PT分別以藍色,黃色和綠色表示。 主要溝槽以黑色標出(FTS,第一橫溝; SI,溝中間; HS,Heschl's溝; HS1,第一Heschl's溝; HS2,第二Heschl's溝)。 小圖包括分別具有一個HG的半球,HG的不完全分離和兩個HG(B-D)。

然而,鑑於在整個皮質下聽覺系統中已經證明了增強F0的趨勢,我們可能期望必須更接近皮層中更明確的音高表示。神經影像學實驗已經探索了這一觀點,利用了音高的緊急質量:減法方法可以識別大腦中響應音調喚起刺激而顯示 功能性磁共振成像 響應的區域,但不能識別具有非常相似光譜特性的另一種聲音,但是不會引起音調感知。 Patterson,Griffiths及其同事使用了這樣的策略:通過減去在呈現IRN期間獲得的信號中呈現寬帶噪聲期間獲得的BOLD信號,他們確定了側向(在某種程度上,內側)Heschl的選擇性激活。 gyrus(HG)響應後一類音調喚起的聲音[19]。此外,隨著時間的推移改變IRN的重複率以產生旋律導致在顳上回(STG)和平面偏振(PP)中的額外激活,表明通過聽覺皮層的音高的分級處理。與此一致,Krumbholz等人的MEG記錄顯示,隨著IRN刺激的重複率增加,在HG周圍檢測到新的N100m,因為重複率超過了俯仰感知的下限閾值,並且'音調起始反應'隨音高顯著性增加[20].

然而,關於音調選擇區域的精確位置存在一些爭論。正如霍爾和普拉克所指出的,單獨使用IRN刺激來識別對音高敏感的皮層區域不足以捕獲可引起音高感知的廣泛刺激:HG的激活可能是重複性寬帶刺激所特有的[21]。實際上,基於響應多個引發節奏的刺激而觀察到的BOLD信號,Hall和Plack認為平面臨時(PT)與音高處理更相關。

儘管對專門用於音調編碼的精確神經區域存在持續的分歧,但是這樣的證據表明位於A1前外側的區域可能專門用於音高感知。通過在狨猴聽覺皮層的A1的前外側邊界處識別“音高選擇性”神經元來提供對這一概念的進一步支持。這些神經元選擇性地響應純音和具有相似週期性的F0諧波[22]。許多這些神經元也對其他引起節奏的刺激的周期性敏感,例如點擊列車或IRN噪聲。這提供了強有力的證據,即這些神經元不僅僅響應聲學信號的任何特定分量,而且具體地表示與音調相關的信息。

週期性編碼或音調編碼?

[编辑]

因此,越來越多的證據表明存在專門提取F0的神經元和神經區域,可能位於A1的低BF區域的前外側區域。然而,將這些神經元或區域稱為“音高選擇性”仍然存在困難。雖然刺激F0當然是音高的關鍵決定因素,但它不一定等於聽眾所感知的音高。

然而,有幾條證據表明這些區域確實是編碼間距,而不僅僅是F0。例如,Bendor及其同事對狨猴瀝青選擇性單位的進一步研究表明,這些神經元中的活動很好地與動物的心理物理反應相對應[7]。這些作者測試了動物在同一F0中持續呈現同相諧波的過程中檢測交替相位諧波複合體的能力,以便區分動物何時更多地依賴於時間包絡提示進行音高感知,而不是光譜提示。 。與人類的心理物理實驗一致,狨猴主要使用時間包絡線索來獲得低階F0的高階,未解析的諧波,而光譜線索則用於從高F0複合波的低階諧波中提取音調。從這些音高選擇性神經元的記錄顯示,與調諧到低F0的神經元的同相諧波相比,F0調諧向下移動了八度音階以進行交替相位諧波。因此,這些神經元反應模式與心理物理學結果一致,並且表明時間和光譜線索都集成在這些神經元中以影響音調感知。

然而,再次,這項研究無法明確區分這些音高選擇性神經元是否明確表示音高,或者僅僅是F0信息的積分,然後將其解碼以感知音高。 Bizley等人採用了一種更直接的方法來解決這個問題,他分析了雪貂的聽覺皮層LFP和MUA測量值如何能夠獨立地用於估計刺激F0和俯仰感知[23]。雖然雪貂參與音高辨別任務(以指示目標人造元音的音高是否高於或低於2替代強制選擇範例中的參考),使用接收器操作特性(ROC)分析來估計可辨性。神經活動在預測F0變化或實際行為選擇(即感知音高的替代)中的作用。他們發現聽覺皮層的神經反應對兩者都有信息。最初,活動比動物的選擇更好地區分F0,但是關於動物選擇的信息在整個刺激後的時間間隔內穩定地增加,最終變得比F0變化的方向更可辨別[23]

比較研究的皮質區域之間的ROC差異表明,後場活動更好地區分了雪貂的選擇。這可以用兩種方式解釋。由於選擇相關活動在後場(其位於A1的低BF邊界)較高,與原始場相比,這可以被視為A1低BF邊界附近的瀝青選擇性的進一步證據。另一方面,在主要聽覺區域中也觀察到與音調相關的信息的事實可能表明該階段可能已經建立了足夠的音調相關信息,或者跨越多個聽覺區域的分佈式代碼編碼音調。實際上,雖然分佈在聽覺皮層上的單個神經元通常對多個聲學參數敏感(因此不是“音調選擇性”),但信息理論或神經測量分析(使用神經數據推斷刺激相關信息)表明音調信息可以然而,通過人口編碼,甚至通過時間復用的單個神經元(即,在不同的時間窗口中表示多個聲音特徵)來強有力地表示[24][25]。因此,在沒有刺激或停用這些推定的音高選擇性神經元或區域以證明這種干預引起音高的可預測偏差或損傷的情況下,可能是音高以跨越聽覺皮層的空間和時間分佈的代碼表示,而不是而不是依靠專門的當地代表。

因此,電生理記錄和神經影像學研究都表明,在A1的低BF邊界附近可能存在明顯的俯仰神經代碼。當然,對各種引發音調的刺激的一致和選擇性反應表明,這些推定的音調選擇性神經元和區域不是簡單地反映聲學信號的任何立即可用的物理特徵。此外,有證據表明這些推定的音高選擇性神經元以與動物大致相同的方式從光譜和時間線索中提取信息。然而,由於音調和聲學信號之間的抽象關係,刺激和神經反應之間的這種相關證據只能被解釋為聽覺系統具有形成音高相關參數的增強表示的能力的證據。如果沒有更直接的因果證據證明這些推定的音高選擇性神經元和確定音高感知的神經區域,我們無法斷定動物是否確實依賴於這種局部顯式的音調代碼,或者是否跨越聽覺皮層的音高的強大分佈式表示標誌著最終在聽覺系統中編碼音高。   

參考文獻

[编辑]
  1. Schouten, J. F. (1938). The perception of subjective tones. Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen41, 1086-1093.  
  2. Cynx, J. & Shapiro, M. Perception of missing fundamental by a species of songbird (Sturnus vulgaris). J Comp Psychol 100, 356–360 (1986).
  3. Heffner, H., & Whitfield, I. C. (1976). Perception of the missing fundamental by cats. The Journal of the Acoustical Society of America59(4), 915-919.
  4. 4.0 4.1 4.2 4.3 4.4 Schnupp, J., Nelken, I. & King, A. Auditory neuroscience: Making sense of sound. (MIT press, 2011).
  5. Gerlach, S., Bitzer, J., Goetze, S. & Doclo, S. Joint estimation of pitch and direction of arrival: improving robustness and accuracy for multi-speaker scenarios. EURASIP Journal on Audio, Speech, and Music Processing 2014, 1 (2014).
  6. Carlyon RP, Shackleton TM (1994). "Comparing the fundamental frequencies of resolved and unresolved harmonics: Evidence for two pitch mechanisms?" Journal of the Acoustical Society of America 95:3541-3554 
  7. 7.0 7.1 Bendor D, Osmanski MS, Wang X (2012). "Dual-pitch processing mechanisms in primate auditory cortex," Journal of Neuroscience 32:16149-61.
  8. Tramo, M. J., Shah, G. D., & Braida, L. D. (2002). Functional role of auditory cortex in frequency processing and pitch perception. Journal of Neurophysiology87(1), 122-139.
  9. Rask-Andersen, H., Tylstedt, S., Kinnefors, A., & Illing, R. B. (2000). Synapses on human spiral ganglion cells: a transmission electron microscopy and immunohistochemical study. Hearing research141(1), 1-11.
  10. Cariani, P. A., & Delgutte, B. (1996). Neural correlates of the pitch of complex tones. I. Pitch and pitch salience. Journal of Neurophysiology76(3), 1698-1716.
  11. Oxenham, A. J., Bernstein, J. G., & Penagos, H. (2004). Correct tonotopic representation is necessary for complex pitch perception. Proceedings of the National Academy of Sciences of the United States of America101(5), 1421-1425.    
  12. Winter, I. M., Wiegrebe, L., & Patterson, R. D. (2001). The temporal representation of the delay of iterated rippled noise in the ventral cochlear nucleus of the guinea-pig. The Journal of physiology, 537(2), 553-566.
  13. Schreiner, C. E. & Langner, G. Periodicity coding in the inferior colliculus of the cat. II. Topographical organization. Journal of neurophysiology 60, 1823–1840 (1988).
  14. Whitfield IC (1980). "Auditory cortex and the pitch of complex tones." J Acoust Soc Am. 67(2):644-7.
  15. Pantev, C., Hoke, M., Lutkenhoner, B., & Lehnertz, K. (1989). Tonotopic organization of the auditory cortex: pitch versus frequency representation.Science246(4929), 486-488.
  16. Fishman YI, Reser DH, Arezzo JC, Steinschneider M (1998). "Pitch vs. spectral encoding of harmonic complex tones in primary auditory cortex of the awake monkey," Brain Res 786:18-30.    
  17. Steinschneider M, Reser DH, Fishman YI, Schroeder CE, Arezzo JC (1998) Click train encoding in primary auditory cortex of the awake monkey: evidence for two mechanisms subserving pitch perception. J Acoust Soc Am 104:2935–2955.    
  18. Kadia, S. C., & Wang, X. (2003). Spectral integration in A1 of awake primates: neurons with single-and multipeaked tuning characteristics. Journal of neurophysiology89(3), 1603-1622.  
  19. Patterson RD, Uppenkamp S, Johnsrude IS, Griffiths TD. (2002) "The processing of temporal pitch and melody information in auditory cortex," Neuron 36:767-776.    
  20. Krumbholz, K., Patterson, R. D., Seither-Preisler, A., Lammertmann, C., & Lütkenhöner, B. (2003). Neuromagnetic evidence for a pitch processing center in Heschl’s gyrus. Cerebral Cortex13(7), 765-772.
  21. Hall DA, Plack CJ (2009). "Pitch processing sites in the human auditory brain," Cereb Cortex 19(3):576-85.    
  22. Bendor D, Wang X (2005). "The neuronal representation of pitch in primate auditory cortex," Nature 436(7054):1161-5.    
  23. 23.0 23.1 Bizley JK, Walker KMM, Nodal FR, King AJ, Schnupp JWH (2012). "Auditory Cortex Represents Both Pitch Judgments and the Corresponding Acoustic Cues," Current Biology 23:620-625.
  24. Walker KMM, Bizley JK, King AJ, and Schnupp JWH. (2011). Multiplexed and robust representations of sound features in auditory cortex. Journal of Neurosci 31(41): 14565-76 
  25. Bizley JK, Walker KM, King AJ, and Schnupp JW. (2010). "Neural ensemble codes for stimulus periodicity in auditory cortex." J Neurosci 30(14): 5078-91.