跳至內容

感覺系統/視覺系統

維基教科書,自由的教學讀本

介紹[編輯]

一般而言,視覺系統依靠電磁波(EM)為生物體提供有關其周圍環境的更多信息。 這些信息可能與潛在的配偶、危險和食物來源有關。 不同的有機組織具有不同的成分,這些成分構成了所謂的視覺系統。

眼睛的複雜性從簡單的眼點(只不過是光敏細胞的集合)到成熟的相機。如果生物體具有不同類型的光敏細胞,或對不同波長範圍敏感的細胞,那麼理論上該生物體將能夠感知顏色或至少是感知顏色差異。極化是電磁輻射的另一個特性,它可以被一些生物體檢測到,其中昆蟲和頭足類動物的檢測到電磁輻射極化的準確度最高。

需要注意的是,在本文中,重點是使用電磁波來「看」。誠然,一些生物體已經進化出獲得視覺的替代方式,或者至少用超感官信息補充它們所看到的東西。例如,使用回聲定位的鯨魚或蝙蝠。這可能在某種意義上算作「看」,但並不完全正確。此外,」視覺「或」視覺的「這些詞最常與可見波長範圍內的電磁波相關聯,該範圍通常被定義為人類視覺的波長範圍。

電磁光譜圖

由於某些生物體能檢測到的會低於和高於一般人類檢測到電磁波頻率,因此必須對可見電磁波做出更好的定義,我們將可見波長範圍定義為 300nm 到 800nm 之間的電磁波波長。 這對某些物種來說似乎是武斷的,但選擇錯誤的範圍,會使得某些鳥類的部分視覺範圍變為不可視範圍。 此外,在這個波長範圍內,我們定義了某些生物的熱視覺,例如蛇是非視覺的。 使用對 5000 納米到 30,000 納米 (IR) 之間的電磁波敏感的坑器官的蛇並不能「看到」,而是從遠處以某種方式「感覺到」。 即使如此,不可視的物種還是有被記錄能對準和攻擊特定的身體部位。

接下來首先對不同類型的視覺系統感覺器官進行簡要描述,然後詳細解釋人類視覺的組成部分,人類視覺通路的信號處理,最後以一個由以上階段引起的感知結果的例子結束。

感覺器官[編輯]

視覺,或「看的能力」依賴於視覺系統的感覺器官或眼睛。眼睛有許多不同的結構,其複雜程度取決於生物體的需求。不同的結構具有不同的能力,且對不同的波長敏感並具有不同的敏銳度,而且它們需要通過不同的處理方式來理解輸入和不同的數量組合才能最佳地工作。檢測和破譯電磁波的能力已被證明是大多生命形式的寶貴能力,從而增加生物體的生存機會。生活在光線不足或完全缺乏光線的環境中的生命形式沒有額外的視覺優勢,最終導致視覺感覺器官萎縮,隨後對其他感官的依賴得以增加(例如一些穴居動物、蝙蝠等)。有趣的是,視覺感覺器官的感覺範圍被調諧到光學窗口,該光學窗口被定義為穿過大氣到達地面的電磁波波長(300 納米到 1100 納米之間)。如下圖所示。您可能會注意到其他「窗口」的存在,一個紅外窗口,它在某種程度上解釋了蛇的熱「視覺」,以及一個射頻窗口,目前沒有已知的生命形式能夠檢測到該窗口。

大氣電磁不透明度

隨着時間的推移,眼睛進化產生出了許多結構,其中一些已經進化了多次,具有相似生態位的生物產生了相似的特徵。但有一個方面是基本相同的,無論物種或感覺器官類型的複雜程度如何,稱為視蛋白的光敏蛋白都在器官的形成上有很普遍的起到作用。 不過,無需過多關注分子基礎,各種結構可以分為以下不同的組:

  • 斑點眼
  • 坑眼
  • 針孔眼
  • 鏡片眼
  • 屈光角膜
  • 反光眼
  • 複眼

即使是最簡單的配置的眼睛也可以使生物體能夠簡單地感知環境光,並使生物體能夠知道是否有光。通常只是光敏細胞在同一個點的集合,因此有時被稱為點眼、眼點或幹細胞。 通過添加更多的角結構或隱藏點眼,生物體可以獲得方向信息,這是圖像形成的重要條件。這些所謂的「坑眼」是迄今為止最常見的視覺感覺器官類型,在所有已知95%的物種中都可以找到。

針孔眼

這種方法的極端運用會導致「坑」變成一個海綿狀結構,這樣可以增加圖像的清晰度,但圖像密度有所損失。換句話說,這是在強度或亮度與銳度之間的一個折衷。 這方面的例子可以從鸚鵡螺中找到,鸚鵡螺屬於鸚鵡科,被認為是活化石。它們是已知的唯一擁有這種類型的眼睛的物種,稱為「針孔眼」,它完全類似於針孔相機或暗箱。此外,與更先進的相機一樣,鸚鵡螺能夠調整光圈的大小,從而使得圖像的亮度相應降低或增加的同時,提高或降低眼睛的分辨率。像相機一樣,調整強度/分辨率權衡問題的方法是運用一個鏡頭,一種將光聚焦到中心區域的結構,通常該區域具有更高密度的光電傳感器。通過調整鏡頭的形狀並四處移動,並控制光圈或瞳孔的大小,生物體可以適應不同的條件並專注於任何視覺場景中的特定感興趣區域。已經提到的各種眼睛結構的最後一次升級是加入了屈光角膜,具有這種結構的眼睛將眼睛總光焦度的三分之二委託給角膜內的高折射率液體,從而實現非常高分辨率的視覺。大多數陸地動物,包括人類,都有這種特殊結構的眼睛。此外,還存在着透鏡結構、透鏡數量、光傳感器密度、中央凹形狀、中央凹數量、瞳孔形狀等的許多變化,以增加所討論的生物體的存活機會。這些變化導致即使是單一的眼睛結構類別,不同的眼睛外觀也不同。為了證明這一點,下面顯示了一組具有相同眼睛類別(屈光角膜眼睛)的動物照片。

屈光角膜眼睛
鷹眼
羊眼
貓眼
人眼
鱷魚眼
複眼

可以在軟體動物中找到稱為反射器眼睛的透鏡方法的替代方法。 與使用晶狀體或晶狀體系統將光聚焦到眼睛後部的單個點的傳統方式不同,這些生物體在眼室內具有鏡狀結構,將光反射到中心部分,很像拋物線盤。儘管沒有已知的具有反射眼睛的生物體具有能夠形成圖像的能力的例子,但至少有一種魚類,幽靈魚將它們與「正常」的透鏡眼睛結合使用。

最後一組眼睛類型常在昆蟲和甲殼類動物中發現,稱為複眼。 這些眼睛由許多稱為小眼的功能子單元組成,每個子單元由一個小平面或前表面、一個透明的晶體錐和用於檢測的光敏細胞組成。此外,每個小眼都被色素細胞隔開,確保入射光儘可能平行。 每個小眼的輸出組合形成馬賽克圖像,分辨率與小眼單元的數量成正比。 例如,如果人類有複眼,眼睛會覆蓋我們的整個面部以保持相同的分辨率。 需要注意的是,複眼有很多種,但深入研究這個話題超出了本文的範圍。

不僅是眼睛的類型不同,眼睛的數量也不同。 眾所周知,人類通常有兩隻眼睛,而蜘蛛的眼睛數量是不同的,大多數物種有8隻。通常蜘蛛的不同對眼睛的大小也不同,不同大小的眼睛大小、功能也不同。 例如,在跳蛛中,2個較大的前眼,賦予蜘蛛極佳的視覺敏銳度,主要用於瞄準獵物。6隻小眼睛的分辨率要差得多,但可以幫助蜘蛛避免潛在的危險。下面兩張跳蛛眼睛和狼蛛眼睛的照片展示了蛛形綱動物眼睛拓撲結構的可變性。

視覺系統剖析[編輯]

我們人類是視覺生物,並且我們的眼睛由許多組件組成。 在本章中,我們將嘗試描述這些組件,從而對人類視覺的特性和功能有更深的了解。

光線進入眼球內部 - 瞳孔、虹膜和晶狀體[編輯]

光線通過眼睛前部的黑色光圈或瞳孔進入眼睛結構,黑色外觀是用於幫助光線被眼睛內部的組織完全吸收。 只有通過瞳孔才能讓光線進入眼睛,這意味着入射光的數量實際上是由瞳孔的大小決定的。 瞳孔周圍的有色括約肌充當眼睛的孔徑光闌。 正是這種虹膜中的色素量導致了人類眼睛的各種顏色。

除了這層色素外,虹膜還有兩層睫狀肌。一層稱為瞳孔括約肌的圓形肌肉收縮使得瞳孔變小,另一層是稱為瞳孔擴張器的平滑肌,它收縮以擴張瞳孔,這些肌肉的組合從而可以根據人的要求,擴張或收縮瞳孔。睫狀肌由睫狀小帶控制,睫狀小帶也會改變晶狀體的形狀並將其固定在適當的位置。

晶狀體位於瞳孔正後方。它的形狀和特性揭示了它與相機鏡頭相似的用途,但它們的功能略有不同。晶狀體的形狀可以通過睫狀小帶的拉力進行調整,從而改變焦距。晶狀體與角膜一起可以改變焦點,這使得它成為一個非常重要的結構,但是眼睛的總光焦度只有三分之一是由於晶狀體本身造成的,它也是眼睛的主要過濾器。晶狀體的纖維構成了大部分的晶狀體,它們是長而細的細胞,是不同於大多數細胞的機制,以提高其透明度。與稱為晶狀體蛋白的水溶性蛋白質一起,它們會增加晶狀體的折射率,同時纖維還在晶狀體本身的結構和形狀中發揮作用。

人眼示意圖

眼睛中的波束成形 - 角膜及其保護劑 - 鞏膜[編輯]

角膜的結構

角膜負責眼睛總光焦度的剩餘2/3,它覆蓋虹膜、瞳孔和晶狀體,它在穿過晶狀體之前聚焦穿過虹膜的光線。 角膜只有 0.5 毫米厚,由5層組成: - 上皮:覆蓋角膜表面的一層上皮組織。 - 鮑曼膜:由強膠原纖維組成的厚保護層,可保持角膜的整體形狀。 - 基質:由平行膠原纖維組成的層。 這一層占角膜厚度的 90%。 - 角膜後彈力層和內皮:兩層存在於充滿睫狀體產生的房水的眼前房。這種液體可以滋潤晶狀體、清潔晶狀體並保持眼球內的壓力。該腔室位於角膜和虹膜之間,包含一個小梁網體,通過該小梁網體,流體由施勒姆管通過後房排出。

角膜表面位於兩層保護膜之下,稱為鞏膜和特農囊,這兩個保護層都完全包圍了眼球。 鞏膜由膠原蛋白和彈性纖維構成,可保護眼睛免受外部損傷,這一層也產生了眼白。它被神經和血管穿透,為了視神經而保留了最大的孔。此外,它被結膜覆蓋,結膜是眼球表面的透明粘膜,該膜還襯在眼瞼內側,它起到潤滑劑的作用,與淚腺一起產生眼淚,可以潤滑和保護眼睛。剩下的保護層,即眼瞼,也起到將這種潤滑劑擴散到周圍的作用。

眼睛的移動 —— 眼外肌[編輯]

眼球由複雜的眼外肌肌肉結構移動,眼外肌由四塊直肌——下、內側、外側和上斜肌,和兩條斜肌——下、上斜肌組成,這些肌肉的定位以及功能如下所示:

眼外肌:綠色 - 外直肌; 紅色 - 內直肌; 青色 - 上直肌; 粉紅色 - 下直肌; 深藍色 - 上斜肌; 黃色 - 下斜肌。

眼外肌 (2,3,4,5,6,8) 附着在眼球鞏膜上,起源於津恩之環,這是一種圍繞視神經的纖維肌腱。 滑輪系統是由滑車作為滑輪和上斜肌作為繩索構建的,這需要以正確的方式重定向肌肉力。 剩餘的眼外肌有一條直達眼睛的路徑,因此不會形成這些滑輪系統。 使用這些眼外肌,眼睛可以向上、向下、向左、向右旋轉,並且可以將這些運動組合起來進行替代運動。

其他動作對於我們是否能看見來說,也很重要。聚散運動使雙目視覺的一般功能成為可能。被稱為掃視的無意識快速運動對於人們保持物體聚焦至關重要,掃視是眼睛在掃視視野時為了稍微移動注視點而進行的一種抖動運動。 當您注視移動物體時,您的眼睛會執行所謂的平滑跟蹤。稱為眼球震顫的無意識運動是由來自前庭系統的信號引起的,它們共同構成了前庭眼反射運動。

腦幹控制眼睛的所有運動,不同的區域負責不同的運動。

  • 腦橋:快速的水平運動,如眼跳或眼球震顫
  • 中腦:垂直和扭轉運動
  • 小腦:微調
  • 動眼神經副核:聚散運動

視覺接收發生的地方 —— 視網膜[編輯]

角膜、晶狀體和色素上皮對光的過濾

在被轉導之前,傳入的電磁波會先經過角膜、晶狀體和黃斑,這些結構還充當過濾器以減少不需要的電磁波,從而保護眼睛免受有害輻射。 這些元素中的每一個的過濾響應都可以在「角膜、晶狀體和色素上皮執行的光的過濾」圖中看到。 正如人們所觀察到的那樣,角膜會衰減較低的波長,而使較高的波長几乎不受影響。 透鏡可阻擋 400nm 以下約 25% 的電磁波,以及 430nm 以下 50% 以上的電磁波。 最後,色素上皮細胞是光接收之前過濾的最後階段,影響 430nm 到 500nm 之間約 30% 的電磁波。

作為眼睛的一部分,鋸齒緣標誌着從非感光區域到感光區域的過渡。 感光區域被稱為視網膜,它是眼睛後部的感覺結構,視網膜由下面呈現的多層組成,具有數百萬個稱為杆狀和錐狀體的光感受器,它們捕獲光線並將其轉換為電脈衝, 這些脈衝的傳遞是由神經節細胞緊張地發起並通過視神經進行的,視神經是信息離開眼睛的唯一途徑。

包括主要細胞成分在內的視網膜結構: RPE:視網膜色素上皮; OS:感光細胞的外段; IS:感光細胞內段; ONL:外核層; OPL:外叢狀層; INL:內核層 IPL:內叢狀層; GC:神經節細胞層; P:色素上皮細胞; BM:布魯赫膜; R:棒; C:錐體; H:水平單元格; Bi:雙極細胞; M:繆勒細胞; A:無長突細胞; G:神經節細胞; AX:軸突; 三角箭頭:膜限制外。

右圖顯示了視網膜結構的概念圖,我們可以看到,視網膜有五種主要的細胞類型:

  1. 感光細胞
  2. 水平單元格
  3. 雙極細胞
  4. 無分泌細胞
  5. 神經節細胞

感光細胞可以進一步細分為杆狀和錐狀兩種主要類型。 在視網膜的大部分區域,視錐細胞的數量遠少於視杆細胞,但在黃斑部,尤其是在其中央部分,稱為中央凹,有大量視錐細胞聚集在一起。 在這個中心區域,每個感光錐都與一個神經節細胞相連。 此外,該區域中的錐體略小於平均錐體尺寸,這意味着您在每個區域會有更多錐體。 由於這個比例,以及視錐細胞的高密度,中央凹是我們視力靈敏度最高的地方。

視錐細胞和視杆細胞在人類視網膜上的分布

存在3種類型的人體視錐細胞,每種視錐細胞都對特定範圍的波長做出反應,這是因為光視蛋白的三種色素。 每種色素對紅色、藍色或綠色波長的光敏感程度不同,因此我們有藍色、綠色和紅色錐體,也稱為 S-、M- 和 L-錐體,因為它們分別對短、中和長波長敏感。它由稱為視蛋白的蛋白質和稱為視網膜的結合發色團組成。視錐細胞的主要組成部分是突觸末端、內節和外節、內核和線粒體。

視錐細胞結構

3種錐體的光譜靈敏度:

  1. S-視錐細胞吸收短波光,即藍紫色光,S錐的最大吸收波長為 420nm。
  2. M-視錐細胞吸收藍綠色至黃光,在這種情況下最大吸收波長為 535nm。
  3. L-視錐細胞吸收黃光至紅光,最大吸收波長 565nm。

內段包含細胞器和細胞的細胞核和細胞器,色素位於外段,作為細胞膜內陷內的跨膜蛋白附着在膜上,形成膜狀圓盤,在顯示杆狀和錐狀細胞基本結構的圖中清晰可見。圓盤使細胞的接收面積最大化。許多脊椎動物的錐形光感受器包含稱為油滴的球形細胞器,被認為構成眼內過濾器,可用於增加對比度、減少眩光和減少由線粒體從外圍到中心的大小梯度引起的色差。

視杆的結構類似於視錐細胞,但它們含有色素:視紫紅質,這使它們能夠檢測低強度光,並使它們的靈敏度比視錐細胞高100倍。視紫紅質是在人類視杆細胞中發現的唯一色素,它位於色素上皮的外側,類似於錐體,通過採用盤狀結構來最大化吸收面積。與錐體類似,細胞的突觸末端將其與雙極細胞連接起來,內節和外節由纖毛連接。

色素視紫紅質吸收 400-600nm 之間的光,吸收的峰值在500nm左右,該波長對應於綠藍色光,這意味着藍色在夜間比紅色更強烈。

視錐和視杆對可見光電磁輻射的敏感性

波長在 400-700 nm 範圍之外的電磁波不會被視杆或視錐體檢測到,這意味着它們對人類是不可見的。

水平細胞佔據視網膜的內核層。有兩種類型的水平細胞,並且兩種類型都會因為光線作用而超極化,即它們會變得更負極化。 A 型由稱為 HII-H2 的亞型組成,主要與 S 錐相互作用。 B 型細胞由一種稱為 HI-H1 的亞型組成,其特徵是樹突樹和軸突。前者主要接觸 M 和 L 錐細胞,後者主要接觸杆細胞。與錐體的接觸主要通過抑制性突觸進行,而細胞本身則通過間隙連接連接到網絡中。

雙極細胞在外叢狀層內散布單個樹突,在內核層中可以發現其細胞體。其樹突僅與錐體和杆體互連,我們借一個杆狀雙極細胞和九個或十個錐形雙極細胞進行區分。這些細胞使用軸突,通過內叢狀層中的無長突或神經節細胞進行分支。杆狀雙極細胞連接到三聯突觸或 18-70 個杆狀細胞。它們的軸突圍繞內叢狀層突觸末端展開,突觸末端包含帶狀突觸,並與雙聯突觸中的一對細胞突接觸。它們通過 AII 無長突細胞鏈接與神經節細胞相連。

無長突細胞可見於內核層和視網膜的神經節細胞層,有時它們位於內部叢狀層中用作信號調製器。根據它們的大小,它們被分為窄域、小域、中域或寬域。然而,多種分類方式導致超過 40 種不同類型的無長突細胞。

神經節細胞是視覺信號從視網膜到大腦的最終傳送器。視網膜中最常見的神經節細胞是小型神經節細胞和陽傘神經節細胞。通過所有視網膜層後的信號被傳遞到這些細胞,這些細胞是視網膜處理鏈的最後階段。在這裡收集的所有信息都轉發給視網膜神經纖維和視神經。神經節軸突融合形成視神經的部位稱為視盤。該神經主要由視網膜神經節軸突和波特細胞構成。大多數軸突將數據傳輸到外側膝狀體核,這是大部分神經的終止連接,並將信息轉發到視覺皮層。一些神經節細胞也會對光作出反應,但由於這種反應比杆狀和錐狀細胞的反應慢,因此被認為與感知環境光水平和調節生物鐘有關。

人類視網膜的橫截面,雙極細胞以紅色表示。

信號處理[編輯]

如前所述,視網膜是眼睛的主要組成部分,因為它包含所有對光敏感的細胞,沒有它,眼睛將與沒有電荷耦合器件傳感器的數碼相機相媲美。 這部分詳細闡述了視網膜如何感知光線、光信號如何傳遞到大腦以及大腦如何處理信號以形成足夠的信息以進行決策。

初始信號的創建 —— 光電傳感器功能[編輯]

視覺總是從照射到視網膜中發現的光敏細胞的光開始。吸收光的視覺色素、視網膜杆和視錐細胞中的各種酶和遞質將啟動從可見電磁波刺激到電脈衝的轉換,這一過程稱為光電轉導。以杆為例,傳入的可見電磁波會擊中視紫質分子,即在杆的外盤結構中發現的跨膜分子,每個視紫質分子由一組稱為視蛋白的螺旋組成,這些螺旋包裹並圍繞着 11-順式視黃醛,這是分子中會因來自入射光子的能量而發生變化的部分。在生物分子中,由於這種能量而引起構象變化的分子部分或部分有時稱為發色團。 11-順式視黃醛響應傳入的能量而變直,變成視黃醛(全反式視黃醛),這迫使視蛋白螺旋進一步分開,導致特定的反應位點被發現。這種「活化的」視紫紅質分子有時被稱為金屬視紫紅質 II。從此,即使可見光刺激停止,反應也會繼續。然後,金屬視紫紅質 II 可以與大約 100 個稱為轉導的 G_s 蛋白分子發生反應,GDP 換算成 GTP 後產生 a_s 和 ß亞基。然後激活的 a_s-GTP 與 cGMP-磷酸二酯酶 (PDE) 結合,抑制正常的離子交換功能,導致細胞溶膠中陽離子離子濃度降低,從而導致細胞極化發生變化。

天然的光電轉導反應具有驚人的放大能力。由單個光量子激活的單個視網膜視紫質分子每秒可水解多達 10^6 個 cGMP 分子。

光轉導[編輯]

光活化中分子步驟的表示(修改自 Leskov et al.,2000)。 描繪的是杆中的外膜盤。 第 1 步:入射光子 (hν) 被吸收並通過將圓盤膜中的構象改變為 R\* 來激活視紫紅質。 第 2 步:接下來,R* 與轉導蛋白分子重複接觸,通過釋放結合的 GDP 以換取細胞質 GTP,催化其激活為 G\*(第 3 步)。 α 和 γ 亞基 G* 結合磷酸二酯酶 (PDE) 的抑制性 γ 亞基,激活其 α 和 ß 亞基。 步驟 4:活化的 PDE 水解 cGMP。 步驟 5:鳥苷酸環化酶 (GC) 合成 cGMP,這是光轉導級聯中的第二信使。 細胞溶質 cGMP 水平降低導致環核苷酸門控通道關閉,防止 鈉離子 和 鈣離子 進一步流入。
  1. 光子與感光器中的視網膜相互作用。視黃醛經歷異構化,從 11-順式變為全反式構型。
  2. 視網膜不再適合視蛋白結合位點。
  3. 因此,視蛋白會發生構象變化,變成金屬視紫紅質 II。
  4. 金屬視紫紅質 II 不穩定並分裂,產生視蛋白和全反式視黃醛。
  5. 視蛋白激活調節蛋白轉導蛋白。這導致轉導蛋白與其結合的 GDP 解離,並結合 GTP,然後轉導蛋白的 α 亞基與 β 和 γ 亞基解離,而 GTP 仍與 α 亞基結合。
  6. α 亞基-GTP 複合物激活磷酸二酯酶。
  7. 磷酸二酯酶將 cGMP 分解為 5'-GMP。這降低了 cGMP 的濃度,因此鈉通道關閉。
  8. 由於持續的鉀電流,鈉通道的關閉導致細胞超極化。
  9. 細胞的超極化導致電壓門控鈣通道關閉。
  10. 隨着感光細胞中鈣含量的下降,細胞釋放的神經遞質穀氨酸鹽的量也會下降。這是因為含有穀氨酸的囊泡與細胞膜融合併釋放其內容物需要鈣。
  11. 光感受器釋放的穀氨酸量的減少導致中心雙極細胞(雙極細胞上的杆狀和錐狀細胞)去極化和錐狀雙極細胞的超極化。

在沒有可見光刺激的情況下,含有離子、蛋白質和其他分子混合物的杆狀細胞的膜電位差約為 -40mV。 與其他神經細胞相比,這是相當高的(-65mV)。 在這種狀態下,神經遞質穀氨酸不斷從軸突末端釋放出來並被相鄰的雙極細胞吸收。 隨着傳入的可見光和前面提到的級聯反應,電位差下降到 -70mV。 細胞的這種超極化導致釋放的穀氨酸數量減少,從而影響雙極細胞的活性,並隨後影響視覺通路中的以下步驟。

類似的過程存在於視錐細胞和光敏神經節細胞中,但使用不同的視蛋白。 光蛋白酶 I 到 III(分別為黃綠色、綠色和藍紫色)存在於三種不同的視錐細胞中,而黑視蛋白(藍色)存在於光敏神經節細胞中。

視網膜中的信號處理[編輯]

感受野

不同的雙極細胞對釋放的穀氨酸的變化有不同的反應。所謂的 開型(ON) 和 關型(OFF) 雙極細胞用於形成從錐體到雙極細胞的直接信號流。 開型雙極細胞將通過可見光刺激去極化,相應的開型神經節細胞將被激活。另一方面,關型雙極細胞被可見光刺激超極化,關型神經節細胞受到抑制。這是直接信號流的基本路徑。橫向信號流將從杆開始,然後進入雙極細胞、無長突細胞和被杆無長突細胞抑制的關型雙極細胞和開型雙極細胞將通過電突觸刺激,通過之前的步驟,信號將到達開型或關型神經節細胞,並建立橫向信號流的整個通路。

當動作電位 (AP) 處於開啟狀態(ON)時,神經節細胞將被可見光刺激觸發。當傳感器電位增加時,AP 頻率會增加。換句話說,AP 取決於傳感器電位的幅度。刺激和抑制作用影響 AP 頻率的神經節細胞區域稱為感受野 (RF)。在神經節細胞周圍,RF 通常由兩個區域組成:中央區和環狀外圍區,這兩個區域在可見光適應期間是可區分出來的。中心區域上的可見光刺激可能導致 AP 頻率增加,而外圍區域上的刺激將降低 AP 頻率。當光源開啟時,激發發生,所以開型ON場指的區域就是指這種區域。當然,關型 OFF 神經節細胞的 RF 以相反的方式起作用,因此被稱為「關型OFF 場」(中央場 OFF)。 感受野由水平單元組成,外圍區域的衝動會被推動並傳遞到中心區域,在那裡形成所謂的刺激對比,此特性將使黑暗看起來更暗,光線更亮。如果整個感受野暴露在光線下,中間區域的衝動將占主導地位。

到大腦皮層的信號傳輸[編輯]

如前所述,神經節細胞的軸突會聚在視網膜的視盤上,形成視神經,這些纖維以特定順序位於神經束內。來自視網膜黃斑區的纖維位於神經束中央部分,來自視網膜顳側的纖維佔據神經束的周邊部分。當這些纖維位於眼腔外時,會發生部分交疊或交叉,來自每個獨立視網膜的鼻半部的神經交叉到對面的半部並逐步延伸到大腦,那些來自顳邊的神經仍然沒有交叉。這種部分交叉稱為視交叉,經過這一點的視神經稱為視束,這樣的稱呼主要是為了區別於單一的視網膜神經。部分交叉的功能是將雙眼產生的右手視野僅傳輸到大腦的左手半部,反之亦然。因此,當到達前腦的後部(間腦)時,來自身體右半部和右視野的信息都被傳遞到大腦的左手部。

通往中央皮層的通路

視束纖維和神經細胞之間的信息傳遞發生在外側膝狀體,視覺信號處理的中心部分,位於大腦丘腦。信息從這裡傳遞到大腦相應側枕葉皮層的神經細胞。從視網膜到大腦的連接可以分為「小細胞通路」和「大細胞通路」。細小細胞通路發出顏色和精細細節的信號,而巨細胞通路檢測快速移動的刺激。

從視網膜到大腦的連接可以分為「小細胞通路」和「大細胞通路」。 細小細胞通路起源於視網膜中的細小細胞,並發出顏色和細節的信號; 巨細胞通路從陽傘細胞開始,檢測快速移動的刺激。

來自標準數碼相機的信號大致對應於細小細胞通路的信號。為了模擬大細胞通路的反應,研究人員一直在開發神經形態感覺系統,試圖模擬神經系統中基於尖峰的計算。因此,他們使用稱為「地址-事件表示」的方案在神經形態電子系統中進行信號傳輸(Liu 和 Delbruck 2010 [1])。

在解剖學上,視網膜大神經節細胞和細小神經節細胞分別投射到外側膝狀核 (LGN) 的2個腹側大細胞層和4個背側小細胞層。六個LGN層中的每一層都接收來自同側或對側眼的輸入,即左眼的神經節細胞交叉並投射到右LGN的第 1、4 和 6 層,而右眼神經節細胞投射(未交叉)到它的第 2、3 和 5 層。從這裡開始,來自右眼和左眼的信息被分開了。

LGN的六個層,2個大細胞層(M1,M2)和小細胞層(P3,P4,P5,P6)


雖然人類的視覺是由兩半視網膜結合,信號由相對的大腦半球處理,但視野被認為是一個平滑完整的單位。因此,兩個視覺皮層區域被認為是緊密相連的,這種稱為胼胝體的連接由神經元、軸突和樹突組成。因為樹突與半球的相關點形成突觸連接,一個半球上每個點的電模擬表明另一個半球上互連點的模擬,這條規則的唯一例外是初級視覺皮層。

突觸由外側膝狀體各層中的視束構成,然後這些三級神經細胞的軸突向上傳遞到大腦皮層每個枕葉的距狀裂。因為來自視網膜神經細胞的白色纖維帶和軸突對穿過它,所以它被稱為條紋皮層,順便提一下,它是我們的初級視覺皮層,有時被稱為 V1。在這一點上,來自分開的眼睛的脈衝會聚到共同的皮層神經元,然後使來自一個區域的雙眼的完整輸入用於感知和理解。模式識別是大腦這一特定部分的一項非常重要的功能,病變會導致視覺識別或盲視問題。

根據視束纖維將信息傳遞到外側膝狀體然後再傳遞到紋狀區域的有序方式,如果在視網膜上發現一個單點刺激,則會在外側膝狀體和紋狀皮層中產生電響應,該電響應往往對應於視網膜斑點的一個特定小區域,這是一種明顯的點對點信號處理方式。如果整個視網膜受到刺激,外側膝狀體和紋狀皮層灰質整個區域都會發生反應。可以將這個大腦區域映射到視網膜區域或者視野區域是可能的。

此通路中的更進一步的介紹超出了本書的範圍。視覺系統中卻有存在許多更多的層次和中心,專注於不同的特定任務,例如顏色、方向、空間頻率、情緒等。

視覺系統中的信息處理[編輯]

基於對視覺系統中信號處理的一些重要的概念的堅實的理解,我們可以對處理過的感官信息的理解或感知,這塊拼圖的最後一個重要部分進行更深的了解。 視覺感知是將眼睛接收到的信息轉化為對事物外部狀態的理解的過程, 它讓我們了解我們周圍的世界,並讓我們更好地了解它。 基於視覺感知,我們學習到其中的特徵,然後在以後的生活中應用這些特徵,並基於此和基於獲得的信息做出決定。 換句話說,我們的生存取決於感知。 由於視覺的處理過於複雜,並且需要許多不同的機制來感知所見到的內容,視覺感知領域又被劃分為不同的子領域。 這些子領域包括:顏色感知、運動感知、深度感知和人臉識別等。

靈長類視覺皮層的深層層次結構[編輯]

視覺系統中的深層層次結構

儘管電子系統的計算能力不斷增強,但仍有許多任務在動物和人類方面遠遠優於計算機——其中之一是信息的感知和情境化。經典計算機,無論是您手機中的計算機還是佔據整個房間的超級計算機,本質上都是一個數字處理器,它可以在極短的時間內執行大量的計算,它缺乏的是創建它正在使用的信息的抽象表示。如果將相機連接到計算機,它「感知」的圖片只是一個像素網格,一個二維數字數組,而人類會立即識別場景的幾何形狀、圖片中的對象,甚至可能是正在發生的事情的背景。我們的這種能力是由專門的生物機器——大腦的視覺系統提供的。它以分層的方式處理我們看到的一切,從圖像的簡單特徵到更複雜的特徵,一直到將對象分類,因此,據說視覺系統具有很深的層次結構。靈長類視覺系統的深層層次結構啟發了計算機科學家創建人工神經網絡模型,這些模型還具有多個層級,其中每個層級都可以對輸入數據進行更高的抽象提取。

大約一半的人腦新皮層專用於視覺,視覺信息的處理發生在至少 10 個功能級別上。早期視覺區域中的神經元在視覺空間的小局部區域上提取簡單的圖像特徵,隨着信息被傳輸到更高的視覺區域,神經元會對越來越複雜的特徵做出反應。隨着更高級別的信息處理,表示的內容變化會更小——對確切的特徵大小、旋轉或位置不太敏感。此外,較高視覺區域中神經元的感受野大小增加,表明它們已調整到更全局的圖像特徵。這種分層結構允許高效計算的實現——不同的較高視覺區域可以使用在較低區域計算的同樣的信息。而在早期視覺區域進行的通用場景的描述,會被大腦的其他部分用來完成各種不同的任務,例如物體識別和分類、抓取、操縱、運動規劃等。

皮層下視覺[編輯]

視覺信息的神經處理在任何皮質結構之前就已經開始,視網膜上的光感受器檢測光線並向視網膜神經節細胞發送信號。光感受器的感受野大小是 100 度(當你的手臂伸到你面前時,一個 1 度大的感受野大約是你的拇指大小)。神經節細胞的輸入數量及其感受野大小取決於位置——在視網膜中央,它接收來自五個受體的信號,而在外圍,單個細胞可能有數千個輸入。這意味着最高的空間分辨率位於視網膜的中心,也稱為中央凹,由於這一特性,靈長類動物擁有引導視力的凝視控制機制,從而使感興趣的特徵投射到中央凹上。

神經節細胞被選擇性地調整以檢測圖像的各種特徵,例如亮度對比度、顏色對比度以及運動的方向和速度,所有這些特徵都是在後續處理上會進一步調用的主要信息。如果存在無法被神經節細胞檢測到的視覺刺激,那麼它們的信息也不會被任何皮質視覺區域獲得。

神經節細胞投射到丘腦中稱為外側膝狀體核 (LGN) 的區域,該區域又將信號傳遞到大腦皮層。在LGN中沒有已知的重要計算——視網膜神經節和 LGN 細胞之間幾乎是一一對應的。然而,LGN 只有 5% 的輸入來自視網膜——所有其他輸入都是來自皮層的反饋投射。儘管視覺系統通常被視為前饋系統,但循環反饋連接和橫向連接是整個視覺皮層的常見特徵。反饋的作用尚未完全理解,但建議將其歸因於注意力、期望、想象和填補缺失信息等過程。

皮質視覺[編輯]

視覺系統的主要區域

視覺皮層可以分為三大部分: 第一部分是枕葉部分,它接收來自 LGN 的輸入,然後將輸出發送到背側和腹側流。枕部包括區域 V1-V4 和 MT,它們處理視覺信息的不同方面並產生通用的場景表示。背側通路參與空間分析和行動計劃。腹側通路參與物體識別和分類。

V1 是第一個處理視覺信息的皮層區域。它對邊緣、光柵、線端、運動、顏色和視差(一個點在左右視網膜上的投影之間的角度差異)敏感。分層自下而上處理的最直接示例是來自多個神經節細胞的輸入與中心環繞感受野的線性組合,以創建條形的特徵。這是由 V1 的簡單細胞完成的,最早由著名的神經科學家 Hubel 和 Wiesel 發現和描述。這種類型的信息集成意味着,簡單細胞對條形的確切位置很敏感,並且具有相對較小的感受野。 V1 的複雜單元格接收來自簡單單元格的輸入,同時也響應線性定向模式,它們對條的確切位置不敏感,並且具有更大的感受野。此步驟中存在的計算可以是類似取最大值的操作,其產生的響應幅度與單個較大刺激的響應相似。一些簡單和複雜的細胞也可以檢測到條形的末端,一小部分 V1 細胞對它們各自感受野內的局部運動也敏感。

區域 V2 具有更複雜的輪廓處理和表示,包括紋理定義的輪廓、虛幻的輪廓和具有邊界所有權的輪廓。 V2 建立在 V1 中的絕對視差檢測的基礎上,其中的特徵細胞對相對視差(空間兩點的絕對視差)敏感。區域 V4 接收來自 V2 和區域 V3 的輸入,但對 V3 中發生的計算知之甚少。區域 V4 具有對具有不同曲率的輪廓和具有特定角度的頂點敏感的神經元。另一個重要特徵是針對亮度不變色調的編碼,這與 V1 形成對比,在 V1 中,神經元響應沿着兩個主軸(紅-綠和黃-藍)而不是實際顏色的顏色。 V4 進一步輸出到腹側流,到下顳葉皮層 (IT),通過病變研究表明這個區域對於物體辨別至關重要。

顳下皮層:物體辨別[編輯]

區域 TE 的刺激減少現象

顳下皮層 (IT) 分為兩個區域:TEO 和 TE。區域 TEO 集成了多個輪廓元素的特徵形狀和相對位置的信息,主要是用於響應簡單的特徵組合。 TEO神經元的感受野大小約為3-5度,TE 區域的細胞具有明顯更大的感受野(10-20 度),可以響應面部、手和複雜的特徵配置。 TE 中的細胞對視覺特徵做出反應,這些視覺特徵是對感興趣對象的更簡單概括,但比簡單的條形或斑點更複雜,Tanaka 等人使用刺激減少方法證明了這一點: 首先測量針對對象的響應,然後用更簡單的表示替換對象,直到 TE 神經元響應的關鍵特徵縮小。

似乎 IT 中的神經元會將腹側流中較低級別的各種中等複雜性特徵匯集在一起​​,以構建對象部分的模型。 TE 中對特定對象有選擇性的神經元必須滿足兩個看似矛盾的要求——選擇性和不變性。他們必須通過對視網膜圖像中特徵的敏感性來區分不同的物體。然而,在不同的光線條件下,可以從不同的角度和距離觀察同一物體,從而產生同一物體的高度不同的視網膜圖像。為了將所有這些圖像視為等效,必須導出對某些變換(例如位置、光照、視網膜大小的變化等)具有魯棒性的不變特徵。 TE 區域中的神經元對位置和大小以及部分遮擋,深度位置和照明方向 表現出不變性,深度旋轉已被證明具有最弱的不變性,除非對象是人臉。

對象類別尚未明確存在於區域 TE 中——神經元通常可能對同一類別的幾個但並非所有樣本做出響應(例如樹木的圖像),也可能對不同類別的樣本(例如,樹木和非樹)做出響應。對象識別和分類很可能涉及從大量 TE 神經元中採樣以及從其他大腦區域接收輸入這一過程,例如負責理解場景上下文的區域。最近的讀出實驗表明,可以訓練統計型分類器(例如支持向量機)根據少量 TE 神經元的響應對對象進行分類。因此,原則上,一群 TE 神經元可以通過它們的組合活動可靠地發出對象類別的信號。有趣的是,也有報道稱內側顳葉中的高度選擇性神經元會對非常特定的線索做出反應,例如,對不同圖像中的比薩斜塔或對特定的人臉做出反應。

視覺系統中的學習[編輯]

通過學習可以改變神經元的視覺特徵的選擇性,學習的效果在更高的大腦皮層上會變得更強。 目前沒有關於在視網膜中學習的已知證據,而且 V1 中的方向圖似乎在很大程度上是通過遺傳預先確定的,然而,通過增加調諧曲線的斜率的方式去練習方向識別,可以改善 V1 神經元中的方向編碼。 在 V4 中已經看到類似且更大的影響。 在 TE 區域,相對較少的視覺訓練,對視覺感知、單細胞感知水平以及 fMRI 具有顯着的生理影響。 例如,將兩個對象相互變形,會增加它們感知的相似性。 總的來說,即使是成人的視覺皮層似乎也具有相當大的可塑性,並且可塑性水平可以通過外界方式獲得顯著提升,例如通過服用特定藥物或生活在豐富的環境中。

深度神經網絡[編輯]

類似於靈長類視覺系統的深層層次結構,深度學習架構試圖通過使用多級非線性變換來對輸入數據的高級抽象進行建模。 Hubel 和 Wiesel 提出的模型在從視網膜和 LGN 到 V1 中的簡單細胞和複雜細胞的級聯中整合和傳播信息,激發了第一個深度學習架構之一的創建,即新認知機——一種多層人工神經網絡模型。它被用於不同的模式識別任務,包括手寫字符的識別。然而,訓練網絡花費了大量時間(以天為單位),自從 1980 年代深度學習問世以來,直到 2000 年代中期,隨着數字數據的豐富和更快的訓練算法的創造,深度學習才得以獲得更多的關注。不久前深度神經網絡已被證明在似乎只有人類才能執行的任務中非常有效,例如識別照片中特定人物的面孔、理解人類語音(在某種程度上)和翻譯外語文本。此外,它們已被證明在工業和科學中對尋找潛在的候選藥物、繪製大腦中的真實神經網絡和預測蛋白質的功能有很大幫助。必須指出的是,深度學習只是很鬆散地受到大腦的啟發,它更像是計算機科學/機器學習領域的成就,而不是神經科學。基本的相似之處在於,深度神經網絡由以非線性方式整合信息輸入(神經元)並相互發送信號(突觸)的單元組成,並且數據有不同級別的越來越抽象的表示。深度學習中使用的「神經元」的學習算法和數學描述與大腦中發生的實際過程大不相同。因此,深度學習的研究在大力推動更複雜的人工智能的同時,只能提供有限的關於大腦的見解。

參考文獻[編輯]

關於視覺系統深層層次結構的論文:
  • Kruger, N.; Janssen, P.; Kalkan, S.; Lappe, M.; Leonardis, A.; Piater, J.; Rodriguez-Sanchez, A. J.; Wiskott, L. Deep Hierarchies in the Primate Visual Cortex: What Can We Learn for Computer Vision?. IEEE Transactions on Pattern Analysis and Machine Intelligence. August 2013, 35 (8): 1847–1871. doi:10.1109/TPAMI.2012.272. 
  • Poggio, Tomaso; Riesenhuber, Maximilian. Hierarchical models of object recognition in cortex. Nature Neuroscience. 1 November 1999, 2 (11): 1019–1025. doi:10.1038/14819. 
視覺刺激減少實驗:
視覺系統的學習的證據:
  • Li, Nuo; DiCarlo, James J. Unsupervised Natural Visual Experience Rapidly Reshapes Size-Invariant Object Representation in Inferior Temporal Cortex. Neuron. 23 September 2010, 67 (6): 1062–1075. doi:10.1016/j.neuron.2010.08.029. 
  • Raiguel, S.; Vogels, R.; Mysore, S. G.; Orban, G. A. Learning to See the Difference Specifically Alters the Most Informative V4 Neurons. Journal of Neuroscience. 14 June 2006, 26 (24): 6589–6602. doi:10.1523/JNEUROSCI.0457-06.2006. 
  • Schoups, A; Vogels, R; Qian, N; Orban, G. Practising orientation identification improves orientation coding in V1 neurons.. Nature. 2 August 2001, 412 (6846): 549–53. PMID 11484056. 
對深度學習研究現狀的最新且可訪問的概述:
  • Jones, Nicola. Computer science: The learning machines. Nature. 8 January 2014, 505 (7482): 146–148. doi:10.1038/505146a. 

運動感知[編輯]

運動感知是推斷運動物體的速度和方向的過程。人類的 V5 區域和靈長類動物的 MT(中顳區)區域負責皮層運動感知。 V5 區是紋外皮層的一部分,它是大腦枕部區域中靠近初級視覺皮層的區域。V5區域的功能是檢測視覺刺激的速度和方向,並將局部視覺運動信號整合到全局運動中。 V1 區或初級視覺皮層位於大腦的兩個半球的枕葉,它處理視覺信息皮層處理的第一階段,該區域包含眼睛覆蓋的視野的完整地圖。區域V5和區域V1(初級視覺皮層)的區別在於,區域V5可以將局部信號或物體個別部分的運動整合成整個物體的全局運動。另一方面,區域 V1 響應感受野內發生的局部運動,來自這些許多神經元的模擬預估會被整合到區域 V5 中。

運動被定義為視網膜照明隨空間和時間的變化,運動信號分為一階運動和二階運動,這些運動類型將在以下段落中簡要描述。

「Beta 運動」的示例。
  • 一階運動感知* 是指當兩個或多個視覺刺激隨着時間的推移打開和關閉,並產生不同的運動知覺時所感知到的運動。一階運動也被稱為「視在運動」,它被用於電視和電影。一個例子是「Beta 運動」,這是一種錯覺,其中固定的圖像似乎在移動,即使它們在現實中並沒有移動。這些圖像給出了運動的表象,因為它們的變化和移動速度比眼睛可以檢測到的速度快。這種視錯覺的發生是因為人類的視神經以每秒十個周期對光的變化做出反應,所以任何比這個速度更快的變化將被註冊為連續運動,而不是單獨的圖像。
  • 二階運動感知*是指當運動輪廓由對比度、紋理、閃爍或其他一些不會導致圖像亮度或運動能量增加的質量定義時發生的運動。證據表明,一階運動和二階運動的早期處理是通過不同的途徑進行的。二階機制具有較差的時間分辨率,並且在它們響應的空間頻率範圍方面是低通的,二階運動產生的運動後效較弱。一階和二階信號會組合在 V5 中。

在本章中,我們將分析運動感知和運動分析的概念,並解釋這些術語不應互換使用的原因。我們將分析感知運動的機制,例如運動傳感器和特徵跟蹤,存在三種主要的理論模型試圖描述運動神經元傳感器的功能,並且已有相關的實驗測試用來確認這些模型是否準確。但是這些測試的結果尚無定論,可以說這些模型中沒有一個完全描述了運動傳感器的功能。但是,這些模型中的每一個都模擬了運動傳感器的某些功能,描述了這些傳感器的一些特性。最後,本章展示了一些運動錯覺,它們表明我們的運動感可能會被靜態的外部因素誤導,這些因素以與運動相同的方式刺激運動傳感器。

運動分析和運動感知[編輯]

「運動分析」和「運動感知」的概念經常被混淆為可互換的。運動感知和運動分析彼此很重要,但它們並不相同。

「運動分析」是指處理運動信號的機制。與運動感知不一定依賴於視網膜中圖像運動產生的信號類似,運動分析可能會也可能不會導致運動感知。這種現象的一個例子是矢量現象,當一個人在靜止時卻因為她觀察到的物體的移動,而感知到她自己在移動。矢量現象表明對象的運動可以被用來分析,即使該運動並不被感知為對象產生的運動。運動分析的這個定義表明運動是一個基本的圖像屬性。在視野中,每一個點都被分析,並且該分析的結果用於推導出感知信息。

「運動感知」是指獲取有關圖像中物體和表面運動的感知知識的過程。運動是通過視網膜中的精細局部傳感器或通過特徵跟蹤來感知的。類似於專門對顏色敏感的傳感器,局部運動傳感器對應於專門對運動敏感的神經元。特徵跟蹤是一種感知運動的間接方式,它包括從物體在視網膜的位置隨時間的變化而推斷出的運動,它也被稱為三階運動分析。特徵跟蹤的工作原理是將注意力集中在特定對象上並觀察其位置隨時間的變化。

運動傳感器[編輯]

運動檢測是視覺處理的第一階段,這要歸功於專門的神經過程,這些過程對有關圖像強度隨時間局部變化的信息做出響應。獨立於其他圖像屬性,運動會在圖像的所有位置進行感測。現在已經證明了運動傳感器的存在,並且它們在本地圖像中的所有點上運行。運動傳感器是位於視網膜中的專用神經元傳感器,能夠檢測由兩個短暫而微小的閃光產生的運動,這些閃光靠得太近以至於特徵跟蹤無法檢測到它們。現在存在三種主要模型試圖描述這些專用傳感器的工作方式,這些模型相互獨立,它們試圖對運動感知的特定特徵進行建模,儘管沒有足夠的證據支持這些模型中的任何一個代表視覺系統(特別是運動傳感器)感知運動的方式,但它們仍然正確地模擬了這些傳感器的某些功能。

兩種不同的運動檢測機制。 左)「Reichardt 檢測器」由兩個鏡像對稱的子單元組成。 在每個子單元中,在兩個相鄰點中測量的亮度值在其中一個被具有時間常數 τ 的低通濾波器延遲後彼此相乘(M),乘法器的結果輸出信號最終被減去。 右)在梯度檢測器中,在一個光感受器之後測量的時間亮度梯度(δI/δt,左)除以空間亮度梯度(δI/δx)。 這裡,空間梯度由兩個相鄰點的亮度值之間的差異來近似。


Reichardt 探測器

Reichardt 檢測器用於模擬運動傳感器如何響應一階運動信號。當物體從視野中的 A 點移動到 B 點時,會產生兩個信號:一個是在運動開始前,另一個是在運動完成後。該模型通過檢測視網膜上某一點的亮度變化,並在短暫延遲後將其與附近另一點的亮度變化相關聯來感知這種運動。 Reichardt 檢測器基於相關性原理(涉及依賴的統計關係)運行。它通過相鄰點的亮度信號的時空相關性來解釋運動信號。它利用了一個事實,即運動物體軌跡上不同點的兩個感受野接收同一信號的時移版本——亮度模式沿軸移動,軸上一點的信號是軸中的先前信號。 Reichardt 檢測器模型具有兩個空間分離的相鄰檢測器。檢測器的輸出信號按以下方式相乘(相關):一個信號乘以作為原始時移版本的第二個信號。重複相同的過程,但運動方向相反(時移的信號成為第一個信號,反之亦然)。然後,取這兩個乘法之間的差,結果給出運動速度,探測器的響應取決於刺激的相位、對比度和速度,許多以不同速度調諧的檢測器對於編碼模式的真實速度是必要的。這種探測器最引人注目的實驗證據來自對幾乎不可見目標的方向辨別的研究。

運動能量過濾

運動能量濾波器是一種基於相位不變濾波器原理的運動傳感器模型。該模型構建面向時空的時空過濾器,以匹配移動模式的結構。它由可分離的過濾器組成,其空間輪廓隨時間保持相同的形狀,但空間輪廓會同時被時間過濾器的值進行縮放。運動能量過濾器通過添加可分離的過濾器來匹配運動特徵的結構。對於每個運動方向,都會生成兩個時空濾波器:一個是對稱的(條狀),一個是非對稱的(邊緣狀)這些濾波器的平方和稱為運動能量,兩個方向的信號差異稱為對手能量。然後將該結果除以另一個濾波器的平方輸出,該濾波器調整為靜態對比度。執行這種劃分是為了考慮運動中的對比度的影響。運動能量濾波器可以模擬多種運動現象,但它會產生與相位無關的測量值,該測量值隨速度增加但不提供可靠的速度值。

時空梯度



這種運動傳感器模型最初是在計算機視覺領域開發的,它是基於圖像亮度的時間導數與圖像亮度的空間導數之比給出運動速度的原理。 需要注意的是,在圖像的波峰和波谷處,該模型將無法計算出有效的答案,因為分母中的導數將為零。 為了解決這個問題,還可以分析關於空間和時間的一階和高階空間導數。 時空梯度是一個很好的模型,可以用於確定圖像中所有點的運動速度。

運動傳感器具有方向選擇性[編輯]

運動傳感器的特性之一是方向選擇性,它將運動分析限制在單一維度,運動傳感器只能記錄沿與傳感器首選方向正交的軸的一維運動,包含該單一方向特徵的視覺刺激,只有在與傳感器首選方向的正交方向上的移動(運動在該正交方向上的投影)可以被看到。 一維運動信號只能給出關於二維物體運動的模糊信息,所以運動分析的第二階段是必要的,以便解析二維物體或圖案的真實運動方向。 可以通過將調諧到不同方向的傳感器的一維運動信號組合,來產生明確的二維運動信號。 同時,二維運動的分析取決於來自局部寬定向傳感器的信號以及來自窄定向傳感器的信號。

特徵跟蹤[編輯]

我們感知運動的另一種方式是通過特徵跟蹤。特徵跟蹤包括分析對象的局部特徵是否改變了位置,並從這種變化中推斷出運動。在本節中,會提到一些特徵跟蹤的特性。

當移動刺激發生得非常快時,特徵跟蹤器就會失敗。與運動傳感器相比,特徵跟蹤器的優勢在於,即使運動被間歇性空白間隔分開,它們也可以感知對象的運動。他們還可以將這兩個階段(移動和空白間隔)分開。另一方面,運動傳感器只會將空白與運動刺激相結合,並看到連續運動。特徵跟蹤器對已識別特徵的位置進行操作,出於這個原因,它們有一個最小距離閾值,該閾值與可以區分特徵位置的精度相匹配。特徵跟蹤器不會顯示運動後遺症,即由於視覺適應引起的視覺錯覺。當觀察到移動刺激後,靜止物體似乎在與先前觀察到的移動刺激相反的方向上移動時,就會發生運動後效。這種機制不可能同時監測視野不同部分的多種運動。另一方面,多個運動對於運動傳感器來說不是問題,因為它們在整個視野中並行運行。

上述信息已被使用並進行了實驗,並得出了有關特徵跟蹤器的有趣結論。簡短刺激的實驗表明,高對比度下的顏色模式和對比模式不是由特徵跟蹤器感知的,而是由運動傳感器感知的。空白間隔的實驗已經證實,在顯示中的空白間隔下可以進行特徵跟蹤。只有在高對比度下,運動傳感器才能感知色彩刺激和對比模式的運動。在低對比度下,特徵跟蹤器能夠分析彩色圖案和對比度包絡的運動,而在高對比度下,運動傳感器可以分析對比度包絡。受試者進行多次運動判斷的實驗表明,特徵跟蹤是一個在有意識控制下發生的過程,它是我們在低對比度顯示器中分析對比度包絡運動的唯一方法。這些結果與對比度包絡和顏色模式的運動取決於特徵跟蹤的觀點一致,除非顏色遠高於閾值或平均對比度很高。這些實驗的主要結論是,特徵跟蹤很可能包含對對比度包絡和顏色模式的感知。

運動錯覺[編輯]

作為運動檢測的結果,一些靜態圖像在我們看來可能看起來像是在移動。這些圖像可以讓我們對視覺系統所做的假設(視覺錯覺)給以更深的認知。

與一階運動信號相關的著名運動錯覺是 Phi 現象,這是一種使我們感知運動而不是圖像序列的視錯覺。這種運動錯覺使我們能夠將電影視為連續體而不是單獨的圖像。 phi 現象允許一組以恆定速度變化的凍結圖像被視為一個恆定的運動。 Phi 現象不應與 Beta 運動混淆,因為前者是由連續的發光脈衝引起的運動,而後者是由發光靜止脈衝引起的運動。

當運動感知、運動分析和對這些信號的解釋具有誤導性時,就會發生運動幻覺,並且我們的視覺系統會產生關於運動的幻覺。這些幻覺可以根據允許它們發生的過程進行分類。錯覺被歸類為與運動感應、2D 集成和 3D 解釋相關的錯覺

最流行的關於運動感知的錯覺是四衝程運動、RDK 和二階運動信號錯覺。最流行的關於 2D 集成的運動錯覺是運動捕捉、格子運動和直接排斥。類似地,與 3D 解釋相關的有變換運動、動力學深度、陰影運動、生物運動、立體運動、隱式圖形運動和 2 筆畫運動。還有更多的運動錯覺,它們都展示了一些關於人體運動檢測、感知和分析機制的有趣內容。相關的更多信息,請訪問以下鏈接:http://www.lifesci.sussex.ac.uk/home/George_Mather/Motion/

未解決的問題[編輯]

孔徑問題

儘管我們仍然不了解有關運動感知的大部分細節,但了解運動被感知的機制以及運動錯覺可以讓讀者很好地了解該主題的最新進展。關於運動感知的一些開放問題有:在全局運動中形成 3D 圖像的機制和孔徑問題。

通過整合來自視網膜的全局運動信號,人們可以獲得二維的全局運動信號;然而,目前尚不清楚 3D 全局運動是如何形成的。孔徑問題的產生是因為視覺系統中的每個感受野只覆蓋了視覺世界的一小部分,這導致了感知的模糊性。孔徑問題是指當局部觀察運動輪廓時,不同的運動帶來的觀察結果會是一致的。這種模糊性起源於——平行於輪廓的運動是無法被無法檢測到的,於是在運動的這一分量上發生的變化,在通過孔徑觀察到的圖像是不會改變的。唯一可以測量的分量是與輪廓方向正交的速度,出於這個原因,物體的運動可以是很多的方向。這個孔徑問題不僅在直線輪廓中觀察到,而且在平滑彎曲的輪廓中也被觀察到,因為平滑曲線在局部觀察時可以近似成一條直線。儘管解決孔徑問題的機制仍然未知,但關於如何解決它存在一些假設。例如,可以通過組合跨空間的信息,或來自同一對象不同輪廓的信息來解決此問題。

結論[編輯]

在本章中,我們介紹了運動感知以及視覺系統檢測運動的機制。 運動錯覺展示了運動信號如何具有誤導性,從而導致錯誤的運動觀察。但重要的是要記住,運動感知和運動分析是不同的,同時運動傳感器和特徵跟蹤器相輔相成,使視覺系統感知運動。

運動感知是複雜的,它仍然是一個開放的研究領域。本章描述了關於運動傳感器工作方式的模型,以及關於特徵跟蹤器特徵的假設,然而,需要更多的實驗來了解這些機制的特徵,並能夠更準確地構建與視覺系統實際過程相似的模型。

本章描述的各種運動分析和運動感知機制,以及設計用於描述它們的人工模型的複雜性表明,皮層處理來自外部環境的信號的方式非常複雜。數以千計的專門神經元整合併解釋局部信號片段,以形成我們大腦中移動物體的全局圖像。通過了解我們身體中如此多的參與者和過程必須協同工作才能感知到運動,這使我們的能力顯得更加卓越,因為我們人類能夠如此輕鬆地做到這一點。

色彩感知[編輯]

介紹[編輯]

人類(以及猴子和大猩猩等靈長類動物)在哺乳動物中擁有最好的顏色感知能力[1]。因此,顏色在許多方面都發揮着重要作用,這並非巧合。例如,顏色可用於區分物體、表面、自然風光,甚至人臉 [2],[3],除了情感,顏色也是一種非語言交流的重要工具 [4]

幾十年來,尋找顏色的物理特性與其感知品質之間的聯繫一直是一項挑戰。通常,這些是通過兩種不同的方法進行研究的:由顏色引起的行為反應(也稱為心理物理學)和由顏色引起的實際生理反應 [5]

這裡我們只關注後者。對色覺生理基礎的研究,在 20 世紀下半葉之前幾乎一無所知,自 1950 年以來一直在緩慢而穩定地發展。現在在許多領域取得了重要進展,特別是在受體水平。多虧了分子生物學方法,才有可能揭示有關錐體色素遺傳基礎的先前未知的細節。此外,越來越多的皮層區域已被證明受到視覺刺激的影響,儘管顏色感知與受體之外的波長依賴性生理活動的相關性並不那麼容易辨別 [6]

在本章中,我們旨在解釋沿着視覺路徑的不同顏色感知過程的基礎知識,從眼睛中的視網膜到大腦中的視覺皮層。(有關傳遞路徑的細節,請參閱第 2 節。本維基教科書的「視覺系統剖析」。)

視網膜上的色彩感知[編輯]

人類可以辨別的所有顏色都可以通過三種主要(基本)顏色的混合來產生。受這種顏色混合思想的啟發,有人提出顏色由三類傳感器輔助,每種傳感器對可見光譜的不同部分具有最大的靈敏度 [1]。 1853 年首次明確提出正常顏色匹配存在三個自由度[7],這後來在 1886 年得到證實 [8] (結果與最近的研究 [9], [10] 非常接近)。

這些提議的顏色傳感器實際上是所謂的視錐(注意:在本章中,我們將只處理視錐。視杆僅在低光照水平下對視覺有貢獻。雖然已知它們對顏色感知有影響,但它們的影響很小,這裡可以忽略。)[11]。視錐細胞是在視網膜中發現的兩種類型的感光細胞中的一種,它們在中央凹中的濃度很高。下表列出了三種類型的視錐細胞。它們的區別在於不同類型的視紫紅質色素。它們對應的吸收曲線如下圖所示。

在視網膜中發現的錐體類型的一般概述。
名稱 對顏色的敏感度更高 吸收曲線峰值 [nm]
S,SWS,B 藍色 420
M,MWS,G 綠色 530
L,LWS,R 紅色 530
Absorption curves for the different cones. Blue, green, and red represent the absorption of the S (420 nm), M (530 nm), and L (560 nm) cones, respectively.
不同錐體的吸收曲線。 藍色、綠色和紅色分別代表 S (420 nm)、M (530 nm) 和 L (560 nm) 錐的吸收。

儘管對不同錐體類型的命名尚未達成共識,但最廣泛使用的名稱是指它們的作用光譜峰或它們本身敏感的顏色(紅色、綠色、藍色)[6]。在本文中,我們將使用 S-M-L 名稱(短、中和長波),因為這些名稱更適合描述。藍-綠-紅命名法有點誤導,因為所有類型的錐體都對一定大範圍的波長敏感。

三種錐體類型的一個重要特徵是它們在視網膜中的相對分布。事實證明,S 錐體在視網膜中呈現出相對較低的濃度,在中央凹的最中央區域完全不存在。實際上,儘管它們能夠調節弱邊界感知 [12],但它們的間距太大而無法在空間視覺中發揮重要作用。中央凹以 L 和 M 錐體為主,兩者的比例通常以比率來衡量。有L/M 比率的不同值被報告出來,範圍從 0.67 [13] 到 2 [14]不等,後者數值是被廣泛接受的,至於為什麼 L 錐體幾乎總是多於 M 錐體還不是很清楚。令人驚訝的是,不同的視錐比,對色覺幾乎沒有顯着影響。這清楚地表明大腦是可塑的,可以理解它接收到的任何錐體信號[15], [16]

同樣重要的是要注意 L 和 M 錐吸收光譜的重疊。雖然 S 錐吸收光譜明顯和其他兩者分開,但 L 和 M 錐峰僅相距約 30 nm,它們的光譜曲線也明顯重疊。這導致這兩個錐類的光子捕獲量具有高度相關性。這是因為為了在中央凹的中心獲得儘可能高的敏銳度,視覺系統同等對待 L 和 M 錐,而不考慮它們的吸收光譜。因此,任何種類的差異都會導致亮度信號的惡化 [17]。換句話說,L-和M-錐光譜之間的小分離可能被解釋為高對比度色覺和高敏銳亮度視覺需求之間的折衷。這與視敏度最高的中央凹中央缺乏 S 錐體的現象是一致的。此外,L-和M-錐吸收光譜的緊密間隔也可能由它們的遺傳起源來解釋:兩種錐體類型都被認為是「最近」(大約 3500 萬年前)從一個共同祖先進化而來的,而 S 錐體可能更早地從祖先受體中分離出來 [11]

三種不同類型視錐細胞的光譜吸收功能是人類色覺的標誌。這個理論解決了一個眾所周知的問題:雖然我們可以看到數百萬種不同的顏色(人類可以區分 7 到 1000 萬種不同的顏色[5]),但我們的視網膜根本沒有足夠的空間,在每個視網膜區域裡,容納每個顏色的單獨檢測器。

從視網膜到大腦[編輯]

從視網膜傳輸到更高層次的信號不是受體信號的簡單逐點表示,而是由受體信號的複雜組合組成。本節的目的是簡要介紹其中一些信息所採用的路徑。

一旦視網膜上的光學圖像在光感受器中轉換為化學和電信號,調幅信號就會在神經節細胞和更高級別轉換為調頻形式。在這些神經細胞中,信號的大小用細胞每秒發射的電壓脈衝數表示,而不是細胞膜上的電壓差。為了解釋和表示這些細胞的生理特性,我們會發現感受野的概念非常有用。

感受野是給定細胞響應的視野區域的圖形表示。此外,響應的性質通常針對感受野中的各個區域進行指示。例如,我們可以將光感受器的感受野視為一個小圓形區域,代表該特定感受器在視野中的敏感度的大小和位置。下圖顯示了神經節細胞的示例性感受野,通常處於中心-環繞拮抗狀態。圖中左側的感受野說明了正極的中央反應(稱為開型ON中心)。這種響應通常是由單個錐體的正輸入產生的,周圍是幾個相鄰錐體產生的負響應。因此,該神經節細胞的反應將由來自具有正負號的各種錐體的輸入組成。通過這種方式,細胞不僅對光點做出響應,而且還充當邊緣(或更準確地說,點)檢測器。與計算機視覺術語類似,我們可以將神經節細胞響應視為與邊緣檢測器內核卷積的輸出。圖中右側的感受野說明了負中心反應(稱為關型OFF中心),這同樣可能。通常,開型中心和關型中心的細胞將出現在相同的空間位置,由相同的光感受器饋送,從而導致動態範圍增強。

Antagonist receptive fields (on center)
開型中心感受野
Antagonist receptive fields (off center)
關型中心感受野
空間拮抗劑感受野

下圖顯示除了空間拮抗作用外,神經節細胞也可以有光譜對抗作用。例如,下圖的左側部分說明了紅綠色對手的反應,中心由 L 錐體的正輸入饋送,周圍由 M 錐體的負輸入饋送。另一方面,下圖的右側部分說明了該單元的關型中心版本。因此,在視覺信息甚至離開視網膜之前,處理就已經發生,對顏色外觀產生深遠的影響。還有其他類型和種類的神經節細胞反應,但它們都共享這些基本概念。

Spectrally and spatially antagonist receptive fields (on center)
On center
Spectrally and spatially antagonist receptive fields (off center)
Off center
光譜和空間拮抗感受野

在到達初級視覺皮層的途中,神經節細胞軸突聚集形成視神經,視神經投射到丘腦的外側膝狀核 (LGN)。視神經中的編碼效率很高,將神經纖維的數量保持在最低限度(受視神經大小的限制),從而使視網膜盲點的大小儘可能小(大約 5° 寬 x 7°高的)。此外,呈現的神經節細胞對均勻照明沒有反應,因為正區域和負區域是平衡的。換句話說,傳輸的信號是不相關的。例如,來自自然場景相鄰部分的信息在空間上高度相關,因此高度可預測[18]。相鄰視網膜神經節細胞之間的橫向抑制最大限度地減少了這種空間相關性,從而提高了效率。我們可以將其視為在視網膜中進行的圖像壓縮過程。

鑑於 L 和 M 錐吸收光譜的重疊,它們的信號也高度相關。在這種情況下,通過組合錐形信號以最小化所述相關性來提高編碼效率。我們可以使用主成分分析 (PCA) 更輕鬆地理解這一點。 PCA 是一種統計方法,用於通過將原始變量轉換為一組新變量,即主成分 (PC) 來降低給定變量集的維數。第一個 PC 解釋了原始變量中最大的總方差,第二個 PC 解釋了第一個組件未解釋的最大方差,依此類推。此外,PC 在參數空間中是線性獨立且相互正交的。 PCA 的主要優勢在於,只需要少數最強的 PC 就足以覆蓋絕大多數系統可變性 [19]。該方案已用於錐形吸收函數 [20] 甚至自然發生的光譜 [21],[22]。在自然物體產生的錐體激發空間中發現的 PC 是

  1. L-和 M-錐體信號相加的亮度軸 (L+M),
  2. L-和 M-錐體的差異信號 (LM),
  3. 色軸,其中 S 錐信號與 L 和 M 錐信號的總和不同 (S-(L+M))。

這些通道源自數學/計算方法,與電生理實驗中發現的三個視網膜膝狀體通道一致 [23],[24]。使用這些機制,可以消除視網膜中的視覺冗餘信息。

有三個信息通道實際上將這些信息從視網膜通過神經節細胞傳遞到 LGN,它們不僅在顏色特性上不同,而且在解剖基底上也不同。這些通道對基本顏色任務(例如檢測和辨別)構成了重要限制。

在第一個通道中,L-和 M-錐體的輸出協同傳輸到擴散雙極細胞,然後到 LGN 的大細胞層 (M-) 中的細胞(不要與視網膜的 M-錐體混淆) [24]。 M 細胞的感受野由中心和周圍組成,它們在空間上是對立的。 M-cells 對亮度刺激具有高對比度敏感性,但它們在 L-M 對手輸入的某些組合下沒有反應[25]。但是,由於不同 M 細胞的零點略有不同,因此種群響應永遠不會真正為零。這種特性實際上被傳遞到具有主要 M 細胞輸入的皮層區域 [26]

細小細胞通路 (P-) 起源於從 L 或 M 錐到小型雙極細胞的單個輸出。這些為視網膜 P 細胞提供輸入[11]。在中央凹中,P 細胞的感受野中心由單個 L 或 M 錐體形成。 P 細胞感受野環繞的結構仍然存在爭議。然而,最被接受的理論指出,環繞由特定的錐體類型組成,導致亮度刺激的空間對立感受野[27]。細小細胞層約占從視網膜到 LGN 的總投影的 80%[28]

最後,最近發現的角膜細胞途徑 (K-) 主要攜帶來自 S-cones 的信號[29]。這種類型的錐體組投射到特殊的雙極細胞,後者又為特定的小神經節細胞提供輸入,這些通常不是空間對立的存在。而後小神經節細胞的軸突投射到 LGN 的薄層(與細小細胞層相鄰)[30]

雖然神經節細胞確實終止於 LGN(與 LGN 細胞形成突觸),但神經節細胞和 LGN 細胞之間似乎是一一對應的。 LGN 似乎充當信號的中繼站。然而,它可能提供一些視覺功能,因為從皮層到 LGN 的神經投射可以作為某種類型的轉換或適應反饋機制。 LGN 細胞的軸突投射到枕葉視覺皮層中的視覺區域 1 (V1)。

大腦的顏色感知[編輯]

(Partial) flow diagram illustrating the many streams of visual information processes that take place in the visual cortex. It is important to note that information can flow in both directions.
(部分)流程圖說明了在視覺皮層中發生的許多視覺信息過程流。 需要注意的是,信息可以雙向流動。

在皮層中,來自大、小和角膜細胞通路的投射終止於初級視覺皮層的不同層。大細胞纖維主要支配第 4Cα 層和第 6 層。細小細胞神經元主要投射到 4Cβ 和第 4A 層和第 6 層。角質細胞神經元終止於第 1、2 和 3 層中富含細胞色素氧化酶 (CO-) 的斑點[31]

一旦進入視覺皮層,視覺信息的編碼就會變得更加複雜。以同樣的方式,各種光感受器的輸出被組合和比較以產生神經節細胞反應,各種 LGN 細胞的輸出被比較和組合以產生皮層反應。隨着信號在皮層處理鏈中進一步向前推進,這個過程會不斷重複,其複雜程度迅速增加,以至於感受野開始失去意義。然而,一些功能和過程已經在視覺皮層的特定區域被識別和被研究了。

在 V1 區域(紋狀皮層)中,雙重對立神經元——它們的感受野在顏色和空間上都相對於單個感受野的開/關區域相反的神經元——會比較視覺空間中的顏色信號[32]。它們占 V1 中細胞的 5% 到 10%,它們的粗大尺寸和小百分比與色覺的較差空間分辨率相符合 [1]。此外,它們對運動刺激的方向不敏感(與其他一些 V1 神經元不同),因此不太可能有助於運動感知[33]。然而,鑑於它們專門的感受野結構,這些細胞是顏色對比效應的神經基礎,也是顏色編碼的有效手段[34],[35]。其他 V1 細胞對其他類型的刺激做出反應,例如定向邊緣、各種空間和時間頻率、特定空間位置以及這些特徵的組合等。此外,我們可以找到線性組合來自 LGN 單元的輸入信號的單元以及執行非線性組合的單元。通過這些響應來支持高級視覺功能,例如顏色本身。

與 V1 相比,V2 中單個神經元的色彩特性的信息要少得多。乍一看,V1 和 V2 中的顏色編碼似乎沒有重大差異[36]。一個例外是出現了一類新的顏色複雜細胞[37]。因此,有人建議 V2 區域參與色調的形成。但是,這仍然存在很大爭議,尚未得到證實。

遵循在 V1 中發現功能性眼優勢後開發的模塊化概念,並考慮到 P-、M-和 K-通路之間的解剖隔離(在第 3 節中描述),有人建議在視覺中建立一個專門的系統專門用於分析顏色信息的皮質應該存在[38]。 V4 是歷史上最受關注的區域,因為它可能是大腦的「顏色區域」。這是因為一項有影響力的研究聲稱 V4 包含 100% 的色調選擇性細胞 [39]。然而,這一說法受到了許多後續研究的質疑,有些甚至報告說只有 16% 的 V4 神經元顯示色調調整[40]。目前,最被接受的概念是 V4 不僅有助於顏色,還有助於形狀感知、視覺注意力和立體視覺。此外,最近的研究集中在試圖找到大腦的「顏色區域」的其他大腦區域,例如 TEO[41] 和 PITd[42]。這些地區之間的關係仍然存在爭議。為了協調討論,一些人使用術語後下顳 (PIT) 皮層來表示包括 V4、TEO 和 PITd 的區域[1]

如果 V1、V2 和 V4 細胞中的皮層反應已經是一項非常複雜的任務,那麼在大約 30 個視覺區域的網絡中,複雜視覺反應的複雜程度是巨大的。下圖顯示了已識別的不同皮質區域(不是細胞)的一小部分連通性 [43].。

在這個階段,用簡單的術語解釋單個皮層細胞的功能變得非常困難。事實上,單個細胞的功能可能沒有意義,因為各種感知的表示必須分布在整個皮層的細胞集合中。

色覺適應機制[編輯]

儘管研究人員一直試圖解釋人類視覺系統中顏色信號的處理過程,但重要的是要了解顏色感知不是一個固定的過程。 實際上,有多種動態機制可用於根據觀看環境優化視覺響應。 與顏色感知特別相關的是暗、光和色適應的機制。

暗適應[編輯]
Dark adaptation. During the first 10 minutes (i.e. to the left of the dotted line), sensitivity recovery is done by the cones. After the first 10 minutes (i.e. to the right of the dotted line), rods outperform the cones. Full sensitivity is recovered after approximately 30 minutes.
暗適應。 在前 10 分鐘內(即虛線左側),錐體完成靈敏度恢復。 在前 10 分鐘後(即在虛線右側),杆的表現優於錐體。 大約 30 分鐘後恢復完全靈敏度。

暗適應是指當光照水平降低時發生的視覺靈敏度變化。視覺系統對減少照明的反應會變得更加敏感,即使在光線條件不理想的情況下,也會提升其產生有意義的視覺反應的能力[44]

上圖顯示了從極高照度水平過渡到完全黑暗後視覺靈敏度的恢復[43]。首先,錐體逐漸變得更加敏感,直到幾分鐘後曲線趨於平穩。經過大約 10 分鐘後,視覺靈敏度大致恆定。此時,具有較長恢復時間的杆系統已恢復足夠的靈敏度以勝過錐體,因此恢復控制整體靈敏度。視杆靈敏度也逐漸提高,直到大約 30 分鐘後變得漸近。換句話說,視錐細胞負責前 10 分鐘的靈敏度恢復。之後,杆的表現優於錐體並在大約 30 分鐘後獲得完全靈敏度控制。

這只是為了儘可能適應黑暗閃電條件而產生的幾種神經機制之一。其他一些神經機制包括眾所周知的瞳孔反射、光色素的消耗和再生、對視網膜細胞的控制和其他高級機制以及認知解釋等。

光適應[編輯]
Light adaptation. For a given scene, the solid lines represent families of visual response curves at different (relative) energy levels. The dashed line represents the case where we would adapt in order to cover the entire range of illumination, which would yield limited contrast and reduced sensitivity.
光適應。 對於給定的場景,實線代表不同(相對)能級的視覺響應曲線族。 虛線代表我們將適應以覆蓋整個照明範圍的情況,這將產生有限的對比度和降低的靈敏度。

光適應本質上是暗適應的逆過程。事實上,這兩個過程的潛在生理機制是相同的。但是,由於其視覺屬性不同,因此單獨考慮它很重要。

當照明水平增加時發生光適應。因此,鑑於有明顯更多的可見光可用,視覺系統必須變得不那麼敏感才能產生有用的感知。視覺系統具有有限的輸出動態範圍,可用於產生我們感知的信號。然而,現實世界的照度水平至少要高出 10 個數量級。幸運的是,我們很少需要同時查看整個照明水平範圍。

在高光水平下,適應是通過光色素漂白實現的。這可以縮放受體中的光子捕獲,並保護錐體響應免於在明亮的背景下飽和。光適應的機制主要發生在視網膜內[45]。事實上,增益變化在很大程度上是視錐細胞特定的,適應池信號覆蓋不大於單個視錐細胞直徑的區域[46],[47]。這表明光適應的定位可能早於受體。然而,似乎有不止一個敏感度縮放位點。一些增益變化非常迅速,而另一些則需要幾秒鐘甚至幾分鐘才能穩定[48]。通常,光適應大約需要 5 分鐘(比暗適應快 6 倍),這可能表明接受後位點的影響。

上圖顯示了光適應的示例 [43]。如果我們使用單個響應函數將大範圍的強度映射到視覺系統的輸出中,那麼對於給定的場景,我們只能使用非常小的範圍。很明顯,使用這樣的響應函數,任何給定場景的感知對比度都會受到限制,並且由於信噪比問題,視覺對於變化的敏感性將嚴重下降,這種情況用虛線表示。另一方面,實線代表視覺反應系列。這些曲線將任何給定場景中的有用照明範圍映射到視覺輸出的完整動態範圍,從而為每種情況產生最佳的視覺感知。光適應可以被認為是沿着照明水平軸滑動視覺響應曲線的過程,直到達到給定觀看條件的最佳水平。

色彩適應[編輯]

色適應的一般概念在於三個錐體光譜響應曲線的高度變化。這種調整的產生是因為光適應在每一類錐體內獨立發生。這種假設的具體表述被稱為「馮·克里斯適應」。該假設指出,適應響應分別發生在三種錐體類型中的每一種中,相當於將它們的固定光譜靈敏度乘以縮放常數[49]。如果縮放權重(也稱為馮·克里斯係數)與每種錐體類型的光吸收成反比(即較低的吸收將需要較大的係數),則馮·克里斯縮放在每個錐體類中保持恆定的平均響應。這提供了一種簡單而強大的機制,用於在照明發生變化的情況下保持物體的感知顏色。在許多不同的條件下,馮·克里斯縮放很好地說明了光適應對顏色敏感性和外觀的影響[50],[51]

描繪色彩適應的最簡單方法是在不同類型的照明下檢查白色物體。例如,讓我們考慮在日光、熒光燈和白熾燈照明下檢查一張紙。日光比熒光燈包含相對多得多的短波能量,而白熾燈所包含的長波能量比熒光燈多得多。然而,儘管光照條件不同,紙張在所有三種光源下大致保持其白色外觀。這是因為 S 錐系統在日光下變得相對不那麼敏感(為了補償額外的短波能量),而 L 錐系統在白熾燈照明下變得相對不那麼敏感(為了補償額外的長波能量)[43]

  1. 1.0 1.1 1.2 1.3 Conway, Bevil R. Color vision, cones, and color-coding in the cortex. The neuroscientist. 2009, 15: 274–290. 
  2. Russell, Richard and Sinha, Pawan}. Real-world face recognition: The importance of surface reflectance properties. Perception. 2007, 36 (9). 
  3. Gegenfurtner, Karl R and Rieger, Jochem. Sensory and cognitive contributions of color to the recognition of natural scenes. Current Biology. 2000, 10 (13): 805–808. 
  4. Changizi, Mark A and Zhang, Qiong and Shimojo, Shinsuke. Bare skin, blood and the evolution of primate colour vision. Biology letters. 2006, 2 (2): 217–221. 
  5. 5.0 5.1 Beretta, Giordano. Understanding Color. Hewlett-Packard. 2000. 
  6. 6.0 6.1 Boynton, Robert M. Color vision. Annual review of psychology. 1988, 39 (1): 69–100. 
  7. Grassmann, Hermann. Zur theorie der farbenmischung. Annalen der Physik. 1853, 165 (5): 69–84. 
  8. Konig, Arthur and Dieterici, Conrad. Die Grundempfindungen und ihre intensitats-Vertheilung im Spectrum. Koniglich Preussischen Akademie der Wissenschaften. 1886. 
  9. Smith, Vivianne C and Pokorny, Joel. Spectral sensitivity of the foveal cone photopigments between 400 and 500 nm. Vision research. 1975, 15 (2): 161–171. 
  10. Vos, JJ and Walraven, PL. On the derivation of the foveal receptor primaries. Vision Research. 1971, 11 (8): 799–818. 
  11. 11.0 11.1 11.2 Gegenfurtner, Karl R and Kiper, Daniel C. Color vision. Neuroscience. 2003, 26 (1): 181. 
  12. Kaiser, Peter K and Boynton, Robert M. Role of the blue mechanism in wavelength discrimination. Vision research. 1985, 125 (4): 523–529. 
  13. Paulus, Walter and Kroger-Paulus, Angelika. A new concept of retinal colour coding. Vision research. 1983, 23 (5): 529–540. 
  14. Nerger, Janice L and Cicerone, Carol M. The ratio of L cones to M cones in the human parafoveal retina. Vision research. 1992, 32 (5): 879–888. 
  15. Neitz, Jay and Carroll, Joseph and Yamauchi, Yasuki and Neitz, Maureen and Williams, David R. Color perception is mediated by a plastic neural mechanism that is adjustable in adults. Neuron. 2002, 35 (4): 783–792. 
  16. Jacobs, Gerald H and Williams, Gary A and Cahill, Hugh and Nathans, Jeremy. Emergence of novel color vision in mice engineered to express a human cone photopigment. Science. 2007, 315 (5819): 1723–1725. 
  17. Osorio, D and Ruderman, DL and Cronin, TW. Estimation of errors in luminance signals encoded by primate retina resulting from sampling of natural images with red and green cones. JOSA A. 1998, 15 (1): 16–22. 
  18. Kersten, Daniel. Predictability and redundancy of natural images. JOSA A. 1987, 4 (112): 2395–2400. 
  19. Jolliffe, I. T. Principal Component Analysis. Springer. 2002. 
  20. Buchsbaum, Gershon and Gottschalk, A. Trichromacy, opponent colours coding and optimum colour information transmission in the retina. Proceedings of the Royal society of London. Series B. Biological sciences. 1983, 220 (1218): 89–113. 
  21. Zaidi, Qasim. Decorrelation of L-and M-cone signals. JOSA A. 1997, 14 (12): 3430–3431. 
  22. Ruderman, Daniel L and Cronin, Thomas W and Chiao, Chuan-Chin. Statistics of cone responses to natural images: Implications for visual coding. JOSA A. 1998, 15 (8): 2036–2045. 
  23. Lee, BB and Martin, PR and Valberg, A. The physiological basis of heterochromatic flicker photometry demonstrated in the ganglion cells of the macaque retina. The Journal of Physiology. 1998, 404 (1): 323–347. 
  24. 24.0 24.1 Derrington, Andrew M and Krauskopf, John and Lennie, Peter. Chromatic mechanisms in lateral geniculate nucleus of macaque. The Journal of Physiology. 1984, 357 (1): 241–265. 
  25. Shapley, Robert. Visual sensitivity and parallel retinocortical channels. Annual review of psychology. 1990, 41 (1): 635––658. 
  26. Dobkins, Karen R and Thiele, Alex and Albright, Thomas D. Comparison of red--green equiluminance points in humans and macaques: evidence for different L: M cone ratios between species. JOSA A. 2000, 17 (3): 545–556. 
  27. Martin, Paul R and Lee, Barry B and White, Andrew JR and Solomon, Samuel G and Ruttiger, Lukas. Chromatic sensitivity of ganglion cells in the peripheral primate retina. Nature. 2001, 410 (6831): 933–936. 
  28. Perry, VH and Oehler, R and Cowey, A. Retinal ganglion cells that project to the dorsal lateral geniculate nucleus in the macaque monkey. Neuroscience. 1984, 12 (4): 1101––1123. 
  29. Casagrande, VA. A third parallel visual pathway to primate area V1. Trends in neurosciences. 1994, 17 (7): 305–310. 
  30. Hendry, Stewart HC and Reid, R Clay. The koniocellular pathway in primate vision. Annual review of neuroscience. 2000, 23 (1): 127–153. 
  31. Callaway, Edward M. Local circuits in primary visual cortex of the macaque monkey. Annual review of neuroscience. 1998, 21 (1): 47–74. 
  32. Conway, Bevil R. Spatial structure of cone inputs to color cells in alert macaque primary visual cortex (V-1). The Journal of Neuroscience. 2001, 21 (8): 2768–2783. 
  33. Horwitz, Gregory D and Albright, Thomas D. Paucity of chromatic linear motion detectors in macaque V1. Journal of Vision. 2005, 5 (6). 
  34. Danilova, Marina V and Mollon, JD. The comparison of spatially separated colours. Vision research. 2006, 46 (6): 823–836. 
  35. Wachtler, Thomas and Sejnowski, Terrence J and Albright, Thomas D. Representation of color stimuli in awake macaque primary visual cortex. Neuron. 2003, 37 (4): 681–691. 
  36. Solomon, Samuel G and Lennie, Peter. Chromatic gain controls in visual cortical neurons. The Journal of neuroscience. 2005, 25 (19): 4779–4792. 
  37. Hubel, David H. Eye, brain, and vision. Scientific American Library/Scientific American Books. 1995. 
  38. Livingstone, Margaret S and Hubel, David H. Psychophysical evidence for separate channels for the perception of form, color, movement, and depth. The Journal of Neuroscience. 1987, 7 (11): 3416–3468. 
  39. Zeki, Semir M. Colour coding in rhesus monkey prestriate cortex. Brain research. 1973, 53 (2): 422–427. 
  40. Conway, Bevil R and Tsao, Doris Y. Color architecture in alert macaque cortex revealed by fMRI. Cerebral Cortex. 2006, 16 (11): 1604–1613. 
  41. Tootell, Roger BH and Nelissen, Koen and Vanduffel, Wim and Orban, Guy A. Search for color 'center(s)'in macaque visual cortex. Cerebral Cortex. 2004, 14 (4): 353–363. 
  42. Conway, Bevil R and Moeller, Sebastian and Tsao, Doris Y. Specialized color modules in macaque extrastriate cortex. 560--573. 2007, 56 (3): 560–573. 
  43. 43.0 43.1 43.2 43.3 Fairchild, Mark D. Color appearance models. John Wiley & Sons. 2013. 
  44. Webster, Michael A. Human colour perception and its adaptation. Network: Computation in Neural Systems. 1996, 7 (4): 587 – 634. 
  45. Shapley, Robert and Enroth-Cugell, Christina. Visual adaptation and retinal gain controls. Progress in retinal research. 1984, 3: 263–346. 
  46. Chaparro, A and Stromeyer III, CF and Chen, G and Kronauer, RE. Human cones appear to adapt at low light levels: Measurements on the red-green detection mechanism. Vision Research. 1995, 35 (22): 3103–3118. 
  47. Macleod, Donald IA and Williams, David R and Makous, Walter. A visual nonlinearity fed by single cones. Vision research. 1992, 32 (2): 347–363. 
  48. Hayhoe, Mary. Adaptation mechanisms in color and brightness. Springer. 1991. 
  49. MacAdam, DAvid L. Sources of Color Science. MIT Press. 1970. 
  50. Webster, Michael A and Mollon, JD. Colour constancy influenced by contrast adaptation. Nature. 1995, 373 (6516): 694–698. 
  51. Brainard, David H and Wandell, Brian A. Asymmetric color matching: how color appearance depends on the illuminant. JOSA A. 1992, 9 (9): 1443–1448.