淺論強化理論的發展

才智咖 人氣:2.17W

論文關鍵詞:效果律 操作強化 認知強化

淺論強化理論的發展

論文摘要:強化理論是當代學習學最重要的理論之一,廣義上的強化理論包括桑代克的效果律、斯金納的操作強化理論和班杜拉的認知強化理論。發展的強化理論已從S-R條件作用理論轉向為認知互動作用理論,強化因此而被賦予了特殊的涵義。   
  
  強化理論是當代學習心最重要的理論之一,實驗和實踐一致證明:效果律—強化原理確是對人類學習可靠的和有力的概括。需要注意的事實是:學習理論在整個20世紀一直處於發展過程之中,如今的強化理論較之聯結主義的“快樂—痛苦原理”已具有重要的擴充、修正乃至顛覆的含義,其實質已從S—R條件作用理論轉向為認知互動作用理論。然而,當今的領域仍存在著把桑代克的效果律和斯金納的操作強化在一個“有效”的基礎上作為手段而簡單、直接運用於實踐中的現象。為此,有必要梳理強化理論的發展脈絡,把握當代強化理論的要義。
  
  一、桑代克的效果律
  
  桑代克的聯結主義心理學依據機能主義的觀點,以刺激與反應之間的聯結替代了赫爾巴特主義的觀念的聯結,並將聯結分為先天(本能)和習得(習慣)兩大類。桑代克認為,學習是聯結的形成與鞏固[1]。從嘗試與錯誤的動物學習實驗中,桑代克得出了著名的快樂—痛苦原理即效果律:一種反應如果伴隨著快樂的體驗,那麼它就會被增加;如果伴隨著痛苦,就會被減弱[2]。
  桑代克自稱是機能主義者,但他的聯結主義仍是S—R條件作用理論,因而“聯結主義”這個術語在更廣泛的意義上也是“行為主義的”。桑代克動物實驗中的學習情境與後來斯金納的白鼠壓桿情境在基本特徵上並無不同,在桑代克的嘗試與錯誤學習中,當動物通過活動達到一“滿意事態”,便設想學習受到了積極影響,即“滿意事態”促使之前活動逐漸增強。斯金納用強化這個概念鑑別出被桑代克稱作效果律的事件,因而,可以把桑代克嘗試錯誤學習中最重要的發現更好地描述為強化理論。
  
  二、斯金納的操作強化理論
  
  斯金納是激進行為主義者,其基本立場為心理學是研究外部行為而且只研究外部行為的一門科學。斯金納認為人的行為主要由操作條件反射構成,塑造行為的過程就是學習的過程,強化是其學習理論中的核心概念。“如果一個操作發生後,接著給予一個強化刺激,那麼其強度就增加。”斯金納通過實驗發現:操作行為存在消退現象,消退的行為主要緣於以往操作條件作用的結果。與桑代克的效果律作對比,斯金納的強化理論與效果律的前半段同質,而用“消退”這個概念替換了效果律的後半段,且迴避掉桑代克效果律中“快樂”與“痛苦”等字眼。
  操作強化理論中,斯金納區分出兩種強化物:積極強化物和消極強化物。當一種刺激的呈現會增強某一行為的發生概率時,這種刺激物就是積極強化物;反之,當一種刺激的消除會增強某一行為的發生概率時,這種刺激物就是消極強化物。從此定義中我們看到,這兩類強化物導致的結果相同,都是某一行為發生概率增強,斯金納強調兩類強化物的差異在於刺激條件不同。但是進一步分析刺激條件,刺激呈現或刺激消除實際上具有同一種性質——獎勵,那麼斯金納區分兩種強化物的依據到底是什麼?從兩類強化物的具體化羅列中很容易發現,積極強化物多是某種令人愉悅的事物,而消極強化物則多是令人討厭的事物。但斯金納卻否認下列說法:積極強化物產生令人愉悅的情感,消極強化物產生讓人討厭的結果,也就是說斯金納寧肯將兩類強化物的區分依據只分析至刺激條件(行為)層面,儘管這種區別性質上並無差異,也不願意作進一步的分析和解釋,不願承認刺激物性質實質上是其區分依據。聯想到上文談及的操作強化理論與效果律的對比分析,可以推斷:斯金納是在刻意迴避“快樂”、“痛苦”、“愉悅”、“討厭”等詞彙。對此,斯金納有過一個解釋:強化物不具備“高興”、“不高興”此類特徵。誠然,刺激作為事物本身被分析時,確實不具備“高興”或“不高興”等物理特徵。但刺激成為強化物時,就不僅僅作為事物本身,而是必將與反應著的個體聯絡在一起被分析。因此,斯金納的這個解釋實在太多勉強。刺激本身具有的物理特徵和強化物所具有的特徵是兩個不同的概念,這是其一;其二,如果強化物不具備“高興”、“不高興”此類特徵,將無法解釋強化物與反應變化之間的因果關係。事實上,斯金納解釋中的另一句話才是他迴避的真正理由:物理學上沒有“高興”、“不高興”之類的術語。對斯金納來說,要描述強化物的性質,必然要涉及“愉悅”、“討厭”此類術語,而一但涉及此類術語,必將研究精神世界,也就必然要使用和行為主義所認為的唯一科學的研究方法——實驗分析相牴觸的方式。在斯金納看來,一個行為不管如何不完全,也比心靈主義的解釋更有價值。