オペラント条件付けとは、行動に対する罰と報酬の学習理論です。
道具的条件付けとも呼ばれ、行動と結果(正負にかかわらず)のつながりが確立されています。例えばサルに行った実験で、LED点灯時にボタンを押すとバナナを与え、LED消灯時にボタンを押すと電気ショックを与える。そうすると、LEDが点灯した場合のみボタンを押すようになります。この実験は、行動を選択することから結果を学習するということを示しています。
オペラント条件付けは19世紀後半にアメリカの心理学者ソーンダイクが唱えた効果の法則から始まりました。これは、満足できる結果を得られる行動は、満足を得られない行動に比べ繰り返される傾向があるという法則です。しかし、スキナーにより新しくオペラント条件づけと名付けられました。スキナーは個人の行動とそれによる結果は人間の行動について理解することに役立つと考えています。
オペラント条件付けは、効果の法則を発展させたものです。行動により与えられる報酬(強化子)により行動は繰り返され、逆に罰により行動の頻度が減るとされています。
オペラント条件付けには4つの重要な要素があります。
・ 正の強化 報酬が与えられたことで行動の頻度が増える
・ 負の強化 罰か取り除かれることで行動の頻度が増える
・ 正の罰 罰(悪い結果)が与えられることで行動の頻度が減る
・ 負の罰 報酬が取り除かれることで行動の頻度が減る
他にも消去と言って条件付けによる行動が消える、頻度が減る反応がありますが、先ほどのサルを例に例えると、LED点灯時にボタンを押すとバナナを与えていたのを止めると、サルがボタンを押す頻度が減り、最後には止めてしまう。これを消去と言います。
私たちの行動は直接的、間接的にオペレント条件付けの影響を受けています。以下、日常に溢れているオペレント条件付けの事例です。
14. 生徒がディベートで拍手を送られる
正の強化: 拍手、励まし、褒め言葉
負の強化: 努力を馬鹿にされる
ディベートやパブリック・スピーキングは生徒のコミュニケーション能力を高めるために学校で行われます。では、初めてディベートに参加する生徒がいるとしましょう。発言に対して教師やクラスメイトから拍手を送られると、今後も似たような活動に積極的に参加するようになるでしょう。逆にからかわれたりすると、恐怖心が芽生え活動に対し嫌悪感を覚えるようになるでしょう。
13. インセンティブやボーナスを貰う
正の強化: ボーナス、旅行、ランチタイムの延長
正の強化は頻繁に職場で用いられます。企業は社員の生産性やモチベーションを高めるために報酬を与えます。報酬は特別スケールの大きなものでなくても構いません。プロジェクトでの成功を讃える感謝状でも構いません。この報酬が日々の正の強化につながります。例えば、ヘッジファンドマネージャーは一定期間において資金運用で良いパフォーマンスを出すことができた場合インセンティブが与えられます。インセンティブは通常、実現もしくは未実現益をもとに決められます。これにより、より多くのリターンを生み出すためリスクをとるようになります。
12. 割引やロイヤリティプログラム
正の強化: 会期中の割引、フォローメールなどの気配り
何世紀にも渡り、ブランドではリピーター、受注高、顧客とのつながりを高めるため様々な正の強化が行われてきました。多くの企業で、ブランドについてもっと知ってもらうための割引や優待の提供や、長期的戦略として、最高の顧客サポートやロイヤリティプログラムを提供してきました。
11. 犬のしつけ
負の強化: おやつを取り上げる、撫でない
アニマルトレーナーたちはオペラント条件付けが研究される前からこれを取り入れていました。もし動物を飼ったことがある人なら経験があるのではないでしょうか。例えば、あなたの「おすわり」に対し5秒以内におすわりができたら餌を与え、もしできなければ餌を与えない。これを繰り返すことによりおすわりができるようになる。(行動が強化されたと言います) これは犬や、他の動物をしつける際に効果的な方法です。
10. ソフトウェアのアップデートをうながす定期的なリマインダー
負の強化: しつこいソフトウェア更新の通知
正の強化と同様に、負の強化も特定の行動の頻度を高めるために用いられます。煩わしさや、不快な状況を作り出したほうが行動の頻度を高めるのに有効な場合もあるのです。このソフトウェアのアップデートは負の強化の最高の例です。ソフトウェアをアップデートすつことで通知が来ることがなくなります。また、将来的に通知を避けるためにあらかじめ自発的にアップデートをするようになるでしょう。
9. 頻繁に流れる広告
負の強化: 短い広告が定期的かつ頻繁に流れる
多くのオンラインサービスでは購読者を増やすために負の強化をもち入ります。例えば、Spotifyの無料プランでは頻繁にテレビや映画の短い広告が流れることで音楽を聴くことができます。これは、ユーザーをプレミアムプランにアップグレードさせることを目的としています。
8. 騒音から逃れるためにヘッドフォンを着用する
負の強化: 外部の騒音
試験の前日、隣の家からのパーティーの騒音で勉強に集中できない時ヘッドフォンをつけるでしょう。ワイヤレスのBluetoothヘッドフォンをいびき、吠え声、睡眠を妨害する音といった外部からの騒音を遮断するために着用する人もいます。このような場合、不快な状況を回避するためにヘッドフォンを着用するのが良いでしょう。
7. 子供のかんしゃくを避ける
負の強化: 子供が泣き叫ぶ
多くの親が意図せずに負の強化を用いています。例えば、父親が子供に遊びをやめてベッドに行くように促すと、子供はかんしゃくを起こします。それにより遊ぶことを許してしまう。この場合、子供が泣き叫ぶことは父親にとって避けたい負の刺激です。もし、遊ぶことを許すと負の刺激は消えます。これが父親の許すという行動を強化するのです。同時にベッドに行くということは、子供にとって負の刺激です。かんしゃくを起こすことにより負の刺激を避けようとします。このように意図せずに負の強化が行われるのです。
6. 生徒の間違った行動を叱る
正の罰: クラス全体の前で生徒を罰する
頻繁に遅刻する生徒にたいし、教師はクラス全体の前で叱ります。そうすることで、生徒は恥をかかないため時間どうり登校するようになります。このような指導の方法は、無駄な雑談、教師の活動に対する不必要な妨害、他生徒へのハラスメント、教師に対する失礼な態度を防止するのに効果的と言われています。
5. ティーンエイジャーの携帯を取り上げる
負の罰: ネットの使用を制限する、もしくは取り上げる
10代の子供の行動を変えるために、負の罰を用いる親もいます。例えば、毎週日曜日に部屋を掃除しない息子に対して携帯を2日間取り上げるなどです。この場合、この罰が少年にとって良い刺激となります。インターネットの利用を制限や外出制限も効果的と言われています。
4. 罰金
負の罰: 罰金の徴収
様々なタイプの罰金、例えばスピード違反などはオペラント条件付けの事例の一つです。もしスピード違反で罰金を課された場合、行動により何かが取り上げられることになるので、それは負の罰と言えるでしょう。スピード違反を減少させるため政府は一定の額を罰金として徴収します。この罰を避けるため、人々はルールに従います。
3. ビデオゲームにおける報酬
正の強化: ポイントを得る、次のレベルへ進む
多くのゲームにはコアループが用いられています。正の強化が加えられることによりプレイヤーがゲームにエンゲーッジする確率が高まります。これがゲーム中毒につながるのです。ゲームをしていく中で、タスクを完了し、障害を乗り越えることで追加ポイントが与えられ次のレベルへ進むことができます。これにより、ゲームをプレイし続け次のレベルへ進もうと努力します。しかし、障害を高くしすぎとプレイヤーは興味を失います。
2. 口頭での注意
正の罰: 叱る、警告
とあるエンジニアが勤務中に、APPを開発せずに Netflixを見ていたことを見つけたプトジェクトマネジャーが彼を呼び出し叱責しました。口頭での注意で、マネージャーは今後同じようなことがあった場合どのようなことが起きるかについて説明し、そのエンジニアはに度とオフィスでNetflixを開くことはなくなりました。
1. 裸足で歩道を歩く
正の罰:痛みとやけど
自然の摂理による結果は、生きていく上で必要なことを教えてくれます。例えば、熱いアスファルトを思い浮かべてください。夏になると、アスファルトの歩道は熱を多く含みます。摂氏100度にまでなると言われています。もし裸足でその上を歩いたとすれば、数分で火傷を負うことになるでしょう。その痛みは不快な刺激であり以後裸足でアスファルトの上を歩こうと思わなくなるでしょう。