مقدمه
شرطی شدن فعال (operant conditioning) که گاهی شرطی شدن ابزاری نیز نامیده میشود، یک روش یادگیری است که اساس آن اعمال پاداش و مجازات برای رفتار انجام شده میباشد. از طریق شرطی شدن فعال، ارتباطی بین رفتار و نتیجه حاصل از این رفتار ایجاد میشود.
به عنوان مثال، هنگامی که موش آزمایشگاهی دکمه آبی را میفشارد، به عنوان پاداش یک تکه غذا دریافت میکند، اما هنگامی که دکمه قرمز را فشار میدهد، شوک الکتریکی خفیفی به او وارد میشود. در نتیجه، او یاد میگیرد که دائماً دکمه آبی را فشاردهد، اما از فشردن دکمه قرمز اجتناب کند.
اما شرطی شدن فعال تنها محدود به مطالعات آزمایشگاهی و آموزش حیوانات آزمایشگاهی نیست، بلکه در یادگیری روزانه نقش بسیار پررنگی دارد. سیستم پاداش و مجازات تقریباً در تمامی ارکان روزانه زندگی از فعالیتهای طبیعی روزانه گرفته تا بسترهایی سازمان یافتهتر مانند کلاس درس یا جلسات درمانی حضور دارد.
در این بخش نگاه دقیقتری به نحوه کشف پدیده شرطی شدن فعال، تأثیرش بر روانشناسی و کاربرد آن در حوزه تغییر رفتارهای قدیمی و آموزش رفتارهای جدید خواهیم کرد.
پژوهشهای اسکینر
در دههی ۱۹۲۰، جان واتسون (John B. Watson) روانشناسی آکادمیک را ترک کرده بود و رفتارگرایان دیگر نیز تحت تأثیر او به ارائه انواع جدیدی از یادگیری غیر از شرطی شدن کلاسیک پرداختند. مهمترین این رفتارگرایان، برهاس فردریک اسکینر (Burrhus Frederic Skinner) بود.
روانشناس معروف فردریک اسکینر در سال ۱۹۰۴ در پنسیلوانیا (Pennsylvania) چشم به جهان گشود. پس از اخذ مدرک دکتری خود از دانشگاه هاروارد، مطالعات خود را بر روی ایدههای رفتار انسانی آغاز کرد. از آثار اسكینر میتوان به (The Behavior of Organisms (۱۹۳۸ و رمانی بر اساس نظریههای والدن دو وی (Walden Two) (1948) اشاره کرد. او در کتابهای بعدی خود، از جمله فراتر از آزادی و کرامت انسانی (Beyond Freedom and Human Dignity) (۱۹۷۱)، به بررسی ارتباط بین رفتارگرایی و جامعه پرداخته است. . اسکینر در سال ۱۹۹۰ در ماساچوست (Massachusetts) وفات یافت.
دیدگاه او اندکی کمتر از واتسون افراط گرایانه بود. اسکینر معتقد است که ما چیزی تحت عنوان ذهن داریم، اما مطالعه رفتارهای قابل مشاهده نسبت به بررسی وقایع داخلی ذهن بسیار مفیدتر است.
کار اسکینر ریشه در این دیدگاه داشت که فرآیند شرطی شدن کلاسیک سادهتر از آن است که بتواند توضیح کاملی از رفتارهای پیچیده انسان ارائه دهد. در واقع شرطی شدن کلاسیک میتواند رفتارهای واکنشدار را در برگیرد اما قادر به توضیح همه سطوح یادگیری نیست. او معتقد بود که بهترین روش درک رفتارها، بررسی دلایل یک عمل انجام شده و پیامدهای آن میباشد. اسکینر این رویکرد را شرطی شدن فعال نامید.
اسکینر از واژه فعال (operant) برای اشاره به “هر رفتار فعالی که بر محیط اطراف اثر کرده و عواقب و نتایجی را به دنبال دارد” استفاده کرد. به عبارت دیگر، نظریه اسکینر توضیح داد که ما چگونه طیف وسیعی از رفتارهای آموخته شدهای را که هر روز به نمایش میگذاریم، کسب کردهایم.
کارهای اسکینر بر اساس “قانون اثر” ادوارد ثوراندایک (Edward Thorndike) بود. طبق این قانون رفتارهایی که نتایج دلپذیری به همراه دارند احتمال دارد که تکرار شوند و رفتارهایی که نتایج دلخواهی به همراه ندارند احتمال تکرارشان پایین است.
اسکینر اصطلاح جدید پاداش (تقویت) را به قانون اثر اضافه کرد به این گونه که؛ این تمایل وجود دارد تا رفتارهایی که تقویت میشوند (پاداش داده میشوند) تکرار شوند، و رفتارهایی که تقویت نمیشوند (پاداش داده نمیشوند) ضعیف و یا کلا خاموش شوند.
انواع رفتارها
اسکینر رفتارها را به دو نوع مختلف تقسیم بندی کرده است.
رفتارهای واکنشدار (Respondent behaviors): رفتارهایی هستند که به صورت خودکار و بازتابنده اتفاق میافتند، مانند عقب کشیدن دست از یک اجاق داغ و یا تکان خوردن پا هنگامی که پزشک بر روی زانو ضربه میزند. البته لزومی به یادگیری این رفتارها نبوده و آنها به سادگی به طور اتوماتیک و ناخواسته انجام میشوند.
رفتارهای عامل یا فعال (Operant behaviors): از سوی دیگر، این رفتارها تحت کنترل آگاهانه ما هستند. برخی از این رفتارها به صورت خود به خودی و دیگر رفتارها به طور هدفمند رخ میدهند، اما در ادامه این نتایج و عواقب این رفتارها هستند که تعیین میکنند در آینده این رفتار تکرار خواهد شد یا نه. اقدامات و کارهای ما بر روی محیط اطرافمان و پیامدهای این اقدامها بخش مهمی از فرآیند یادگیری است.
اسکینر در دوران کودکی خود ابزارهای مختلفی میساخت و از همین مهارت به دست آمده در پژوهشهای خود در رابطه با شرطی شدن فعال بهره جست. او آزمایشهای خود را با حیوانات و استفاده از جعبه اسکینر انجام داد. جعبه اسکینر بسیار شبیه به جعبه پازل ثورندایک بوده و یک اهرم و یا کلید داشت که حیوان با فشردن آن میتوانست پاداش خود را دریافت کند.
به منظور پیگیری پاسخها، اسکینر همچنین دستگاهی به نام تراکم نگار (cumulative recorder) اختراع کرد. این دستگاه پاسخها را به عنوان حرکت رو به بالای خط ثبت میکند بنابراین با بررسی شیب خط میتوان میزان پاسخ را اندازهگیری کرد.
اسكینر سه نوع پاسخ یا عامل را كه میتوانند یک رفتار بخصوص را به دنبال داشته باشند، شناسایی كرد:
عامل خنثی (Neutral operants): پاسخهای محیطی که احتمال تکرار یک رفتار را نه افزایش میدهند و نه کاهش.
تقویتکنندهها (Reinforcers): پاسخهای محیطی که باعث افزایش احتمال بروز یک رفتار میشوند. تقویتکنندهها میتوانند مثبت یا منفی باشند.
جریمهها یا مجازات (Punishers): پاسخهایی از محیط اطراف که احتمال تکرار یک رفتار را کاهش میدهد. این دسته باعث تضعیف رفتار میشوند.
همه افراد میتوانند نمونههایی از نحوه تأثیر تقویتکنندهها و مجازات را بر رفتارهای خود بیابند. یک کودک رفتارهای مختلفی را آزموده و از عواقب هر یک از آنها نکته جدیدی آموخته است.
به عنوان مثال، نوجوانی در مدرسه سیگار میکشد و در نتیجه میتواند اعتماد گروهی از هم نوعان خود را جلب کند و به عضویت گروه آنها درآید. در این حالت این رفتار او یعنی سیگار کشیدن به گونهای مثبت تقویت شده و احتمال تکرار این رفتار در آینده بیشتر میشود. حال اگر مدیر مدرسه از این رفتار نوجوان باخبر شده و از مدرسه توبیخ دریافت میکرد و خانواده او به دلیل سیگار کشیدن او را بازخواست میکردند احتمال سیگار کشیدن او در آینده کمتر میشد.
مؤلفههای شرطی شدن فعال
چندین مفهوم اصلی در شرطی شدن فعال وجود دارد.
تقویت کردن در شرطی شدن فعال
تقویت کردن، هر عملی است که موجب تقویت یا افزایش فعالیت در ادامه میشود. دو نوع تقویتکننده وجود دارد:
تقویتکنندهی مثبت اتفاقات یا نتایج مطلوبی هستند که پس از انجام رفتار به وقوع میپیوندد. در موقعیتهایی که بازتابدهندهی تقویتکنندههای مثبت هستند، پاسخ یا رفتار با اضافه شدن چیزی، همچون جایزه یا سخن مستقیم، تقویت میشود.
تقویتکنندههای مثبت، رفتار را با فراهم کردن شرایطی که در آن به فرد پاداش داده میشود، قویتر میکنند، به عنوان مثال فرد در محیط کار عملکرد خوبی داشته و مورد تقدیر کارفرمای خود قرار میگیرد.
اسکینر با قرار دادن یک موش گرسنه در جعبه، نشان داد که تقویت مثبت چگونه عمل میکند. این جعبه اهرمی در یکی از وجهها داشت، و هنگامی که موش در جعبه شروع به حرکت میکرد، امکان داشت بطور تصادفی با این اهرم برخورد کند. پس از برخورد بلافاصله اندکی غذا از کنار اهرم وارد جعبه میشد. موشها پس از چند بار قرار داده شدن در جعبه، بزودی یاد گرفتند که برای بدست آوردن غذا مستقیماً به سمت اهرم بروند. پیامد دریافت غذا در صورتی که اهرم را فشار دهند، تضمین کنندهی تکرار دوباره و دوبارهی عمل بود.
تقویتکنندههای منفی شامل حذف اتفاق یا نتیجهی ناخوشایند پس از بروز رفتار است. در چنین شرایطی، پاسخ با حذف چیزی که بنظر ناخوشایند میرسد، تقویت میگردد. برای مثال کودکی در مغازهی خوار و بار فروشی، شروع به جیغ و فریاد میکند، و مادرش دست خود را به نشانهی تنبیه بالا میبرد و او ساکت میشود. به احتمال زیاد مادر در دفعات بعدی که کودک شروع به گریه میکند، این کار را تکرار خواهد کرد. عمل او منجر به حذف عمل ناخوشایند (گریهی کودک)، بصورت تقویت منفی میشود.
حذف یک تقویتکننده ناخوشایند میتواند باعث قویتر شدن رفتار شود. این کار به عنوان تقویتکنندهی منفی (حرکت دست مادر) شناخته میشود، چون در واقع حذف محرک ناخوشایند، پاداش برای حیوان یا شخص تلقی میشود. تقویتکنندههای منفی پاداش تلقی میشوند چون تجربههای منفی را حذف یا متوقف میکنند.
اسکینر با قرار دادن موش در جعبه اسکینر و تعبیه شوک الکتریکی در جعبه که باعث ناراحتی موش میشد، نشان داد که تقویت منفی چگونه عمل میکند. هنگامی که موش در جعبه حرکت میکرد، امکان داشت بطور تصادفی با اهرمی که در جعبه قرار داشت برخورد کند. بلافاصله پس از برخورد، شوک الکتریکی تعبیه شده در جعبه خاموش میشد. موشها پس از چند بار قرارگیری در جعبه، بزودی یاد گرفتند که به سرعت بسمت اهرم بروند، پیامد امکان اجتناب از شوک الکتریکی تضمینکنندهی تکرار دوباره و دوبارهی این عمل میباشد.
همچنین اسکینر فکر کرد که چگونه میتوان باعث اجتناب موشها از شوک الکتریکی به وسیله چراغی شد که بلافاصله قبل از شوک روشن میشود، موشها بزودی یاد گرفتند بلافاصله پس از روشن شدن چراغ اهرم را فشار دهند، زیرا میدانستند این کار جلوی روشن شدن شوک الکتریکی را میگیرد. این دو پاسخهای آموخته شده، یادگیری اجتنابی و یادگیری فرار نامیده میشوند.
تنبیه در شرطی شدن فعال
تنبیه به عنوان عملی عکس تقویت تعریف میشود زیرا در جهت حذف یا تضعیف پاسخ پس از افزایش آن است. در واقع عمل آزار دهندهای است که مسبب کاهش انجام رفتاریست که در پی دارد.
تنبیه مثبت به تنبیهی اطلاق میشود که نتیجه یا حادثهای ناخوشایند، باعث تضعیف پاسخی که در پی خواهد داشت میشود. سیلی خوردن در نتیجهی رفتار نادرست، مثالی از تنبیه مثبت است.
تنبیه منفی یا تنبیه به واسطهی حذف، زمانی اتفاق میافتد که نتیجه یا اتفاقی خوشایند در اثر انجام رفتاری بهخصوص حذف شود. گرفتن بازی کامپیوتری کودک در اثر رفتار نادرست او، مثالی از این مورد است.
لازم به ذکر است که افتراق بین تنبیه و تقویت منفی همواره آسان نیست، مشکلات زیادی در رابطه با استفاده از روش تنبیه وجود دارد:
۱- رفتار در نتیجهی تنبیه، فراموش نمیشود بلکه سرکوب میگردد، در نتیجه در صورت نبود تنبیه، رفتار دوباره تکرار خواهد شد.
۲- از آن جایی که پرخاشگری راهی برای مقابله با مشکلات است، تنبیه باعث افزایش پرخاشگری میشود.
۳- میتواند موجب ترس و وحشت شود که ممکن است رفتارهایی ناخواسته، همچون ترس از مدرسه را در پی داشته باشد.
۴- لزوماً منجر به رفتار خواسته شده نمیشود- در روش تقویت به فرد گفته میشود که چه کاری را انجام دهد در حالی که در روش تنبیهی تنها عملی که از انجام آن نهی شده است به فرد گفته میشود.
برنامه تقویت سازی
تصور کنید که یک موش در جعبه اسکینر وجود دارد. در شرطی شدن کلاسیک اگر بلافاصله پس از فشار دادن اهرم تکه غذا به دست موش نرسد، پس از چندین تلاش، موش فشار دادن اهرم را رها میکند؛ درواقع رفتار خاموش خواهد شد (این گونه در نظر بگیرید که اگر کارفرما حقوق کارمندان خود را پرداخت نکند تا چه مدت کارمندان به کار خود ادامه خواهند داد؟).
تقویت الزاماً یک فرآیند ساده نیست و تعدادی از عوامل وجود دارند که میتواند بر سرعت و چگونگی یادگیری موارد جدید تأثیر بگذارد. اسکینر دریافت که زمانبندی و تناوب تقویت یک رفتار بر روی نحوه یادگیری رفتارهای جدید و تغییر رفتارهای قدیمی تأثیر دارد.
رفتارگرایان کشف کردند که الگوهای (یا برنامههای) مختلف تقویت سازی تأثیرات متفاوتی بر سرعت یادگیری و خاموشی رفتار دارند. اسکینر و فرستر (Ferster) روشهای مختلفی را برای ارائه تقویت ابداع کرده و پی بردند که این روشها بر دو موردی که در ادامه گفته میشود تأثیر میگذارند:
۱- نرخ پاسخ: موش به چه میزان اهرم را میفشارد (موش تا چه میزانی انرژی میگذارد).
۲- نرخ خاموشی: نرخی رفتار فشردن اهرم ناپدید میشود (موش چه زمانی از کوشش دست میکشد).
در ادامه به بررسی این الگوها میپردازیم.
۱- تقویت پیوسته (Continuous Reinforcement)
حیوان یا انسان هر زمانی که یک رفتار خاص را انجام دهد، به گونه مثبت تقویت میشود. به عنوان مثال هر بار که اهرم فشرده میشود موش به تکه غذا دست مییابد و سپس پاسخ تحویل غذا خاموش میشود. یادگیری نسبتاً سریع رخ میدهد، اما میزان پاسخ بسیار کم است. خاموشی پاسخ نیز بسیار سریع با توقف تقویت کردن پاسخ رخ میدهد.
۲- تقویت با نسبت ثابت (Fixed Ratio Reinforcement)
نرخ پاسخ کند است.
نرخ خاموشی سریع است.
نوعی تقویت جزئیست. رفتار تنها پس از چندبار انجام شدن تقویت میشود. به عنوان مثال، پس از هر ۵ پاسخ صحیح یک پاداش به فرد داده میشود. به عنوان مثال، کودک به ازای هر پنج کلمهای که به درستی ادا کند یک ستاره میگیرد.
نرخ پاسخ سریع است.
نرخ خاموشی متوسط است.
۳- تقویت با فاصله زمانی ثابت (Fixed Interval Reinforcement)
فرم دیگری از تقویت جزئی است. تقویت پس از یک فاصله زمانی ثابت که حداقل یک پاسخ درست را در بر داشته فراهم میشود. به عنوان مثال دریافت حقالزحمه بر حسب ساعت.
نرخ پاسخ متوسط است.
نرخ خاموشی متوسط است.
۴- تقویت با نسبت متغیر (Variable Ratio Reinforcement)
نوعی تقویت جزئی است. رفتار پس از چندین بار تکرار، که قابل پیش بینی نیست، تقویت میشود. برای مثال قمار یا ماهیگیری.
نرخ پاسخ سریع است.
نرخ خاموشی کند است. (به دلیل غیر قابل پیش بینی بودن خاموش شدن دشوار است)
۵- تقویت با فاصله متغیر (Variable Interval Reinforcement)
آخرین شکل از تقویت جزئی است. با ارائه یک پاسخ صحیح، تقویت بعد از گذشت مدت زمان غیر قابل پیشبینی مثلاً پنج دقیقه انجام میشود. به عنوان مثال، در مورد خوداشتغالی در بازههای زمانی غیر قابل پیش بینی حقالزحمه فرد پرداخت میشود.
نرخ پاسخ سریع است.
نرخ خاموشی کند است.
اصلاح کنندههای رفتار
اصلاح کنندههای رفتار مجموعهای از تکنیکها و درمانهای مبتنی بر شرطی سازی فعال میباشند. هدف اصلی از آن شامل تغییر رویدادهای محیطی مرتبط با رفتار فرد میباشد. برای مثال، تقویت رفتارهای خواسته شده یا نادیده گرفتن و تنبیه در پی رفتارهای خواسته نشده. این موضوع چندان ساده نیست، تقویت رفتارهای خواسته شده، اغلب حالت پایهای از رشوه دادن میباشد.
انواع مختلفی از تقویت مثبت وجود دارد. تقویت اولیه حالتی است که خود جایزه باعث تقویت عمل میشود. تقویت ثانویه حالتی است که عملی باعث تشدید رفتار میشود چون منجر به تقویتکنندهی اولیه میشود.
مثالهایی از اصلاح کنندههای رفتاری شامل اقتصاد ژتونی و شکلدهی رفتار میباشد.
اقتصاد ژتونی (token economy)
نظامی که در آن رفتارهای مشخص با نشانهها مشخص میشوند (تقویت ثانویه) و سپس پاداشی برای آن در نظر گرفته میشود (تقویت اولیه).
نظام نشانهگذاری ممکن است، پول جعلی، دکمه، برچسب و غیره باشد. این جوایز ممکن است هرچیزی مثلاً، اسنک یا امتیازات برای فعالیتها باشد. معلمان مدارس ابتدایی از سیستم اقتصاد ژتونی با برچسب دادن به دانشآموزان در نتیجهی رفتار مناسب، استفاده میکنند. نظام اقتصاد ژتونی در کنترل بیماران روانی بسیار کارآمد است. اگرچه ممکن است بیماران به این نشانه گذاریها به شدت وابسته شوند، بصورتی که خو گرفتن با محیط اطراف پس از خروج از بیمارستان یا زندان برای آنها بسیار دشوار میشود. پیادهسازی نظام اقتصاد ژتونی توسط کارکنان به قدرت و انرژی زیادی نیاز دارد. رعایت این نکته از سوی کارمندان که نباید افرادی ترجیح داده شوند و نباید عدهای نادیده گرفته شوند، بسیار مهم است. این نکته مخصوصاً در بیمارستانهای روانی و زندانها که تغییر شیفت وجود دارد، باید به دقت رعایت شود و نیاز به هماهنگی بالا بین کارکنان دارد.
شکلدهی رفتار
یکی از کارهای مهمی که اسکینر انجام داد کار برروی نظریه شکل دهی رفتار از طریق تخمین احتمال موفقیت بود. اسکینر معتقد بود میتوان با استفاده از مؤلفههای شرطی سازی فعال رفتارهای پیچیدهتری را ایجاد کرد؛ بدین صورت که تنبیه یا پاداش هر بار نزدیکتر و نزدیکتر به رفتار خواسته شده باشد. برای انجام این کار، شرایط یا اثر گذاری لازم برای پاداش، باید در هر بار تغییراتی داشته باشد تا ارگانیسم هر بار به رفتار خواسته شده نزدیکتر شود. به نظر اسکینر بیشتر رفتارهای انسانی و حیوانی (شامل زبان) با این شیوه از تخمین موفقیت قابل توضیح است.
کاربرد تحصیلی
در محیطهای یادگیری مرسوم، شرطی سازی فعال ارتباط بیشتری با موضوعات کلاسی و مدیریت دانش آموز نسبت به محتوای آموزشی دارد. یک راه ساده برای شکل دهی رفتار، فراهم کردن محیط برای دریافت فیدبک عملکرد یادگیرنده میباشد. برای مثال تعریف و تمجید، تأیید و تشویق. میزان قابل تغییر از تشویق و توجه باعث بهترین عملکرد در دانش آموزان میشود، مثلاً در ابتدا تشویق و تقویت دانش آموز بخاطر کارهای خوب، موجب عملکرد بهتر میشود رفته رفته تعداد این تشویقها کمتر میشود تا جایی که دانش آموز بداند تقویت و تشویق در پی کارهای فوقالعاده خواهد بود.
مثال این نوع تشویق در فعالیتهای کلاسی به این صورت میباشد که معلم سوالی از دانشآموزان میپرسد و همهی کسانی که اقدام به پاسخ دادن کردند، بدون در نظر گرفتن درست یا غلط بودن پاسخ، تشویق میکند، در دفعات بعدی فقط پاسخهای صحیح را تشویق میکند و نهایتا تنها پاسخهای فوقالعاده تشویق خواهند شد.
رفتارهای ناخواسته و نامناسب ممکن است با نادیده گرفته شدن از سوی آموزگار، اصلاح شوند (به عبارتی نیاز به تقویت منفی برای حذف رفتار نمیباشد). انجام این کار چندان ساده نمیباشد، زیرا اگر آموزگار در انجام این کار افراط کند به نظر ریاکار خواهد رسید. باید توجه داشت که از روشهایی مختلف تقویتی استفاده کرد تا شکل دهی رفتار تداوم یابد.
اساس عصبی شرطی شدن فعال و بررسی نقش دوپامین
بیش از چهل سال پیش، دو پژوهشگر، اولد و میلنر (Olds and Milner)، به کشفی در حوزه عصب شناسی دست یافتند که تأثیرات عمیقی بر روی درک ما از نقش مغز در فرآیند تقویت سازی داشته است.
برخلاف آن چه انتظار میرفت، آنها کشف کردند که تحریک برخی از مناطق مغز موشها برای آنها نوعی پاداش و تقویت محسوب میشود. آنها هر بار که موش به منطقه خاصی از قفس میرفت، تحریکات الکتریکی به مغزش وارد میکردند؛ به طور شگفت انگیزی، در ادامه موش به روشنی تلاش میکرد تا به آن کنج از قفس برود تا بتواند تحریکات بیشتری دریافت کند. از زمان این حادثه تجربی مهم، بسیاری از دانشمندان علوم اعصاب اثرات تقویت کنندگی تحریک الکتریکی مناطق مغزی خاص را با استفاده از الگوی خود-تحریکی نشان دادهاند. در آزمایش خود-تحریکی، موش میتواند تحریک به مغز خود را با فشار دادن یک اهرم، که الکترود مخصوصی را در ناحیه مشخصی از مغز فعال میکند، انجام دهد.
این تحقیقها نشان میدهند که ناحیه مشخصی به نام باندل میانی مغز پیشین (medial forebrain bundle یا MFB) و انتقال دهنده عصبی به نام دوپامین (dopamine یا DA) در این فرآیند خودت-حریکی نقش بسیار مهمی دارند. باندل میانی مغز پیشین مسیری است که مغز میانی را با basal forebrain مرتبط میکند. هنگامی که الکترودها در باندل میانی مغز پیشین قرار می گیرند، نتایج جالبی مشاهده میشود؛ موشها با ساعت ۱۰۰۰ بار در ساعت خود-تحریکی انجام میدهند. بنابر دلایل مختلف پژوهشگران معتقدند که دوپامین در این رویداد نقش مهمی دارد.
پیش از همه، MFB غنی از نورونهای دوپامینرژیک است. دوم، داروهایی که جلوی اثرات دوپامین را میگیرند، موجب کاهش یا حذف پدیده خود-تحریکی میشوند. سوم این که داروهای تقویتکنندهای مانند کوکائین، آگونیستهای قوی دوپامین میباشند. چهارم رفتارهای تقویت کننده از جمله رفتار جنسی و تغذیهای با افزایش دوپامین در مناطق مختلف مغزی مرتبط است.
شرطی شدن فعال: فاکتورهای سلولی و ساختاری
یکی از جالب ترین آزمایشها، که به عنوان یک مدل برای نشان دادن اثر نورونهای دوپامینی در شرطی شدن فعال استفاده میشود، شامل آموزش سلولهای منفرد است. در این آزمایش، محققین میزان تحریک نورونهای دوپامینی فرد را به عنوان یک میزان پایه اندازه گیری کردند.
سپس آنها بلافاصله پس از تحریک سلول، به طور مستقیم سلولها را در معرض دوپامین قرار دادند. این آزمایش که نوعی شرطی شدن فعال در مقیاس کوچک بود، محيطی که سلول در آن قرار داشت نماینده محرکهای افتراقی، تحریک شدن سلول نشاندهنده رفتار و ارائه دوپامین پیامد و نتایج حاصل بود. در حقیقت، سلولها در پاسخ به دوپامین سرعت تحریک خود را افزایش میدادند. همچنین این افزایش در تحریک پذیری در پاسخ به دوپامین مستقل از رفتار سلول بود و تنها زمانی رخ میداد که دوپامین دقیقاً پس از تحریک سلول ارائه میشد. بنابراین، شرطی شدن کلاسیک تنها در صورتی رخ میدهد که رفتار ابتداً و مقدمتر انجام شود.
از نظر ساختار مغزی، تحقیقات نشان میدهد که هسته اکومبنس (accumbens)، در basal forebrain، در شرطی شدن فعال نقش بسیار مهمی دارد. داروهایی که گیرندههای دوپامین را در هسته اکومبنس بلاک میکنند، فرآیند اکتساب و فراگیری پاسخ شرطی را مهار میکنند. شواهدی وجود دارد که دوپامین در این ناحیه از مغز نقش ویژهای در انگیزه ایفا میکند. به عنوان مثال، حیواناتی که بلوک کنندههای دوپامین به هسته اکومبنس تزریق شده است، تمایل کمتری به تحمل زحمت (فشار دادن اهرم) برای دست یابی به غذایی که آن را ترجیح میدهند دارند و غذای کمتری که به راحتی قابل دسترس است را ترجیح میدهند. همچنین موشها برای به دست آوردن غذایی با حجم دو برابر از مانع پیش رویشان بالا نمیروند. از سوی دیگر، موشها در آزمایشهای مشابه با ورودیهای معمولی دوپامین به هسته اکومبنسشان، به راحتی میتوانند اهرم را برای غذای مورد نظر خودشان فشار دهند و یا برای غذای اضافی از مانع عبور کنند.
با این که رفتارگرایی مانند اوایل قرن بیستم سلطه چشمگیر خود در حوزه روانشناسی را از دست داده است، اما شرطی شدن فعال هنوز هم اهمیت خود را به عنوان ابزاری در یادگیری و تغییر و اصلاح رفتار حفظ کرده است. نکته قابل توجه این است که اعمال هر گونه یادگیریای در زندگی فردی و اجتماعی نیاز به زمان داشته و توجه به بهترین نوع تقویت و پاداش و تنبیه ارائه شده متناسب با شرایط اهمیت زیادی دارد.