Б. Скиннер об оперантном поведении

Фрагменты из книги Берреса Скиннера "Оперантное поведение". Кривые научения. Оперантное обусловливание. Количественные свойства. Управление оператным поведением. Оперантное угашение. Условные подкрепления. Почему подкрепление подкрепляет? Непредвиденные обстоятельства и "суеверное" поведение. Цели, намерения и другие конечные причины поведения. (История зарубежной психологии. Тексты. М., 1986. С. 60-95).

Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента.

Кривые научения

В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека не возник вновь, но эксперименты Торндайка и его» объяснение мышления (reasoning) животных явились важным шагом в этом направлении.

...

Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются, закрепляются и реорганизуются. Базисный: процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен. См.

Оперантнтное обусловливание

Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?

...

Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством оперантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость. См.

Количественные свойства

Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления. См.

Управление (CONTROL) Оперантным поведением

Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в на-: правлении предсказания и управления поведением в будущем? Какие переменные заставляют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспериментируем с голодным голубем. Это означает, что голубь лишался пищи в течение определенного периода времени или до тех пор, пока он немного не терял в весе. В противоположность тому, что можно было бы ожидать, экспериментальные исследования показали, что сила эффекта пищевого под- крепления может не зависеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант может также контролироваться с помощью внешнего стимула, являющегося еще одной переменной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные можно вывести из самого оперантного подкрепления.

Оперантное угашение

Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в режиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию. Таким образом, если мы только один раз случайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет сохраняться дольше, чем в том случае, когда мы подкрепляем каждое правильное выполнение. См.

Какие события являются подкрепляющими

Можно выделить два типа событий, обладающих эффектом подкрепления. Некоторые подкрепления представляют собой предъявление стимулов или добавление чего-то, например воды, еды или возможности сексуального контакта в ситуацию. Они называются положительными подкреплениями. Другой тип подкрепляемых событий состоит в устранении чего-либо, например сильного шума, яркого света, холода, жары или электрического шока из ситуации. Это — отрицательное подкрепление. В обоих случаях сохраняется один и тот же эффект подкрепления — вероятность реакции повышается. Мы не можем обойтись без этого различения, просто указав на то, что в негативной ситуации подкрепляет отсутствие яркого света, сильного шума и т. д., поскольку воздействие оказывает именно отсутствие чего-либо после его презентации, и это еще один способ выражения того, что стимул устранен. Различия между двумя случаями станут яснее, когда мы рассмотрим случаи с презентацией негативного подкрепления, или случаи с устранением позитивного подкрепления. Их последствия мы называем наказанием. См.

Условные подкрепления

Обычно генерализованные подкрепления оказываются эффективными, даже если первичные подкрепления, на которых они основываются, больше их не сопровождают. Мы играем в игры, требующие определенных навыков ради них самих. Аффекты не всегда вызываются сексуальным подкреплением. Подчиненность других людей подкрепляет, даже если мы не используем ее. Эффект подкрепления деньгами жадного человека может оказаться настолько сильным, что он может обречь себя на голод, чтобы не лишиться их. Эти факты, поддающиеся наблюдению, должны занять надлежащее место при построении теорий и изучении практики. Они не означают, что обобщенные подкрепления представляют собой нечто большее, чем физические свойства стимулов, наблюдаемые в каждом случае, или что существуют какие-то нефизические данности, которые необходимо принимать во внимание. См.

Почему подкрепление подкрепляет?

Закон эффекта не является теорией. Это просто правило, объясняющее усиление поведения. Когда мы подкрепляем реакцию и наблюдаем за изменениями ее частоты, можно легко описать то, что произошло, в объективных терминах. Но при объяснении того, почему это произошло, необходимо обратиться к теории. Почему подкрепление подкрепляет? Одна из теорий утверждает, что организм повторяет реакцию, потому что он находит, что его следствия «приятны» или «приносят удовлетворение». Но в каком смысле это является объяснением для естественной науки? Такие характеристики, как «приятный» или «приносящий удовлетворение», вероятно, не относятся к физическим свойствам того, что подкрепляет, поскольку физическая наука не использует ни эти термины, ни какие-либо другие их эквиваленты. Термины должны характеризовать определенное воздействие на организм, но можно ли его определить таким образом, чтобы оно было пригодным для объяснения подкрепления? См.

Непредвиденные обстоятельства и «суеверное» поведение

Если устанавливается только случайная связь между реакцией и появлением стимула, поведение называется «суеверным». Мы можем показать это на примере с голубем, аккумулируя эффект нескольких случайных обстоятельств. Предположим, что мы будем давать голубю небольшое количество еды каждые пятнадцать секунд, независимо от того, что он делает. Когда пища предъявляется первый раз, он выполняет какие-то поведенческие реакции — если только он не будет стоять спокойно — и произойдет обусловливание. Тогда более вероятно, что при предъявлении пищи снова будет наблюдаться то же самое поведение. Если это произойдет, то оперант будет еще более усилен. Если этого не произойдет, то будет усилено какое-то другое поведение. Обычно данное поведение достигает частоты, с которой оно подкрепляется. В дальнейшем оно становится постоянной частью репертуара птицы, даже если пища предъявлялась в такое время, которое не связано с поведением птицы. Видимые реакции, которые были установлены таким образом, включают резкие наклоны головы, переступание с ноги на ногу, наклоны и шарканье ногами, повороты вокруг своей оси, неестественную походку и наклоны головы. В дальнейшем топография поведения может сместиться на другие подкрепления, поскольку легкие изменения в форме реакции могут совпадать с приемом пищи.

Голубь не является исключением. Поведение людей также во многом «суеверно». Только небольшая часть поведения, усиливаемая непредвиденными обстоятельствами, становится ритуалом, который мы называем «суеверием», однако сам принцип сохраняется в силе. Предположим, что, прогуливаясь по парку, вы находите десять долларов (и предположим, что это событие имеет для вас значительный подкрепляющий эффект). То, что мы делали в момент, когда мы нашли деньги, подкрепляется. Конечно, трудно привести строгие доказательства, но весьма вероятно, что мы вновь пойдем на прогулку именно в тот же парк или в парк, похожий на этот, и более вероятно, что мы будем смотреть именно на та место, где были найдены деньги, и т. д. Это поведение будет варьироваться в зависимости от состояния депривации, которому релевантны деньги. Его не следует называть «суеверным», но оно порождается ситуацией, которая редко оказывается «функциональной». См.

Цели, намерения и другие конечные причины поведения

Когда мы видим, что человек передвигается по комнате, открывает ящик письменного стола, смотрит на что-то, находящееся под журналами и т. д., можно совершенно объективно описать его поведение: «Сейчас он находится в определенной части комнаты; большим и указательным пальцами правой руки он держит книгу; он поднимает книгу и наклоняет свою голову так, чтобы можно было видеть любой объект, находящийся под книгой». Можно также проинтерпретировать его поведение или «придать ему смысл»: он ищет что-то, или, если быть более конкретным, он ищет очки. То, что мы добавляем, является не дальнейшим описанием его поведения, а суждением о некоторых переменных, определяющих его. Здесь нет ни текущей цели, ни мотива, ни намерения, которые должны быть приняты во внимание. То же самое будет иметь место, даже если мы спросим его о том, что он делает, и он ответит: «Я ищу свои очки». Это не дальнейшее описание его поведения, а это описание переменных, функцией которых является его поведение, оно эквивалентно высказываниям: «Я потерял очки», «Я прекращу делать то, что я делаю, когда найду мои очки», или «Когда я это делал в прошлом, я находил мои очки?» См..

Для отправки нажмите Ctrl+Enter, осталось символов для ввода: 1000

Комментарий принят на модерацию

Развитие темы

Самые популярные материалы