Инструментальное научение

Инструментальное научение, operant conditioning, метод проб и ошибок - простейшая форма оперантного обусловливания. В оперантном поведении подкрепляется спонтанное поведение, а спонтанность бывает как творческая, так и случайная. В инструментальном научении подкрепляется именно случайное поведение, не ища в нем какого-либо творческого разума и поиска. Достаточно, что это поведение нужное нам или находящееся на пути к нужному нам.

Кошка сидит в ящике, что делать не знает, дергается туда или сюда. Когда (чаще всего случайно) она тянула за шнур, ее награждали. Рано или поздно она научалась тянуть за шнур...

Подкрепление производится в простейшей форме, методом наград и наказаний, и научение происходит за счет примитивных форм нервной деятельности, без включения разума.

Другой вариант оперантного обусловливания, его высшая форма - творческое научение, где подкрепляется в первую очередь включение разума, поисковой творческой активности в нужном направлении, для чего используются сложные и творческие методы подкрепления, существенно отличающиеся от простого метода наград и наказаний. См.

Торндайк

Впервые инструментальное научение как метод проб и ошибок был систематически изучен американским ученым Э.Торндайком (1874-1949), одним из основателей психологии образования. Торндайк помещал кошку в ящик, из которого она могла выйти, только потянув за шнур, свешивавшийся с крышки. После ряда случайных движений кошка рано или поздно тянула за шнур, обычно совершенно случайно. Однако, когда ее снова помещали в ящик, она уже тратила меньше времени на то, чтобы снова потянуть за шнур, и при повторении ситуации освобождалась из ящика мгновенно. Научение измерялось в секундах, которые требовались кошке для того, чтобы совершить правильное действие.

Скиннер

Другой пример инструментального обучения — метод, предложенный американским психологом Б.Скиннером (1904-1990). «Ящик Скиннера» представляет собой тесную клетку с рычагом в одной из стенок; цель эксперимента — научить животное, обычно крысу или голубя, нажимать на этот рычаг. Животное до начала обучения лишают пищи, а рычаг соединяют с механизмом подачи еды в клетку. Хотя сначала животное не обращает внимания на рычаг, рано или поздно оно нажимает на него и получает пищу. Со временем интервал между нажатиями на рычаг уменьшается: животное научается использовать зависимость между желательной реакцией и кормлением.

Метод подследовательных приближений

Иногда научение определенному поведению оказывается таким долгим или сложным, что животное никогда не смогло бы прийти к нему случайно. Тогда применяется метод «последовательных приближений». Не ожидая выполнения всей требуемой последовательности действий, дрессировщик выдает поощрение за что-то похожее на желательный поведенческий акт. Например, если собаку нужно научить перекатываться, ей сначала дают лакомство просто за то, что она ложится по команде. После того, как первая часть освоена, собака получает поощрение лишь при случайном выполнении нужного движения: например, после того, как ляжет, она перекатится на бок. Шаг за шагом дрессировщик добивается все более близкого соответствия желаемому поведению, по принципу детской игры «холодно — теплее — горячо». В целом, инструментальное научение очень похоже на эту игру, но роль спрятанного предмета выполняет определенный вид поведения, а роль слова «горячо» — поощрение.

Последовательные приближения к желаемому поведению применяются и при лечении тяжелых форм шизофрении, когда единственная цель - побудить пациента двигаться и разговаривать вместо того, чтобы уйти в себя и хранить молчание. Как всегда при инструментальном научении, для успешности метода необходимо найти что-то, чего пациент хочет (например, сладости, жевательную резинку или интересные фотографии). После того как обнаружена хоть какая-то реакция, следует определить, какие аспекты поведения наиболее желательны, и сделать их условием получения вознаграждения.

Инструментальное научение и наказание

Наказание в инструментальном научении используется реже. Наказание, в принципе, тоже формирует зависимость между нежелательным поведением и неприятным воздействием, тоже учит, но:

  • наказание учит менее понятно: показывает "что не надо", но оставляет без подкрепления, не показывает "что и как надо",
  • наказание уменьшает контакт между тем кто учит и обучаемым. И животные, и люди из такой ситуации стараются побыстрее убежать.
Для отправки нажмите Ctrl+Enter, осталось символов для ввода: 1000

Комментарий принят на модерацию

Александр 12 ноября 2015 14:12:15

Хорошо.

Развитие темы

Самые популярные материалы