오퍼랜드 컨디셔닝 : 기능, 프로그램, 예 - ECONOMÍA

조건화 또는 악기 조절은 행동이 결과로 제어되는 학습의 유형입니다. 강화 된 행동은 더 자주 나타나는 경향이있는 반면, 처벌받는 행동은 소멸된다는 생각에 기반을두고 있습니다.

조작 적 조건화와 고전적 조건화의 차이점은 무엇입니까? 작동 조건화에서 자발적인 반응은 강화제가 뒤 따릅니다. 이러한 방식으로 자발적인 응답 (예 : 시험 공부)이 미래에 발생할 가능성이 더 높습니다.

스키너 박스

대조적으로, 고전적 컨디셔닝에서는 자극이 자동으로 비자발적 반응을 유발합니다. 예를 들어, 개가 보는 음식으로 인해 타액이 생성됩니다.

Operant Conditioning은 긍정 및 부정적 강화를 사용하여 행동을 수정하려는 과정으로 설명 할 수 있습니다. 조작 적 조건화를 통해 개인은 특정 행동과 결과를 연관시킵니다. 예 :

부모는 자녀의 좋은 성적을 사탕이나 다른 보상으로 보상합니다.
교사는 차분하고 공손한 학생들에게 보상합니다. 학생들은 이런 행동을하면 더 많은 점수를 받는다는 것을 알게됩니다.
레버를 누를 때마다 동물에게 음식이 제공됩니다.

BF Skinner (1938)는 작동 조건화라는 용어를 만들었습니다. 스키너는 세 가지 유형의 응답 또는 피연산자를 식별했습니다.

중립 연산자 : 행동이 반복 될 확률을 높이거나 낮추지 않는 환경 반응.
강화 물 : 행동을 반복 가능성을 증가 환경에서 응답. 강화제는 긍정적이거나 부정적 일 수 있습니다.
처벌 : 행동이 반복 될 확률을 감소시키는 환경의 반응. 처벌은 행동을 약화시킵니다.

작동 조건화의 선행

Thorndike는 컨디셔닝이 단순히 반응과 강화 이상을 포함한다는 것을 처음으로 인식했습니다. 반응은 자극, 반응 및 반응 또는 강화제의 결과라는 세 가지 이벤트를 고려하여 특정 자극이있을 때 발생합니다.

에드워드 손 디크. 게시자 : Popular Science Monthly Volume 80

이 구조는 자극과 반응 사이의 연관성을 촉진합니다. 그의 효과 법칙에서 Thorndike는 결과를 강화하는 반응이 자극이 다시 나타날 때 더 높은 발생 확률을 가질 것이라고 말했습니다.

반대로 부정적인 결과가 뒤 따르는 반응은 자극이 다시 나타날 때 발생 확률이 낮습니다. 효과의 법칙은 Thorndike에 의해 명명 된 것처럼 조작 적 조건화 또는 도구 적 조건화의 선행입니다.

행동 심리학자 인 스키너에게 컨디셔닝은 이전에 얻은 결과에 따라 행동을 강화하는 것이었다.

스키너

이 라인을 따라 두 가지 형태의 컨디셔닝이 있습니다.

-고전적 또는 Pavlovian : 무조건 및 조건부 자극의 연관성을 기반으로하며, 반응은 선행 자극에 의해 제어됩니다.

-오퍼레이터 컨디셔닝 : 결과적 또는 강화 적 자극으로 인해 특정 행동이 방출됩니다. 스키너는 행동에 긍정적 인 강화제가 뒤 따르면 미래에 해당 행동이 방출 될 확률이 높아진다고 설명합니다. 반대로, 강화제가 반응을 따르지 않거나 그 강화제가 부정적이면 미래에 상기 행동을 방출 할 확률이 낮아질 것입니다.

스키너의 박스형 쥐

작동 조건화의 기본 개념

-보강

응답의 발행, 즉 미래에 더 높거나 더 낮게 발생할 확률을 담당합니다. 반응이 발생하면 발생하기 때문에 강화되고 결과적인 자극입니다.

특정 강화제가 반응에 따라 행동에 영향을 미치고 강화제의 결과로 행동이 변경되는 것으로 보이기 전까지는 특정 강화제가 행동에 영향을 미치는지 여부를 알 수 없습니다.

강화에는 긍정과 부정의 두 가지 유형이 있습니다. 둘 다 미래 상황에서 응답이 나올 확률을 높이는 동일한 목적을 가지고 있습니다. 또한 Skinner의 경우 강화제는 관찰 가능하고 측정 가능한 행동으로 정의됩니다.

긍정적 강화

긍정적 인 강화는 개인이 보람을 느끼는 결과를 제공함으로써 행동을 강화합니다. 예를 들어, 개가 앉은 후 먹이를줍니다. 이 경우 앉는 행동이 강화됩니다.

네거티브 강화

불쾌한 강화제를 제거하면 행동을 강화할 수도 있습니다. 이것은 행동을 조절하게 만드는 동물이나 사람에 대한 부정적인 자극을 제거하기 때문에 부정적인 강화로 알려져 있습니다.

부정적인 강화는 불쾌한 경험을 중지하거나 제거함으로써 행동을 강화합니다.

예를 들어, 가정에서 아동이 학대를 당하고 거리로 나갔을 때 학대를 당하지 않는다면 외부로 나가는 행동이 강화 될 것입니다.

1 차 보강재

그들은 그와 같이 기능하기 위해 이전 컨디셔닝의 이력이 필요하지 않은 모든 기본 강화제입니다. 몇 가지 예는 물, 음식 및 섹스입니다.

2 차 보강재

이차 강화제는 무조건 자극과의 연관성 덕분에 이전의 조건화 이야기를 기반으로합니다. 몇 가지 예는 돈과 자격입니다.

-3 기 우발 사태

출처 : Joshua Seong / Verywell

조작 적 조건화의 기본 모델이며 차별적 자극, 반응 및 강화 자극의 세 가지 구성 요소로 구성됩니다.

차별적 자극은 강화제가 사용 가능하다는 것을 피험자에게 알려주는 것이며, 특정 행동을 수행하면 해당 강화제를 얻을 수 있음을 나타냅니다. 대조적으로 우리는 행동이 어떤 유형의 강화제를 얻지 못할 것이라는 것을 나타내는 델타 자극 또는 자극을 가지고 있습니다.

대답은 주체가 수행 할 행동이며, 그 실행이 강화 자극을 얻거나 얻지 못할 것입니다.

강화 자극은 행동의 방출에 대한 책임이 있습니다. 왜냐하면 그 모양 덕분에 반응 방출 확률이 미래에 증가하거나 감소 할 것이기 때문입니다.

-처벌

처벌은 또한 대상의 행동에 미치는 영향으로 측정됩니다. 대신 강화와 달리 의도 된 것은 특정 행동의 감소 또는 억제입니다.

처벌은 후속 상황에서 행동을 할 가능성을 줄입니다. 그러나 처벌의 위협이 감소하면 행동이 다시 나타날 수 있기 때문에 대응을 제거하지는 않습니다.

처벌에는 긍정적 인 처벌과 부정적인 처벌의 두 가지 유형 또는 절차가 있습니다.

긍정적 인 처벌

이것은 특정 행동을 수행 한 후 혐오적인 자극의 표현을 의미합니다. 주제에 의해 주어진 대답에 우발적 인 방식으로 주어집니다.

예를 들어, 손발톱 연하 증을 예방하기 위해 어린이의 손톱에 액체를 뿌릴 때. 아이는 액체의 나쁜 맛 (긍정적 처벌)을 즐기고 손톱을 물어 뜯을 가능성이 줄어 듭니다.

부정적인 처벌

그것은 특정 행동의 결과로 자극의 제거로 구성됩니다. 즉, 특정 행동을 수행 한 후 긍정적 인 자극의 철회로 구성됩니다.

예를 들어, 자녀가 시험에 실패한 후 게임 콘솔 사용을 철회하는 경우.

-멸종

멸종 상태에서는 강화제가 더 이상 나타나지 않기 때문에 대응이 중단됩니다. 이 프로세스는 달성 될 것으로 예상되고 시간이 지남에 따라 해당 동작이 유지되도록하는 해당 강화제를 제공하지 못한 것을 기반으로합니다.

반응이 소멸되면 차별적 자극이 소멸 자극이된다. 이 과정을 잊음과 혼동해서는 안되는데, 이는 일정 기간 동안 방출되지 않아 행동의 강도가 감소 할 때 발생합니다.

예를 들어, 자녀가 계속해서 불평을해도 돈을주지 않으면 불평하는 행동은 사라질 것입니다.

-일반화

주어진 상황이나 자극에 직면하면 반응이 조절되며, 다른 자극이나 유사한 상황보다 먼저 나타날 수 있습니다.

-차별

이 과정은 일반화의 반대이며, 자극과 맥락에 따라 다르게 반응합니다.

강화 프로그램

또한 스키너는 연구를 통해 지속적인 강화 프로그램과 간헐적 강화 프로그램을 포함한 다양한 강화 프로그램을 수립했습니다.

지속적인 강화 프로그램

그들은 반응이 발생할 때마다, 즉 피험자가 원하는 행동을 할 때마다 강화 또는 긍정적 인 자극을 얻을 때마다 반응의 지속적인 강화를 기반으로합니다.

간헐적 강화 프로그램

다른 한편으로, 여기서 피험자는 원하는 행동을 수행하여 항상 강화제를 얻는 것은 아닙니다. 이들은 주어진 응답 수 또는 응답 사이의 시간 간격을 기반으로 정의되어 다른 절차로 이어집니다.

고정 비율 프로그램

이 프로그램에서는 피험자가 고정적이고 지속적인 반응을 생성 할 때 강화제가 제공됩니다. 예를 들어, 비율 10 프로그램에서 사람은 자극이 제시 될 때 10 개의 응답을 한 후에 강화제를 얻습니다.

가변 비율 프로그램

이것은 이전의 것과 동일하게 구성되지만이 경우 피험자가 강화제를 얻기 위해 제공해야하는 응답의 수는 가변적입니다.

강화제는 피험자가 방출하는 반응 수에 계속 의존하지만 가변 비율로 피험자가 강화제를 언제 얻을 수 있는지 예측할 수 없습니다.

고정 간격 프로그램

인터벌 프로그램에서 강화제를 얻는 것은 피험자가 제공하는 응답 수에 의존하지 않고 경과 시간에 따라 결정됩니다. 결과적으로 일정 시간이 지난 후 생성 된 첫 번째 응답이 강화됩니다.

고정 간격 프로그램에서 인핸서와 인핸서 사이의 시간은 항상 동일합니다.

가변 간격 프로그램

이 프로그램에서 보강재는받은 각 보강재마다 시간이 다르지만 시간이 지나면 획득됩니다.

행동 변화

연속적인 접근 또는 형성

몰딩은 행동 모델링을 통한 행동 변화 또는 연속적인 접근 방식의 차등 강화로 구성됩니다.

특정 동작을 형성하기 위해 일련의 단계를 따릅니다. 우선, 어떤 사람이 도달하고자 하는지를 알기 위해 성형하려는 초기 동작을 식별합니다.

이후에 사용할 수있는 강화제를 구분하고 최종 동작에 도달하는 프로세스를 단계 또는 단계로 분리하여 마지막 단계에 도달 할 때까지 각 연속 단계 또는 접근 방식을 강화합니다.

이 동적 절차를 통해 행동과 그 결과가 모두 변형됩니다. 이러한 의미에서 객관적인 행동에 대한 연속적인 접근 방식이 강화됩니다.

그러나이를 수행하기 위해서는 목표에 도달 할 때까지 점차적으로 행동을 강화하기 위해 대상이 이미 수행하고있는 이전 행동부터 시작해야합니다.

체인

그것으로, 새로운 행동은 더 간단한 단계 또는 시퀀스로 분해로부터 형성되며, 각 단계에서 주어진 각 반응을 강화하여 주제의 행동 레퍼토리에서 더 복잡한 반응을 확립하도록 유도합니다.

긴 응답 사슬은 기능적 단위를 채택하고 특정 기술의 습득 및 정의로 이어지는 설정을 채택하는 조건 강화제를 사용하여 형성 될 수 있습니다.

참고 문헌

작동 컨디셔닝. wikipedia.org에서 복구
작동 컨디셔닝. e-torredebabel.com에서 복구되었습니다.
biblio3.url에서 복구되었습니다.
효과의 법칙. wikipedia.org에서 복구되었습니다.
소멸. wikipedio.org에서 복구되었습니다.
Domjan, M. 학습 및 행동의 원리. 강당. 5 판.

오퍼랜드 컨디셔닝 : 기능, 프로그램, 예 - ECONOMÍA - 2026