본문 바로가기
Study

2-1-5 조작적 학습

by DreamWriter 2023. 3. 28.
728x90

조작적 학습

1. 조작적 학습 이론

- 쏜다이크 학습 : 시행착오 학습

1) 쏜다이크 학습 동물의 지능에 대해서 관심이 있었음.

동물의 지능을 과학적으로 연구하려면 어떻게 해야 할까?

동물의 학습을 연구함으로써 지능을 연구하려 하였음

 

2) 쏜다이크의 실험

굶주린 고양이를 문제 상자에 넣는다.

=> 발이 닿지 않는 곳에 먹이를 잘 보이도록 놓아두었음

=> 그 문제 상자에 문이 달려 있었는데 문은 고리를 당기거나 페달을 밟으면 열 수 있음

=> 고양이는 어떤 틈새로 나가려고 하거나, 고리를 할퀴고 물어 뜯음.

=> 결국에는 문을 열고 자유와 먹이를 찾아 나갈 수 있었음.

다음 시행에서 고양이를 다시 문제 상자에 넣음.

=> 시행이 거듭될수록 고양이는 즉시 문을 열고 나가게 됨.

 

3) 쏜다이크의 실험 결과

문제 상자 안의 고양이는 처음에는 효과 없는 행동.

=> 결국 고양이는 고리를 당기거나 페달을 밟게 되는 행동.

=> 문이 열리고 자유와 먹이를 찾음.

=> 시행이 거듭될수록 고양이는 효과가 없는 행동을 적게 함.

쏜다이크는 각 시행에서 탈출에 걸린 시간을 기록함.

 

4) 쏜다이크 학습 시행회수가 증가함에 따라서 시간이 감소.

학습은 통찰적이지 않고 점증적임.(행동적 학습)

학습은 관념에 의해 매개되지 않음.

모든 포유동물은 동일한 방식으로 학습한다고 주장.

 

5) 조작적 학습 행동이 그 결과에 의해 강해지거나 약화되는 절차를 조작적 학습이라고 함.

조작적 조건형성이라는 용어로 사용되기도 함.

유기체가 환경에다가 어떤 행위를 하여 환경을 변화시킴.

변화뿐만 아니라 그 행동을 증강시키거나 약화시킴.

파블로프식 조건형성에서는 유기체가 수동적임

 

6) 쏜다이크 학습의 평가

시행착오 학습과 훈련 전이와 같은 차후 학습 분야에 영향을 끼칠 현상을 발견하고 발전시킴.

통제된 조건 하에서 효과의 법칙을 설명함.

효과의 이유, 제한, 기간, 정의 및 측정과 관련된 문제들은 행동주의의 연구주제와 논쟁거리.

한계는 효과의 법칙을 지나치게 기계론적으로 정의한다는 것임.

- 두번째 한계는 반응확률이 증가하면 만족스러운 것이 존재하기 때문이라고 하였지만,

반대의 경우에 대한 설명은 거의 이루어지지 않음.

 

- 스키너 학습

1) 스키너의 학습

쏜다이크 실험에 비해 획기적 진전.

=> 실험상자는 먹이통에서 몇 개의 먹이 알갱이를 자동으로 떨어질 수 있도록 함.

 

<반응적 행동과 조작적 행동>

반응적 행동은 자극에 의해 인출되는 행동을 말함.

조작적 행동은 자극과 관련이 없는 행동이며, 행동 결과에 의해 통제됨.

조작적 학습은 행동이 그 결과에 의해 증강 또는 약화됨.

도구적 학습은 행동이 중요한 결과를 초래하는데 도구적 역할을 함.

반응학습, 결과학습, R-S학습과 동일한 의미임.

 

2) 조작적 조건화 원리

강화 자극에 따라오는 반응은 반복되는 경향이 있음.

강화 자극은 조작적 반응의 발생 비율을 증가시킴.

 

3) 스키너 상자와 실험 상자 안에 마루 바닥, 빛, 지렛대, 먹이컵 등이 설치되어 있음.

동물이 지렛대를 누르면 배식기계가 작동하여 먹이가 컵에 주어지도록 만들어짐.

혼자 쥐를 남겨두면, 지렛대를 누르는 행동을 함.

행동을 하면 배식기계가 작동하여 찍찍 소리가 남.

찍찍 소리는 지렛대 누름을 강화시킬 수 있음.

 

4) 스키너 학습과 강화

강화란 결과에 기인한 행동 강도의 증가를 말함.

정적강화와 부적강화는 두 가지가 모두 행동의 강도를 증가시킴.

정적 및 부적이라는 말은 단지 무언가가 가해졌거나 감해졌다는 점을 나타낼 뿐임.

 

추운 방에 있다가 난방을 켜는 사람의 경우, 강화물은

온기의 증가(정적강화물)일까?

냉기의 감소(부적강화물)일까?

 

<정적강화>

정적 강화에서는 행동의 결과가 어떤 자극의 출현이나 강도의 증가임.

정적강화에 사용되는 강화물은 대부분 사람들이 보상적이라고 생각하는 것들이기 때문에

보상학습이라고 함. 보상받는 것은 사람들이고 강화받는 것은 행동임.

 

<부적강화>

부적강화에서는 행동이 어떤 자극의 제거나 자극 강도의 감소를 통해 증강됨.

부적강화물이라고 불리는 이 자극은 유기체가 그로부터 회피 또는 도피하려고 하는 것임.

부적강화에서 행동을 강화하는 것은 혐오스러운 상황에 벗어나는 것임.

 

5) 조작적 조건화 Vs. 고전적 조건화

[반응적 행동]은 파블로프식 조건형성으로 대개 눈깜박임과 소화액의 분비와 같은

반사적 행동에 영향을 미침.

 

[조작적 행동]은 음식구매, 윙크하기와 같은 수의적 행동에 영향을 미침.

 

파블로프식 조건형성은 자율신경계와 평활근과 분비선이 관여함.

조작적 학습은 수의적 신경계와 골격근이 관여함.

파블로프식 절차와 조작적 절차는 서로 다르기는 하지만 함께 일어나는 경우가 흔함.

 

2. 강화물의 종류

1) 강화와 강화의 자격

강화는 어떤 행동의 강도를 증가 혹은 유지시키는 결과를 가져다주는 절차임.

 

강화 자격을 갖추려면

첫째, 행동이 어떤 결과를 낳아야 함.

둘째, 그 행동의 강도가 증가해야 함.

셋째, 그 강도의 증가가 그 행동의 결과로 인한 것이어야만 함.

 

2) 정적강화물과 부적강화물

정적강화는 반응에 대해 자극의 출현이나 자극의 강도 증가가 이어짐.

정적강화물이라고 불리는 이 자극은 보통 유기체가 원하는 것임.

정적강화물의 효과는 강화물에 선행하는 행동을 증가시키는 것임.

정적강화에 사용되는 강화물은 보상적으로 생각하는 성공, 칭찬, 인정, 허용, 돈, 특권 등임.

부적강화에서는 반응이 자극 제거나 자극 강도의 감소에 의해 증가됨.

부적강화물은 대개 유기체가 그 자극으로부터 회피하거나 도피하려고 하는 것임.

 

3) 일차강화물과 이차강화물

일차강화물은 다른 강화물과의 연합에 의존하지 않는 강화물.

일차강화물은 주로 선천적인 것임.

일차강화물은 학습에 의존하지 않는 강화물임.

=>음식과 물 그리고 성적자극, 잠, 활동(마음대로 움직일 수 있는 기회),

더위와 추위에서 벗어나는 것 등이 포함됨.

일차강화물은 그 강화 가치가 빨리 상실되어 금방 물릴 수 있음.

문명사회에서 일차강화물은 인간 학습에서 제한된 역할만 함.

 

이차강화물은 다른 강화물과 연합에 의존하는 강화물임.

이차강화물은 학습에 의존하는 강화물임.

일상적인 예로는 칭찬, 인정, 미소, 박수 등임.

이차강화물은 물리게 되기까지 훨씬 시간이 오래 걸림.

행동을 즉각적으로 강화하기가 일차강화물보다 쉬움.

많은 상이한 상황들에서 사용될 수 있음.

 

4) 자연적 강화물과 인위적 강화물

자연적 강화물은 어떤 행동을 하면 자동적으로 생겨나는 사건임.

자전거 바퀴를 굴리면 자전거가 앞으로 나감.

각각의 강화적 사건은 어떤 행위의 자동적 결과임.

자연적 강화물은 때로는 자동 강화물이라고 함.

 

인위적 강화물은 행동을 수정시킬 목적으로 누군가에 의해 마련된 사건임.

상사는 일을 잘하는 직원들이 계속 일을 잘하도록 만들기 위해 보너스를 줄 수 있음.

 

3. 조작적 학습에 영향을 미치는 변인

1) 수반성

=> 행동과 그 결과 사이의 상관 정도를 말함.

상관관계가 더 강할수록 강화물이 더 효과적임.

강화물이 어떤 행동에 더 일관성있게 뒤따라올수록 행동은 더욱 증강됨.

즉, 학습이 일어나는 비율은 행동에 강화물이 뒤따르는 정도에 따라 달라짐.

 

2) 근접성

=> 반응과 그 강화적 결과 사이의 간격은 조작적 학습 비율에 영향을 미침.

간격이 짧을수록 학습이 빨리 일어남.

즉각적 결과가 학습을 더 잘 일으키는 이유는 결과가 지연되는 동안 다른 행동이 일어날 수 있기 때문

 

3) 강화물의 특징

다른 조건이 동등하다고 할 때, 커다란 강화물은 작은 강화물보다 더 효과적임.

그러나 강화물의 크기와 학습 사이의 관계는 직선적이지는 않음.

 

4) 행동의 특징

행동에 따라 강화의 난이도가 다름.

효과적인 강화물을 이용해도 혈압을 낮추는 것을 학습하기가 목소리를 낮추기를 학습하는 것보다 어려움.

 

5) 동기화 조작

동기화 조작이란 결과의 효력을 변화시키는 모든 것을 가리킴.

 

확립조작과 제거조작이 있음.

확립조작은 결과의 효력(강화물의 힘)을 증가시키는 것.

제거조작은 결과의 효력(강화물의 힘)을 감소시키는 것.

확립조작의 예는 동물에게서 먹이를 박탈하면 먹이는 훨씬 더 강력한 강화물이 됨.

제거조작의 예는 어떤 약물은 음식의 강화적 효과를 감소시킴.

어떤 약물이 니코틴이나 헤로인의 강화력을 감소시킨다면 사람들이 중독에서 헤어나는데 도움을 줄 수 있음.

 

6) 기타변인

- 과거의 학습 경험이 강화에 영향을 미침.

- 서로 경합하는 수반성의 역할

=> 어떤 행동이 강화뿐만 아니라 처벌 결과도 초래한다면,

그 행동을 강화하는 것의 효과는 다를 것임.

복잡한 방식으로 서로 상호작용함.

 

4. 강화와 신경역학

1) 보상중추

보상중추는 중격(대뇌 두 반구를 구분하는 영역) 내의 한 영역으로

뇌의 중간부분에서 전두 피질까지 걸쳐있음.

보상중추 부분에 자극을 받으면 도파민을 방출하는 세포들이 많음.

- 좋은 일이 우리에게 일어나면 도파민이 증가함.

- 특정사건에 의해 얼마나 많이 분비되는지는 일정치 않음.

 

2) 도파민과 강화

예상치 못한 강화물은 예상된 강화물보다 더 많은 도파민을 산출함.

 

J. Hollerman & W. Schultz(1998) 실험.

원숭이들에게 그림쌍을 제시하여, 정답을 맞히면 약간의 사과주스를 받았고

오답은 아무것도 받지 못함.

이러한 실험 조건에서 원숭이 뇌의 도파민 수준을 관찰하였음.

실험결과 실험 초기 도파민 분비 뉴런들은 활동적이었지만 숙달되어 감에 따라 덜 활동적이었음.

가끔 예기치않게 사과주스를 추가로 원숭이에게 주자 도파민 산출이 증가함.

 

3) 강화와 신경역학

특정 경험을 강화적으로 만드는 것은 신경전달물질임.

강화의 신경학적 기제에 대해서는 앞으로 많은 것이 발견될 것임.

강화 담당 구조가 뇌의 중격 부위에 있는 뉴런임을 시사함.

 

가장 깊이 관여하고 있는 뉴런들은 도파민이나 아드레날린을 산출하는 것들인 것으로 보임.

이 두 물질은 일반적으로 긍정적 느낌을 생성함.

 

강화를 이해하려면 강화물이 뇌 속에서 가지는 영향을 알아야 함.

물론 신경생리학적 그 자체만으로 강화에 대해서는 이해할 수 없음.

728x90

'Study' 카테고리의 다른 글

2-1-5 집단 상담의 이론 1  (0) 2023.03.29
2-1-5 청소년과 대중문화  (0) 2023.03.28
2-1-5 태도와 태도변화  (0) 2023.03.28
2-1-5 공감하기  (0) 2023.03.27
2-1-5 통증의 이해  (0) 2023.03.27

댓글