강화와 강화계획
1. 정적강화이론
1) Hull의 추동감소 이론
- 헐은 추동(drive)이라는 동기상태로 인해 행동한다고 생각했음.
- 강화물이란 하나 이상의 추동을 감소시키는 자극임.
- 일차강화물에 대해서는 매우 잘 적용됨.
<추동의 예>
- 먹이가 박탈된 동물은 먹이를 획득하도록 추동됨.
- 갈증이 나면 물을 먹도록 추동됨.
- 공기가 탁하면 환기를 시키도록 추동됨.
- 한계는 긍정적인 피드백, 칭찬, 돈 또는 상장이 생리적인 요구를 충족시킨다는 증거는 없음.
- 헐이론은 이차 강화물이 어떻게 추동을 감소시키는지에 대한 설명을 제대로 하지 못함.
2) 상대적 가치이론과 프리맥의 원리
- 강화물은 자극으로 간주되는 것이 일반적임.
- 그러나 프리맥은 강화물을 행동으로 볼 수 있다고 주장함.
- 예를 들면 먹이는 강화물이 되지만 동시에 먹는 행동도 강화물이 될 수 있음.
- 특정상황에서 어떤 행동이 다른 행동보다 일어날 가능성이 높음.
- 예를 들면 쥐는 기회가 주어지면 레버를 누르기보다는 먹는 행동을 할 가능성이 높음.
- 일차 강화물과 이차 강화물 간의 구분에 의존하지 않음.
- 행동의 강화적 속성을 결정하는 것은 상대적 가치라고 할 수 있음.
- 프리맥 원리는 발생할 확률이 높은 행동이 그렇지 않은 행동을 강화함.
- 발생할 확률이 높다는 것은 유기체가 더 좋아하는 일이라고 할 수 있음.
- 이 이론은 경험적이라는 장점이 있음.
- 한계는 발생할 확률이 낮은 행동이 얼마동안 금지 당했을 때,
반대로 발생할 확률이 높은 행동을 강화할 수 있다는 것임.
3) 반응 박탈이론
- 유기체가 어떤 행동을 정상적인 빈도로 하기를 금지 당했을 때 그 행동이 강화적으로 된다는 것임.
- 프리맥 이론 연구의 연장이지만, 한 강화물에 대한 다른 강화물의 상대적 가치에 초점을 맞추는 것은 아님.
- 초점은 각 행동이 그 기저 비율 아래로 떨어진 정도에 있음.
<반응 박탈의 예>
- 하루에 TV를 3시간 보는 초등생이 있다고 할 경우, 이 행동의 기저 비율은 3시간임.
- TV 시청을 1시간으로 줄였다면, TV 시청이 강화물로 이용될 수 있을 것임.
2. 새로운 행동의 조성과 연쇄짓기
1) 새로운 행동의 조성
- 전혀 지렛대를 누르지 않는다면 어떻게 해야 할까?
- 어떻게 지렛대를 누르게 할 수 있을까?
- 지렛대를 누르기와 유사한 행동은 어떤 것이든 모두 강화하는 것임.
- 어떤 식으로든 지렛대를 건드리면 강화함.
- 그런 이후에는 지렛대를 누를 때만 강화함.
=> 목표로 하는 행동에 근접하게 되어 가는 행동들을 체계적으로 강화하는 절차가 조성임.
- 조성은 새로운 형태의 행동의 출현을 설명하는데 큰 역할을 함.
- 새로운 행동은 어떤 의미에서는 기존의 행동으로부터 만들어지는 것임.
- 오래된 형태의 행동에서 새로운 형태의 행동이 이끌어져 나오는 수단이 조성임.
<조성의 예 1>
- 교사는 한글 자음을 처음으로 쓰는 것을 배우는 유아가 자음 비슷하게 쓰기만 해도 칭찬을 해 줄 수 있다.
- 그 이후에 유아가 자음을 비슷하게 쓸 줄 알게 되고 난 후에는 유아가 정확하게 써야만 강화를 해준다.
- 이러한 방식으로 요구수준을 점점 올려서 유아가 글자를 정확하게 쓰게 만들 수 있다.
<조성의 예 2>
- 스키너는 자신의 딸 Deborah를 무릎에 안고 있었다. 날이 어두워져서 스탠드를 켰다.
- 그러자 Deborah는 웃었고, 이것을 본 스키너는 불빛이 딸의 행동을 강화할 수 있는지를 알아보기로 했다.
- 불을 끄고 Deborah가 왼손을 약간 들 때까지 기다렸다가 왼손을 들자 불을 켰다.
- Deborah는 손을 다시 움직였고, 스키너는 불을 켰다가 껐다.
- 스키너는 Deborah의 팔을 점점 더 크게 움직였을 때에만 강화를 주어서
나중에서는 Deborah가 불을 켜기 위해 크게 원을 그리며 팔을 움직이게 되었다.
2) 조성이 잘 일어나기 위한 조건
- 행동의 작은 단계들을 강화함.
- 즉각적 강화를 제공함.
- 작은 강화물을 주는 것이 필요함.
- 비슷한 행동 중 가장 좋은 것을 강화함.
- 필요할 때는 비슷한 행동을 하지 않더라도 기다려 주거나 기준을 낮춤.
3) 연쇄짓기
- 서로 순서대로 연결된 행동을 행동연쇄라고 함.
- 행동연쇄를 수행하도록 훈련시키는 것을 연쇄짓기라고 함.
- 일련의 연결된 행동들 각각을 강화하여 행동 연쇄를 형성하는 것임.
<행동연쇄의 예>
음식점에서의 식사는 자리에 앉아서, 메뉴를 보고, 종업원에게 주문을 하고,
음식을 먹고, 값 을 지불하고, 떠나는 행동들로 이루어진다.
4) 연쇄짓기와 과제분석
- 연쇄짓기에서는 우선 과제분석을 하게 되는데, 과제를 구성요소로 분석하는 것을 말함.
- 연쇄의 각 단계가 적어도 부분적으로는 연쇄의 다음 단계를 수행할 기회가 생긴다는 사실에 의해 강화를 받음.
- 연쇄짓기는 자연적으로 일어나며 이를 닦거나 옷을 입는 것부터
수술이나 비행기 조정과 같이 많은 일상적 행동을 설명함.
<연쇄짓기의 예>
- 케이크를 구울 때 각 단계는 요리과정의 다음 단계로 넘어감으로써 강화를 받는다.
- 재료를 준비하는 것은 재료를 섞을 수 있게 됨으로써 강화를 받고,
- 재료를 섞는 것은 반죽을 케이크 틀에 넣을 수 있게 됨으로써 강화를 받고,
- 케이크 틀에 반죽을 넣는 것은 케이크 틀을 오븐에 넣을 수 있게 됨으로써 강화를 받고,
- 케이크 틀을 오븐에 넣는 것은 반죽이 부풀고 익는 것을 볼 수 있게 됨으로써 강화를 받고 하는 방식이다.
3. 강화계획
강화계획이란?
조작적 행동과 강화의 수반성 사이에 특정한 규칙이 있을 수 있는데, 이러한 규칙을 강화계획이라고 함.
- 단순강화 계획과 복합강화 계획으로 크게 구분할 수 있다.
1) 단순강화계획
<연속강화>
- 어떤 행동이 일어날 때마다 강화를 받음.
- 반응률을 빨리 증가시킴.
- 새로운 행동 또는 행동 연쇄를 조성하는 과제에서 유용함.
- 신속하게 학습시키지만, 자연환경에서 드물다.
- 대부분의 행동은 어떤 경우에는 강화를 받고, 어떤 경우에는 강화를 받지 않음.
<고정비율>
- 반응이 정해진 수만큼 일어난 뒤에 강화가 주어짐.
- 예를들어 5번째 반응마다 강화를 받는다는 것을 말함.
- 강화를 받기 전에 고정된 수만큼 해야 강화를 받을 수 있음.
- 강화 후 휴지 현상이 일어남.
<변동비율>
- 요구되는 반응의 개수를 어떤 평균을 중심으로 변화시킬 수 있음.
- 예를 들어 두 번째 반응 뒤에 강화하고, 그다음은 8번째, 그다음은 6번째,
그다음은 4번째 반응 후에 강화를 하는 것임.
- 고정비율 보다 더 적은 횟수의, 더 짧은 강화 후 휴지를 낳음.
- 이 강화계획은 자연에서 흔히 볼 수 있음.
- 치타가 아무리 빠르다고 해도 사냥감을 쫓아갈 때마다 잡을 수 있는 것은 아님.
- 영원사원의 경우 물건을 팔면 이득이 생기지만 언제나 성공하는 것은 아님.
- 또한 도박 특히 카지노 도박이 예가 될 수 있음.
<고정간격>
- 일정한 시간 간격이 지난 다음에 반응에 대해 강화를 받음.
- 예를 들어 5분 간격 강화계획이라면 5분 간격 다음의 반응만 강화를 받음.
- 가능한 한 뒤로 미루다가 마감시간이 다가오면 바빠지는 행동 방식이 설명될 수 있음.
- 강화 후 휴지, 즉 강화를 받은 후에는 바로 반응률이 낮아짐.
<변동간격>
- 변동적인 시간 지연이 있는 후에 시간 간격의 끝부분의 반응에 대해 강화를 받음.
- 예를 들어 2분마다 강화를 받는 것이 아니라 강화받고 즉각적으로 강화를 받을 수 있음.
- 강화 후 휴지 현상이 일어나기 보다는 비교적 안정된 높은 반응률을 보임.
2) 복합강화계획
<다중 계획>
- 단순강화 계획들의 다양한 조합으로 구성됨.
- 반응이 2개 이상의 단순강화계획의 통제하에 있음.
- 예를 들어 빨간불이 켜 있을 때는 고정간격 강화계획, 노란불이 켜지면 변동비율 강화계획으로 강화하는 것임.
<연쇄계획>
- 일련의 계획 중 마지막 것이 완결되었을 때만 강화가 주어짐.
- 맨마지막 강화계획이 요구하는 반응이 완결되었을 때에만 강화가 주어지는 것임.
<직렬계획>
- 한 계획의 끝과 다음 계획의 시작을 신호하는
뚜렷한 사건(예, 불빛, 버저)이 없다는 점만 제외하면 연쇄계획과 동일함.
3) 부분강화효과
- 연속 강화계획상에 있었던 행동에 비해 간헐적 강화로 유지된 행동이 소거가 더 어려움.
이것을 부분강화효과라고 함.
부분강화효과의 이유를 변별가설, 좌절가설, 순서가설, 반응단위가설로 설명할 수 있음.
<변별가설>
소거와 연속 강화를 구별하는 것보다 소거와 간헐적 강화를 구별하기가 더 힘들기 때문임.
<좌절가설>
Amsel은 이전에 강화받던 행동에 대한 비강화가 좌절을 준다고 주장함(1958, 1962).
좌절은 혐오적인 정서상태이고 좌절을 감소시키는 것은 무엇이든 강화적일 것이라고 말함.
연속 강화에서는 좌절이 없는데, 왜냐하면 비강화가 없기 때문임.
<순서가설>
Capaldi는 훈련 시의 단서들의 연속적 순서상의 때문에 부분강화효과가 생긴다고 주장함 (1966,1967).
소거 시에는 지렛대를 눌러도 강화가 나오지 않고, 지렛대 누르기에 대한 중요한 단서(즉, 강화의 존재)가 없어짐.
연속강화 이후 소거가 신속하게 진행되는 이유는 수행을 위한 중요한 단서가 없기 때문임.
간헐적 강화 시에는 지렛대를 누르면 어떤 때에는 강화가 뒤따르고 어떤 때에는 비강화가 뒤따름.
강화와 비강화의 연속적 순서가 지렛대를 누르기 위한 신호가 됨.
<반응단위가설>
간헐적 강화를 받고 있는 행동에 대해 다르게 생각해야 할 필요가 있음.
간헐적 강화를 받고 있는 행동은 소거에 대해 저항이 더 큰 것처럼 보일 뿐인데,
우리가 강화를 위해 요구되는 반응단위를 고려하지 못했기 때문임.
'Study' 카테고리의 다른 글
2-1-6 집단 상담의 이론2 (0) | 2023.04.06 |
---|---|
2-1-6 청소년과 성문화 (0) | 2023.04.05 |
2-1-6 보완대체요법으로서의 명상 (0) | 2023.04.04 |
2-1-5 비밀보장 (의미, 중요성, 한계) (0) | 2023.03.30 |
2-1-5 집단 상담의 이론 1 (0) | 2023.03.29 |
댓글