본문 바로가기
심리학

조작적 조건형성 - 강화

by Yulsi0601 2024. 6. 25.

강화 스케줄
계속적 강화(연속 강화) : 바람직한 행동이 나타날 때마다 지속해서 강화하는 것
간헐적 강화(부분 강화) : 바람직한 행동이 나타났을 때 주기적 또는 평균적으로 강화하는 것이다.
간헐적 강화에는 시간 간격에 따라 강화하는 간격 강화와 반응 횟수에 따라 강화하는 비율 강화가 있다.
간격 강화와 비율 강화 각각에는 고정적(fixed) 강화와 변동적(variable) 강화가 있다.
고정간격(fixed interval,FI)
변동 간격(variable interval,VI)
고정비율(fixed ratio,FR)
변동비율(variable ratio,VR)

정적 처벌과 부적 처벌
조작적 조건화에서는 단지 유기체가 하는 행동의 빈도를 증가시키는 것만을 이야기하지는 않는다. 어떤 행동을 수정하기 위해서는 특정 행동의 빈도를 감소시킬 필요가 있는데, 이때 혐오자극을 제공하거나 선호 자극을 제거함으로써 행동의 빈도수를 감소시킨다. 이렇게 행동의 빈도를 증가시키는 강화와 대별되는 것이 처벌이다.

처벌은 유기체의 행동 결과로 어떤 선호 자극을 제거하거나 혐오자극을 제공하는 것을 의미한다. 특히 혐오자극을 제공하는 것을 정적 처벌이라고 하는데, 정적 처벌의 대표적인 예로 체벌을 들 수 있다. 자녀가 거짓말을 하거나, 잘못된 행동을 했을 때 하지 못하도록 혼을 내는 것이 그 예라고 할 수 있다.

반면에 선호 자극을 제거하는 벌은 부적 처벌이라고 한다. 부적 처벌은 그동안 받아오던 강화인을 제거한다는 말과 같다. 부적 처벌의 대표적인 예로 '타임아웃'이 있다. 타임아웃은 어떤 학생이 교실을 시끄럽게 하는 경우, 그 학생을 일시적으로 교실 밖으로 추방하는 것이다. 편하게 교실에서 앉아 공부할 기회와 친구들과 함께 있을 기회를 박탈당하는 것은 직접적인 혐오자극을 부여하는 것이 아니라 선호 자극을 제거하는 부적 처벌에 해당한다.

자극(이익과 불이익)의 부적 강화 및 처벌
정적(적극적) 부적(소극적)
강화 이익의 제공 불이익의 회수
약화(처벌) 불이익의 제공 이익의 회수

처벌을 적용할 때 주의해야 하는 점

처벌을 적용할 때 주의해야 하는 점은, 유기체가 스스로 바람직하지 않다고 여기는 행동을 했던 데에도 불구하고 처벌을 제공하지 않는다면 유기체는 그 행동이 틀린 행동이 아닐 수 있다고 믿는다는 것이다. 처벌에는 이와 같은 부작용이 가능한데, 가장 대표적인 부작용은 처벌받은 유기체는 다른 유기체에서 공격적인 행동을 자주 보인다는 것이다. 혹은 부정적인 정서 반응과 거짓말, 변명 등의 회피 반응을 보이기도 한다. 이러한 처벌의 부작용 다양한 측면으로부터 처벌의 문제점이 지적된다.

하지만 불가피한 상황이라면 다음을 고려해야 한다.

처벌의 강도는 강할수록 그리고 즉각적으로 제공할수록 바람직하지 못한 행동의 인식이 보다 분명하다는 점에서 그 필요성이 제기된다. 그러나 주어지던 벌이 없으면 부적 강화로 여길 가능성이 있다는 점에서 문제 행동이 일어날 때마다 처벌을 제공해야 한다는 부수적인 문제점을 발생시키며 또한 행위와 처벌 간에 객관적이고 합리적인 타당성이 강해야 한다는 점은 처벌이 목적하는 행동의 감소를 위한 필요충분조건이 아니라는 것이 대부분 심리학자의 관점이다. 따라서 바람직하지 못한 행동은 벌을 제공하기보다는 또는 제공하더라도 대안적 행동을 확실히 제시하고 선택의 필요성을 중립적으로 제안해야 한다.

또한 처벌은 '문제 행동이 일어날 때마다 처벌을 제공해야 한다. 주어지던 벌이 없으면 부적 강화로 여길 가능성이 있다.'라는 처벌계획에서처럼 문제행동과 그에 대한 처벌은 제공자(처벌자)와 처벌받는 이와의 관계에서 관심이라는 자극과 반응이 강화되고 있을 수 있다는 또 다른 측면에서처럼 처벌계획이 왜곡될 경우 부정적으로 노출될 수 있다는 점에서 안정적이지 않다는 견해가 있다. 따라서 처벌과 보상을 동시에 사용하는 것이 처벌만을 사용하는 것보다는 유의미할 수 있다.

프리맥 원리
프리맥은 물질적 자극이 아닌 자기 행동도 강화인 역할을 할 수 있음을 알게 되었다. 프리맥에 의하면 유기체가 자주 하는 행동은 잘 하지 않는 행동을 증가시키기 위한 강화인으로 사용될 수 있다. 쉽게 예를 들자면 컴퓨터게임을 좋아하는 아이에게 일정한 양의 수학 문제를 풀게 한 뒤에 컴퓨터게임을 하도록 허락하는 것이다. 이렇게 되면 컴퓨터게임은 수학 문제를 풀게 하기 위한 강화인으로서 작용하게 되는 것이다.

그러나 컴퓨터게임을 먼저 한 뒤 수학 공부를 시키면 효과가 없다. 프리맥 원리의 강화인은 어떤 긍정적 행동을 한 뒤에 제공해야 바른 효과를 얻을 수 있다.

연결 주의

에드워드 손다이크는 행동주의와 학습뿐만이 아니라, 심리학 실험에 동물을 이용한 선구자이기도 했다. 손다이크는 동물과 자신의 연구를 기반으로 학습 이론을 세울 수 있었다. 손다이크는 동물들이 모방이나 관찰을 통해 행동을 배울 수 있는지 관심을 가졌다. 이를 알아내기 위해 길이 20인치, 너비 15인치, 높이 12인치의 퍼즐 상자들을 만들었다. 각 상자는 도르래를 통해 열리는 문이 있었는데, 동물이 막대를 누르면 문에 부착되어 있는 줄이 움직여 문이 열리게 되는 구조였다. 동물에는 막대를 누르거나 레버를 당길 때, 문에 부착되어 있는 줄을 올리는 무게와 여는 문을 일으킬 것이다. 그는 그것이 그들이 탈출하는 데 걸린 시간을 측정하면서 손다이크 퍼즐 상자는 동물이 특정한 반응(레버를 당기거나 버튼을 누르는 것)을 수행하기 위해 배치되었다. 일단 동물이 원하는 응답을 실행했다면 그들은 탈출할 수 있었고 또한 보상받았는데, 보통 음식이었다. 손다이크는 주로 자신의 퍼즐 상자에 고양이를 사용했다. 처음 상자 안에 들어간 고양이는 탈출하는 방법을 알지 못해 안절부절못하고, 돌아다니기만 하였다. 고양이가 관찰을 통해 학습할 수 있는지 알아내기 위해 손다이크는 고양이가 다른 동물들이 상자에서 탈출하는 모습을 보게 하였다. 다른 동물들의 모습을 본 고양이와 그렇지 않은 고양이가 상자에서 탈출하는 데 걸리는 시간을 비교한 결과, 학습에 걸리는 시간은 별 차이가 나지 않았다. 예상했던 결과가 나오자 새로운 실험을 진행하였는데, 고양이가 우연히 한 번 막대를 누른 후 같은 행동을 하는 데까지 걸리는 시간을 측정한 결과, 그 간격이 점점 좁아진다는 사실을 알아내었다. 이 실험을 통해 손다이크는 S자 형태의 학습 곡선을 그려낼 수 있었다.

퍼즐 상자
손다이크는 퍼즐 상자를 통해 고양이가 상자에서 탈출하는 데 통찰력을 사용하는지 하지 않는지 명확하게 구별 짓고 싶어 했다. 그는 만약 고양이가 통찰력을 사용한다면 탈출에 필요한 시간이 급격하게 줄어들 것이라고 예상하였고, 학습 곡선이 점진적인 형태를 띠게 되자 고양이가 지속적인 학습을 통해 탈출할 수 있었다는 결론을 내렸다.

'심리학' 카테고리의 다른 글

발달과정 태내기  (0) 2024.06.25
심리검사의 개념과 역사  (0) 2024.06.25
융의 분석 심리학  (0) 2024.06.25
프로이트의 정신 분석 이론  (0) 2024.06.25
뇌와 신경계  (0) 2024.06.24