[송재범의 교육답게] 킬러문항, 변별력이 평가의 본질이라고?
[송재범의 교육답게] 킬러문항, 변별력이 평가의 본질이라고?
  • 장재훈 기자
  • 승인 2023.07.03 15:48
  • 댓글 0
이 기사를 공유합니다

송재범 서울 신서고등학교장 / 한국국공립고등학교장회 회장
송재범 서울신서고 교장
송재범 서울신서고 교장

[에듀프레스] “(공정한) 변별력이 평가(시험)의 본질이다.” 대통령(실)이 수능 킬러문항의 문제점을 언급하며 던진 말이다.

이로부터 킬러문항과 사교육 문제 논란이 커지자 교육부가 시급하게 「사교육 경감 대책」을 수립하고 브리핑하던 자리에서 교육부 장관이 또 언급한 말이다. 이후로 킬러문항, 사교육 카르텔, 수능에 대한 논쟁이 뜨겁다.

그런데 수많은 논쟁의 글들을 보면서, 학교 현장의 한복판에 있는 교육자로서 교육적이고 본질적인 질문을 던질 수밖에 없다. 대통령과 교육부 장관이 던진 ‘변별력이 평가의 본질’이라는 말이 교육(학)적으로 적절한 표현인가? 왜 그 많은 논쟁 중에서 이에 대한 문제 제기는 없을까?

교육학개론 기초로 돌아가서 학교에서 평가(시험)의 성격이 무엇인지, 변별도의 의미가 무엇인지를 확인해보자. 평가(evaluation)는 밖으로의 뜻을 지닌 ‘e’와 가치를 뜻하는 ‘value’의 합성어로, 학생의 잠재적 가치(value)를 밖으로(e) 끄집어내어 헤아리는(evaluation) 것이다.

좁은 의미의 교육평가는 교육목표의 달성도를 평가하는 과정이고, 넓은 의미의 교육평가는 학생의 교육목표 달성뿐만 아니라 교사의 학습 지도방법 등을 평가해서 교육과정 자체와 교육의 사회적 공헌도까지 평가할 수 있다. 이것이 평가가 갖고 있는 본질적(처방적) 기능이다.

이 본질적 기능을 위해 평가 문항이 갖추어야 할 조건이 타당도와 신뢰도다. 타당도는 원하는 것을 제대로 된 방식으로 측정하고 있느냐의 문제이다. 학생의 지능을 측정한다고 하면서 줄자로 머리둘레 길이를 잰다면 제대로 된 방식이 아니다.

타당도가 없는 측정 방식이다. 신뢰도는 검사나 시험의 점수가 얼마나 일관성을 갖느냐는 것이다. 키를 세 번 측정했는데 첫 번째는 165cm, 두 번째는 170cm, 세 번째는 175cm가 나온다면 측정치 간에 일관성이 없다. 신뢰도가 떨어지는 것이다.

평가는 이러한 본질적 기능과 함께 또 다른 중요한 기능을 한다. 위에서 언급한 본질적 기능과 비교하여 파생적(전략적) 기능으로 부를 수 있는 것으로, 어떤 특정 목적을 위해 치루는 시험을 말한다.

수험생의 능력을 파악하여 분류, 선발하기 위한 목적으로 평가하는 선발적 기능의 시험이 대표적이다. 수많은 사람들이 경쟁하는 사회에서 점점 이러한 파생적(선발적) 기능이 강조되고 강화된다.

이를 위해 갖추어야 할 평가 문항의 조건이 변별도이다. 변별도는 성적이 높은 학생과 낮은 학생의 실력 차이를 평가 문항이 제대로 구별해 줄 수 있느냐는 것이다.

어떤 평가 문항에 대해 상위집단의 정답률이 하위집단의 정답률보다 높았다면 변별도가 있는 문항이 되고, 차이가 없다면 변별도가 없는 것이 된다. 문항이 너무 어렵거나 쉬울 경우 변별도가 떨어진다.

이렇게 학교 교육에 있어서 평가(시험)의 목적은 본질적(처방적) 기능과 파생적(전략적) 기능으로 구분해볼 수 있고, 이를 위해 평가 문항은 타당도, 신뢰도, 변별도를 갖추어야 한다.

그렇다면 지금 논란이 되고있는 수능 시험은 본질적 기능의 시험에 가까운가, 아니면 파생적 기능의 시험에 가까운가? 본질적 기능의 성격이라면 타당도와 신뢰도가 중요하고, 파생적(선발적) 기능의 성격이라면 변별도가 더욱 중요하게 고려되어야 한다.

명목상으로 수능은 본질적 기능의 시험이다. 대학수학능력시험이라는 용어 자체가 대학에서 수학(修學)할 수 있는 능력을 측정하는 시험이라는 의미이고, 최초 수능 설계 시 통합적이고 고차원적인 사고력을 평가한다는 취지에서 볼 때도 그렇다.

이번 교육부의 「사교육 경감 대책」(2023.6.26.) 추진 과제 중 ‘학교교육 본질에 부합하는 수능 출제로 개선’이라는 항목에서 “개념과 원리를 이해하면 풀 수 있게 출제한다는 수능의 원칙이 지켜지도록 점진적‧단계적 개선”한다는 문구만 보아도 그렇다.

하지만 우리 현실에서 이것을 그대로 받아들이는 사람은 거의 없다. 겉으로 당당하게 표현만 하지 않을 뿐, 수능의 핵심적 기능을 대입 선발 역할에 두고 있고 학교 안이나 밖이나 모두 이에 따라 움직이고 있다.

수능 시험의 선발적 기능에 모든 관심이 집중되다보니, 본래의 교육적인 본질적 기능이 약화되고 선발이라는 파생적(전략적) 기능 자체가 목적이 되어버렸다.

대통령과 교육부 장관이 ‘변별력이 평가의 본질’이라고 선언한 순간, 수능의 성격이 공개적으로 평가의 본질적 기능에서 파생적(전략적) 기능으로 바뀌어버렸다.

교육적이고 본질적인 평가의 위상이 사라진 것이다. 이렇게 된다면 학교에서 이루어지는 다른 모든 시험도 같은 취급을 받게 될 것이다. 학생들의 교육목표 달성도 파악과 교사의 교수학습 개선을 위한 평가의 본질적 기능은 사라지고, 학생 선별을 위한 전략적 기능만이 판칠 것이다.

수능에서 킬러 문항을 없애고자 하는 대통령의 방향성에는 공감하고 찬성한다. 하지만 그 이유는 공교육 안에서의 변별력을 확보하기 위해서도 아니고, 사교육을 경감하기 위해서도 아니다.

많은 사람들이 지적하고 있듯이 킬러 문항을 없앤다고 사교육이 줄어들지도 않을 것이다. 내가 킬러 문항을 반대하는 것은 평가 문항으로서 더 이상 타당도가 없기 때문이다.

평가의 본질적 기능이라는 입장에서 볼 때 지금과 같은 5지 선다형 수능 문항은 시대적 타당도를 잃어버렸다. 수능이 시작된 초기에는 그 타당도가 어느 정도 인정되었지만, 30년이 지난 지금은 타당도가 거의 없다.

지금의 수능 문항은 타당도는 거의 없이, 무자비한 변별력의 칼만을 휘두르고 있다. 킬러 문항이 그 극단에 있다. 오싹한 킬러라는 단어를 우리는 국가가 관장하는 시험에서 공공연하게 사용하고 있다.

학생들에게 킬러 문항은 시험 문항이 아니라 그냥 킬러다. 킬러 문항 몇 개가 문제가 아니라, 모든 꽈배기형 수능 문항이 잠재적 킬러다.

킬러 문항의 처리는 몇 개의 킬러 문항을 제거한다든지 사교육 카르텔을 끊겠다는 식의 방식이 아니라, 타당도의 시효가 다한 수능 평가 방식의 전면적 개혁 차원으로 접근해야 한다.

킬러 문항에 대한 작금의 논쟁은 학생의 지능을 측정한다고 하면서 줄자로 머리둘레 길이를 재는데, 그 줄자에 문제가 있다는 식이다. 일부 측정용 줄자가 부정확하고 비싸니, 정확하면서도 싼 줄자로 교체해야 한다는 얘기다.

이건 제대로 된 해결책이 아니다. 줄자를 과감히 버리고 지능을 측정하기 위한 제대로 된 방식, 타당도 있는 새로운 방식을 찾아야 한다.

학교 교육에 있어서 평가의 본질은 학생들을 갈라치기하는 변별이 아니라, 학생의 잠재적 가치(value)를 밖으로(e) 끄집어내는 것이다. 제발, 이번 킬러 문항 논쟁이 이러한 교육(학)적 문법의 기초 위에서 전개되었으면 좋겠다.

거대한 현실의 벽 앞에서 평가의 본질적 기능이 힘을 못쓰고 있지만, 그렇다고 그 자격을 통째로 변별력에 넘겨주어서는 안된다. 킬러 문항만이 아니라 다양한 교육 문제를 고민하는데 있어서 교육적 문법이 사라지고 있는 현실이 안타깝다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.