AI는 변했는데, 평가는 그대로다
ChatGPT가 등장한 지 2년, 대학 교실은 조용히 그리고 급격하게 변했다. 학생들은 더 이상 빈 화면 앞에서 멍하니 커서를 깜빡이지 않는다. 대신 AI에게 글의 구조를 묻고, 번역을 부탁하고, 자신의 주장에 대한 반론을 요청한다. 어떤 학생은 AI를 멘토처럼, 또 어떤 학생은 글쓰기 조교처럼 활용한다.
” AI는 이미 학생들의 책상 위에 있다.”
하지만 교단 위는 아직도 이전 시대의 사고방식에 머물러 있다. 많은 교수자들이 여전히 과제 제출물만을 보고 평가하고, AI 사용을 명확히 금지하는 가이드라인을 학생에게 일방적으로 전달한다. 그들은 ‘AI로 과제하지 말라’고 말하지만, 정작 그 금지를 어떻게 지킬 수 있는지, 또는 지켜야만 하는 이유가 무엇인지 설명하지 못한다.
이런 상황은 단지 기술을 도입하지 못한 문제가 아니다. 교육 철학이 시대의 변화를 따라가지 못하는 데서 비롯된 구조적 불일치다. 결과적으로 학생들은 AI를 쓰고도 말하지 못하고, 교수는 그 흔적을 의심하면서도 구체적으로 다룰 방법이 없다. 이것이 지금, 대학 교실 안에서 벌어지고 있는 학습과 평가의 단절이다.
결과보다 과정을 보라는 말, 어떻게 가능한가
많은 교육자들이 AI 시대의 평가 혁신을 이야기하면서 ‘과정을 평가해야 한다’고 말한다. 하지만 ‘과정’이란 무엇인가? 그리고 그 과정을 우리는 어떻게 보여주고, 검증하고, 평가할 수 있는가? 기존의 평가 방식은 정적인 결과물 위주였다. 보고서, 논술, 과제물은 완성된 형태로만 제시되고, 그것이 어떻게 만들어졌는지, 중간에 어떤 고민과 실패가 있었는지는 보이지 않는다. AI가 이런 결과물을 몇 초 만에 만들어낼 수 있는 시대에, 단지 완성도만을 기준으로 한 평가는 무의미해진다.
이제는 결과물을 내는 것 자체가 아니라, 어떻게 도달했는지를 보여주는 능력이 중요한 역량이 된다. 그렇다면 교육 현장에서는 학생의 사고 흐름, 선택의 이유, 도구의 사용 방식을 추적할 수 있는 새로운 평가틀이 필요하다.
이를 위해 「Tips for Rethinking Student Assessment in the GenAI Era」 보고서는 여러 대안을 제시한다. 초안–중간피드백–최종 제출 구조, AI 사용 반성 저널, 간단한 구두 면담을 통한 자기 설명 평가, AI가 없는 상황에서의 실시간 협업형 과제 수행 등이 그것이다. 이러한 방식은 단지 AI를 감시하는 것이 아니라, AI와 함께 작업한 결과 속에서 인간의 개입 흔적을 찾아내는 평가로 전환하자는 제안이다.
결국 ‘결과보다 과정’이라는 말은 단순한 수사(修辭)가 아니라, 새로운 질문의 시작이자 평가 방식 자체의 재설계를 의미한다.
활용일지와 구술 면담 – 인간의 흔적을 묻는 질문
AI가 만든 결과물 앞에서 평가자는 한 가지 질문을 던져야 한다. “이 학생은 이 결과물을 이해하고 있는가?” 그리고 이 질문에 답을 찾는 가장 효과적인 방식 중 하나가 AI 활용 일지(AI Reflection Journal)과 간단한 구술 면담(oral check)이다.
AI 활용일지는 학생에게 ‘어떤 시점에서 AI를 사용했는가?’, ‘AI에게 어떤 질문을 했고, 어떤 답을 받았는가?’, ‘그 중 어떤 내용을 선택했고, 어떤 것은 제외했는가?’, ‘최종 결과물에 어떤 부분은 AI가, 어떤 부분은 자신이 기여했는가?’, ‘AI를 사용하며 느낀 한계와 성찰은 무엇이었는가’ 등의 항목을 작성하게 하는 방식이다. 이 일지는 단지 자기보고용 형식이 아니다. 학생은 이 과정을 통해 자신의 사고 경로를 언어화하고, 평가자는 AI 사용의 주도성과 맥락적 이해 정도를 읽어낼 수 있다.
여기에 간단한 구술 면담이 결합되면, 평가의 신뢰도는 더 높아진다. 예컨대, “이 과제에서 가장 어려웠던 부분은?”, “AI가 제시한 답 중 무엇을 고르고 무엇을 버렸는가?”, “이 문장은 무슨 의미인가?”와 같은 간단한 질문을 통해, 학생이 과제를 단지 제출했는지, 아니면 자신의 것으로 만들었는지를 확인할 수 있다. 이러한 방법은 부정행위 적발용 면담이 아니라, 교육적 평가라는 점에서 중요하다. 즉, AI와 함께 만든 결과물을 평가하면서도, 그 안에 있는 인간의 흔적을 질문하는 과정이 되는 것이다.

초안, 피드백, 최종본 – 학습의 설계도 만들기
사고는 한 번에 완성되지 않는다. 그렇기에 학생의 생각을 평가하려면, 그 사고가 어떻게 흘렀는지를 보여주는 설계도가 필요하다. 이를 가능하게 하는 것이 바로 단계적 과제 제출(step-by-step submission)이다.
예를 들어 하나의 리포트를 작성하는 과정을 아이디어 스케치 / 주제 선정 이유 제출 – 1차 초안 (초기 구성 및 논리 흐름) – 피드백 반영안 + 수정 방향성 설명– 최종본 제출 + 자기 설명서 (reflection) 로 나누어 살펴볼 수 있다.
이렇게 설계하면 교수자는 단지 결과물의 수준이 아니라, 학생이 어떤 고민을 거쳤고, 어떤 피드백에 어떻게 반응했고, 어디서 깊이가 더해졌는지를 볼 수 있다. 이 방식의 핵심은 단지 ‘많이 내게 하는 것’이 아니다. 단계별로 사고 흐름과 AI 개입 여부를 추적할 수 있도록 유도하고, 학생 스스로도 자신의 성장 흐름을 되돌아보게 하는 ‘학습의 구조화’다. 이러한 설계는 평가자에게는 정밀한 판단의 근거를, 학생에게는 AI 시대에도 배움이 가능하다는 확신을 제공한다.
평가 루브릭을 바꿔야 질문이 달라진다
어떤 평가도, 결국은 루브릭(rubric)이라는 기준표를 바탕으로 이뤄진다. 그런데 AI 시대에 적합하지 않은 루브릭은 AI가 대체할 수 있는 요소만을 높게 평가하는 구조로 이어질 수 있다. 이제 평가자는 묻는 질문을 바꿔야 한다. 단지 ‘잘 썼는가’가 아니라, “얼마나 주도적으로 구성했는가?”, “어떤 판단을 통해 그 답을 선택했는가?”, “그 과정을 통해 어떤 배움을 얻었는가?”를 질문해야 한다.
이를 반영해 다음과 같은 새로운 루브릭 항목을 제안할 수 있다:
항목 | 비중 | 평가 관점 |
---|---|---|
사고의 전개 과정 | 30% | 초안부터 최종본까지 논리의 흐름, 수정 과정의 타당성 |
주도성과 창의성 | 30% | 아이디어의 독창성, 선택의 판단 근거, 도구 활용 능력 |
AI 사용에 대한 성찰 | 20% | 사용 맥락에 대한 설명, 한계 인식, 배움의 반영 여부 |
전달의 명료성 | 20% | 핵심 메시지의 명확성, 독자 중심 서술, 논증력 등 |
이 루브릭은 단지 AI 사용 여부를 따지는 게 아니라, AI를 활용하면서도 학생이 남긴 흔적을 중심으로 평가하는 구조다. 그리고 이러한 기준은 결국 학생에게 “어떻게 쓰느냐”를 스스로 성찰하게 만드는 학습 효과까지 제공할 수 있다.
교실 안 프로젝트와 협업형 실시간 과제
AI가 아무리 똑똑해도, 교실 안에서의 즉흥성과 상호작용, 협업의 역학까지 대체할 수는 없다. 따라서 일부 과제는 AI의 개입을 제한하는 방식으로, 학생 본인의 사고력과 공동 작업 능력을 직접 드러내는 설계가 필요하다.
예를 들어 다음과 같은 실시간 과제가 가능하다.
- 협업형 문제 해결 프로젝트: 소규모 그룹이 제한 시간 내에 주어진 문제를 분석하고 해결안을 제안
- 클래스 내 프레젠테이션 + 질의응답 평가: 자료를 AI가 도와줬더라도, 발표 시점에서는 본인이 맥락을 설명할 수 있어야 함
- AI 비사용 환경에서의 에세이 브레인스토밍: 스마트폰·인터넷 제한 상황에서 아이디어 도출 후, AI 도구와 비교 분석
이러한 방식은 단지 AI를 막기 위해 통제하는 수단이 아니라, AI가 할 수 없는 영역에서 인간적 사고의 질감을 평가할 수 있도록 설계된 도전 과제다.
또한 이러한 활동을 통해 학생은 AI 없이도 사고할 수 있다는 자신감, 도구에 기대지 않고도 자신의 아이디어를 정리하고 표현할 수 있는 훈련,타인의 관점과 충돌하며 협업하는 과정에서 얻게 되는 새로운 통찰과 같은 경험하게 된다. AI의 도움을 받는 것도 중요하지만, 그 도움 이전의 사고 훈련이 충분히 이뤄졌을 때 비로소 AI는 학습의 촉진자가 된다. 그래서 대학은 여전히, 교실 안에서 벌어지는 ‘인간의 순간’을 더 중요하게 바라봐야 한다.
교수자 교육 없는 평가 혁신은 없다
AI 시대에 교육이 변화하려면, 학생 이전에 교수자가 먼저 바뀌어야 한다. 그러나 현실은 그렇지 않다. 많은 교수자들이 여전히 AI를 ‘위험한 기술’이나 ‘부정행위 유도자’로 여기고 있으며, AI를 어떻게 평가에 통합할 수 있는지에 대한 실천적 교육을 받은 경험이 전무하다. 이런 상황에서 평가 혁신을 논하는 것은 설계도 없이 집을 짓는 것과 다름없다.
교수자에게는 다음과 같은 리터러시가 요구된다. AI 도구의 기능과 한계 이해( 어떤 작업을 AI가 잘하고, 어디서 오류가 발생할 수 있는가? ) 학생의 사용 패턴 파악( 단순히 ‘썼다/안 썼다’가 아니라 ‘어떻게 썼는가’를 분석할 수 있는 안목) 그리고 AI 활용에 따른 평가 기준 설정 능력(공정성과 창의성을 균형 있게 고려한 루브릭 설계), AI 윤리 교육 능력 ( 저작권, 인용, 투명성 등 학생의 책임 있는 사용을 유도할 수 있는 안내 역량) 이다.
이를 위해 대학은 교수자 대상 워크숍, 공동 루브릭 개발, 사례 공유 플랫폼 구축 등 실질적 지원 체계를 마련해야 한다. AI 시대의 교육은 교수자 혼자 설계하는 ‘수업’이 아니라, 대학 공동체가 함께 운영하는 ‘교육 시스템’이 되어야 한다.
기술을 두려워할 것인가, 교육을 다시 설계할 것인가
AI를 막는 건 쉽다. 정책 문서에 “AI 사용 금지”라고 쓰면 된다. 하지만 그것은 기술을 외면한 채 교육을 유지하려는 가장 단순한 방어기제일 뿐이다. 이제는 금지 대신, 사용을 허용하면서도 그 사용을 교육적으로 조율할 수 있는 구조를 설계해야 한다. AI 사용의 조건을 명확히 하고, 어떤 목적의 사용은 허용하고, 어떤 영역은 학생의 사고가 직접 개입해야 하는지를 과제 단위로 안내하는 프레임워크가 필요하다.
예를 들어 다음과 같은 조율형 가이드라인을 생각해볼 수 있다:
과제 단계 | AI 사용 가능 여부 | 교수자 요청 항목 |
---|---|---|
주제 선정 | 가능 | 사용한 질문 및 출력 요약 첨부 |
정보 수집 | 가능 | AI가 제공한 정보의 출처 교차 검증 |
초안 작성 | 제한적 가능 | 수정 및 개인화한 흔적 강조 |
최종 정리 | 직접 작성 권장 | 전체 흐름에 대한 구술 설명 요구 |
이러한 구조는 AI를 금지하지 않으면서도, 학생이 ‘도구를 쓰는 자신’을 인식하고, 그 흔적을 책임질 수 있게 만든다.교육이란 도구를 부정하는 일이 아니라, 도구와 인간의 협업을 이해시키는 작업이다. 그리고 그것을 설계하는 책임은 학생이 아니라 대학에 있다.
제도화의 과제 – 대학은 평가를 다시 설계해야 한다
AI 시대에 맞는 새로운 평가 방식을 설계한다는 것은 단순히 교수 개인의 노하우나 수업 방식의 문제가 아니다. 이것은 대학의 제도적 설계와 행정 시스템 전반을 재구성하는 문제다. 왜냐하면 지금까지의 평가 제도는 AI의 개입을 전제로 하지 않았기 때문이다.
대학은 평가 방식에서 AI 사용에 대한 공식 가이드라인 제정 ( 과제별 허용 수준, 인용 방법, 학문적 정직성 기준 등 명문화)하고, 새로운 평가 모형 개발 및 도입 지원( 창의성·주도성 중심의 루브릭 공유, 반성 저널 예시 템플릿 제공) 및 공정성 확보 장치 마련 (AI 접근 격차나 리터러시 차이를 보완할 수 있는 학습 지원 체계 구축)과 평가와 학습 연계 시스템 운영 ( 학습 과정 추적, 피드백 연동, 이력 기반 평가지원 시스템 도입) 구조적 개편이 필요하다.
지금까지의 대학은 ‘평가’라는 고유 권한을 결과물의 채점 행위로 축소해왔다. 그러나 이제는 이 평가를 학습의 맥락을 구성하고, 성장을 안내하며, 도구 사용에 대한 윤리를 가르치는 교육적 행위로 확장해야 한다. 대학이 이 역할을 외면한다면, AI는 계속해서 그림자처럼 교육 안에서 움직이게 될 것이며, 그 그림자는 결국 교육에 대한 신뢰와 정의를 잠식하게 될 것이다.
‘배운 사람’을 알아보는 새로운 평가를 위하여
우리는 지금, 단지 AI 사용을 둘러싼 교육 논쟁에 있는 것이 아니다. ‘무엇을 배웠는가’보다 ‘어떻게 배웠는가’를 평가할 수 있는가, 그리고 ‘배운 사람’을 알아보는 새로운 감수성을 대학이 갖추었는가에 대한 근본적인 시험대 위에 있다. 교육은 감시가 아니라 이해여야 한다. 평가는 통제가 아니라 신뢰여야 한다. 그리고 기술의 시대에 더욱 필요한 것은, 기술 그 자체보다도 그 기술을 사용하는 인간을 알아보는 능력이다.
AI는 이제 학생과 함께 과제를 쓴다. 그 사실을 부정하는 대신, 그 글 안에서 학생의 흔적을 읽고, 질문하고, 응답하려는 시도. 그것이 바로 AI 시대의 교육이 지녀야 할 윤리이자 철학이다. 우리는 이제 물어야 한다. “이 글은 누가 썼는가?”가 아니라, “이 글을 통해 그 학생은 무엇을 배웠는가?”라고.
#AI시대평가 #학생평가혁신 #반성저널 #평가루브릭 #과정중심평가 #AI활용교육 #교수자교육 #대학제도개편 #AI윤리와교육 #교육신뢰회복