주제: (초중)고등학생 문제 풀이 평가척도 설정

데이터셋

https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=71716&utm_source=chatgpt.com

고등학생

H_1_02_26378_86773.png

H_1_03_26298_87572.png

중학생

M2_1_01_9504_6038.png

M2_1_01_9505_85263.png

모범 답안

H_1_02_26268_86594_A.png

H_2_07_28487_99882_A.png

학생 문제 풀이 (손글씨)

H_1_01_26092_85324_16_X.jpeg

H_1_01_26095_85340_4_O.jpeg

평가 척도

항목 지표 설명 계산 방식
A. Accuracy (정확성) 학생이 제시한 결과가 문제의 정답과 일치하는가 LLM이 추론한 최종 해와 정답 비교
B. Reasoning Validity (논리 타당성) 풀이 단계가 논리적으로 타당한가 (다른 방법이라도 올바른가) 모델의 chain-of-thought 내 논리 연결 분석
C. Completeness (완전성) 풀이 과정의 핵심 단계가 빠지지 않았는가 Step 추출 후 단계 수/루브릭 비교
D. Clarity (명료성) 손글씨, 기호, 전개 구조가 읽기 쉽고 이해 가능한가 모델이 판단한 시각적 가독성 점수
E. FinalScore 5×(0.35A + 0.35R + 0.2C + 0.1Cl) 종합 점수 (0~5)
You are a math teacher acting as a grader.
Evaluate the student's handwritten solution.

[문제 이미지], [모범답안 이미지], [학생 풀이 이미지]를 보고
- Accuracy (0~5)
- Reasoning Validity (0~5)
- Completeness (0~5)
- Clarity (0~5)
- Feedback (한 문장)

If the student uses a different but correct method, do not penalize.
Return JSON only.