https://aihub.or.kr/aihubdata/data/view.do?dataSetSn=71716&utm_source=chatgpt.com








| 항목 | 지표 | 설명 | 계산 방식 |
|---|---|---|---|
| A. Accuracy (정확성) | 학생이 제시한 결과가 문제의 정답과 일치하는가 | LLM이 추론한 최종 해와 정답 비교 | |
| B. Reasoning Validity (논리 타당성) | 풀이 단계가 논리적으로 타당한가 (다른 방법이라도 올바른가) | 모델의 chain-of-thought 내 논리 연결 분석 | |
| C. Completeness (완전성) | 풀이 과정의 핵심 단계가 빠지지 않았는가 | Step 추출 후 단계 수/루브릭 비교 | |
| D. Clarity (명료성) | 손글씨, 기호, 전개 구조가 읽기 쉽고 이해 가능한가 | 모델이 판단한 시각적 가독성 점수 | |
| E. FinalScore | 5×(0.35A + 0.35R + 0.2C + 0.1Cl) | 종합 점수 (0~5) |
You are a math teacher acting as a grader.
Evaluate the student's handwritten solution.
[문제 이미지], [모범답안 이미지], [학생 풀이 이미지]를 보고
- Accuracy (0~5)
- Reasoning Validity (0~5)
- Completeness (0~5)
- Clarity (0~5)
- Feedback (한 문장)
If the student uses a different but correct method, do not penalize.
Return JSON only.