# LLM 모델 종합 검증 보고서 (2026-03-28 ~ 03-29) ## 테스트 환경 - 서버: llama, AMD ROCm GPU, VRAM ~96GB - llama.cpp server + --jinja ## 코딩 테스트 결과 (기본) | 모델 | 간단코드 | KIS | 속도 | VRAM | |------|---------|-----|------|------| | Qwen2.5-7B | 3초 | 10초 | ? | 5GB | | Qwen3.5-9B | 3.7초 | 54초 | 37.6 t/s | 5GB | | Qwen3.5-27B-Claude | 13.6초 | 161초 | 12.5 t/s | 16GB | | Qwen3-Coder-Next(Q6) | 12초 | 50초 | ~11 t/s | 68GB | | Qwen3.5-122B-MoE | 6초 | 37.7초 | 36.5 t/s | 45GB | ## 확장 테스트 결과 ### 복잡한 코딩 (multi-class module) | 모델 | 결과 | 크기 | 시간 | |------|------|------|------| | 122B MoE | ✅ | 6327자, 203줄 | 44초 | | 9B | ✅ | 281자, 13줄 | 6.6초 | | 27B Claude | ✅ | 362자, 9줄 | ~30초 | ### 플랜/스케줄 작성 | 모델 | 결과 | 크기 | 시간 | |------|------|------|------| | 122B MoE | ✅ | 6196자, 202줄 | 53초 | | 9B | ✅ | 693자, 22줄 | ~20초 | | 27B Claude | ✅ | 1290자 | ~30초 | ### 뉴스 요약/분석 | 모델 | 결과 | 크기 | 시간 | |------|------|------|------| | 122B MoE | ✅ | 5827자, 117줄 | 49초 | | 9B | ✅ | 1621자, 44줄 | ~30초 | | 27B Claude | ⚠️ 타임아웃 | - | - | ### Coder-Next Q2/Q3/Q4: 다운로드 진행 중, 테스트 대기 ## 최종 추천 - **메인 코딩+분석: 122B MoE** (품질 최고, 속도 빠름, 45GB) - **보조/빠른작업: 9B** (37 t/s, 5GB) - **50GB 예산: 122B + 9B 조합**