2.0 KiB
2.0 KiB
model-switching-runbook.md
122B 전환/복구 운영 규칙
목적
Coder 결과 품질이 낮거나 QA 반복 실패가 발생했을 때, 상시 모델 구조에서 122B 특수 작업 구조로 안전하게 전환하고 다시 복구하는 절차를 정의한다.
122B 전환 트리거
다음 중 하나면 122B 전환 검토:
- Coder 산출물이 지나치게 짧음
- 구조가 빈약함
- TODO 충족률이 낮음
- QA에서 반복 FAIL
- 수정 루프가 비효율적으로 길어짐
- 복잡 설계/구조 생성이 필요한데 Coder가 약함
전환 절차
- 현재 코딩 작업이 122B 승격 대상인지 판단한다.
Coder + Vision을 중지한다.122B를 시작한다.- 122B로 고품질 초안/수정안을 생성한다.
- QA 검증을 진행한다.
권장 명령
cd ~/llama.cpp/download
./switch_to_122b.sh
복구 절차
다음 조건이면 복구:
- QA까지 완료됨
- 추가 122B 작업이 없음
- 다음 작업부터 기본 상시 구성으로 돌아가도 됨
복구 순서:
- 122B 중지
- Coder 재시작
- Vision 재시작
- 기본 상시 구성 복귀 확인
권장 명령
cd ~/llama.cpp/download
./restore_default_workers.sh
운영 원칙
- 122B는 상시 모델이 아님
- 122B는 반드시 8083 전용 포트에서만 사용
- 8081(Coder), 8084(Vision) 포트 모델을 다른 모델로 대체하지 않음
- 122B 전환 전 권장:
Coder + Vision off - 필요 시 QA도 off 가능
- 작업 종료 후 122B는 drop하고 기본 구조 복귀
메인 에이전트 판단 규칙
메인/플래너는 아래 규칙을 따른다:
- Coder 결과가 최소 품질 기준 미달이면 그대로 채택하지 않는다.
- QA가 반복 실패하면 Coder 재시도만 무한 반복하지 않는다.
- 복잡 설계/고품질 코드 생성이 필요하면 122B 사용을 우선 검토한다.
- 122B 사용 시 전환 절차와 복구 절차를 반드시 따른다.