# model-switching-runbook.md ## 122B 전환/복구 운영 규칙 --- ## 목적 Coder 결과 품질이 낮거나 QA 반복 실패가 발생했을 때, 상시 모델 구조에서 122B 특수 작업 구조로 안전하게 전환하고 다시 복구하는 절차를 정의한다. --- ## 122B 전환 트리거 다음 중 하나면 122B 전환 검토: - Coder 산출물이 지나치게 짧음 - 구조가 빈약함 - TODO 충족률이 낮음 - QA에서 반복 FAIL - 수정 루프가 비효율적으로 길어짐 - 복잡 설계/구조 생성이 필요한데 Coder가 약함 --- ## 전환 절차 1. 현재 코딩 작업이 122B 승격 대상인지 판단한다. 2. `Coder + Vision`을 중지한다. 3. `122B`를 시작한다. 4. 122B로 고품질 초안/수정안을 생성한다. 5. QA 검증을 진행한다. ### 권장 명령 ```bash cd ~/llama.cpp/download ./switch_to_122b.sh ``` --- ## 복구 절차 다음 조건이면 복구: - QA까지 완료됨 - 추가 122B 작업이 없음 - 다음 작업부터 기본 상시 구성으로 돌아가도 됨 복구 순서: 1. 122B 중지 2. Coder 재시작 3. Vision 재시작 4. 기본 상시 구성 복귀 확인 ### 권장 명령 ```bash cd ~/llama.cpp/download ./restore_default_workers.sh ``` --- ## 운영 원칙 - 122B는 상시 모델이 아님 - 122B는 반드시 **8083 전용 포트**에서만 사용 - 8081(Coder), 8084(Vision) 포트 모델을 다른 모델로 대체하지 않음 - 122B 전환 전 권장: `Coder + Vision off` - 필요 시 QA도 off 가능 - 작업 종료 후 122B는 drop하고 기본 구조 복귀 --- ## 메인 에이전트 판단 규칙 메인/플래너는 아래 규칙을 따른다: - Coder 결과가 최소 품질 기준 미달이면 그대로 채택하지 않는다. - QA가 반복 실패하면 Coder 재시도만 무한 반복하지 않는다. - 복잡 설계/고품질 코드 생성이 필요하면 122B 사용을 우선 검토한다. - 122B 사용 시 전환 절차와 복구 절차를 반드시 따른다.