73 lines
2.0 KiB
Markdown
73 lines
2.0 KiB
Markdown
# model-switching-runbook.md
|
|
## 122B 전환/복구 운영 규칙
|
|
|
|
---
|
|
|
|
## 목적
|
|
Coder 결과 품질이 낮거나 QA 반복 실패가 발생했을 때, 상시 모델 구조에서 122B 특수 작업 구조로 안전하게 전환하고 다시 복구하는 절차를 정의한다.
|
|
|
|
---
|
|
|
|
## 122B 전환 트리거
|
|
다음 중 하나면 122B 전환 검토:
|
|
- Coder 산출물이 지나치게 짧음
|
|
- 구조가 빈약함
|
|
- TODO 충족률이 낮음
|
|
- QA에서 반복 FAIL
|
|
- 수정 루프가 비효율적으로 길어짐
|
|
- 복잡 설계/구조 생성이 필요한데 Coder가 약함
|
|
|
|
---
|
|
|
|
## 전환 절차
|
|
1. 현재 코딩 작업이 122B 승격 대상인지 판단한다.
|
|
2. `Coder + Vision`을 중지한다.
|
|
3. `122B`를 시작한다.
|
|
4. 122B로 고품질 초안/수정안을 생성한다.
|
|
5. QA 검증을 진행한다.
|
|
|
|
### 권장 명령
|
|
```bash
|
|
cd ~/llama.cpp/download
|
|
./switch_to_122b.sh
|
|
```
|
|
|
|
---
|
|
|
|
## 복구 절차
|
|
다음 조건이면 복구:
|
|
- QA까지 완료됨
|
|
- 추가 122B 작업이 없음
|
|
- 다음 작업부터 기본 상시 구성으로 돌아가도 됨
|
|
|
|
복구 순서:
|
|
1. 122B 중지
|
|
2. Coder 재시작
|
|
3. Vision 재시작
|
|
4. 기본 상시 구성 복귀 확인
|
|
|
|
### 권장 명령
|
|
```bash
|
|
cd ~/llama.cpp/download
|
|
./restore_default_workers.sh
|
|
```
|
|
|
|
---
|
|
|
|
## 운영 원칙
|
|
- 122B는 상시 모델이 아님
|
|
- 122B는 반드시 **8083 전용 포트**에서만 사용
|
|
- 8081(Coder), 8084(Vision) 포트 모델을 다른 모델로 대체하지 않음
|
|
- 122B 전환 전 권장: `Coder + Vision off`
|
|
- 필요 시 QA도 off 가능
|
|
- 작업 종료 후 122B는 drop하고 기본 구조 복귀
|
|
|
|
---
|
|
|
|
## 메인 에이전트 판단 규칙
|
|
메인/플래너는 아래 규칙을 따른다:
|
|
- Coder 결과가 최소 품질 기준 미달이면 그대로 채택하지 않는다.
|
|
- QA가 반복 실패하면 Coder 재시도만 무한 반복하지 않는다.
|
|
- 복잡 설계/고품질 코드 생성이 필요하면 122B 사용을 우선 검토한다.
|
|
- 122B 사용 시 전환 절차와 복구 절차를 반드시 따른다.
|