chore: update workspace config and memory
This commit is contained in:
72
model-switching-runbook.md
Normal file
72
model-switching-runbook.md
Normal file
@@ -0,0 +1,72 @@
|
||||
# model-switching-runbook.md
|
||||
## 122B 전환/복구 운영 규칙
|
||||
|
||||
---
|
||||
|
||||
## 목적
|
||||
Coder 결과 품질이 낮거나 QA 반복 실패가 발생했을 때, 상시 모델 구조에서 122B 특수 작업 구조로 안전하게 전환하고 다시 복구하는 절차를 정의한다.
|
||||
|
||||
---
|
||||
|
||||
## 122B 전환 트리거
|
||||
다음 중 하나면 122B 전환 검토:
|
||||
- Coder 산출물이 지나치게 짧음
|
||||
- 구조가 빈약함
|
||||
- TODO 충족률이 낮음
|
||||
- QA에서 반복 FAIL
|
||||
- 수정 루프가 비효율적으로 길어짐
|
||||
- 복잡 설계/구조 생성이 필요한데 Coder가 약함
|
||||
|
||||
---
|
||||
|
||||
## 전환 절차
|
||||
1. 현재 코딩 작업이 122B 승격 대상인지 판단한다.
|
||||
2. `Coder + Vision`을 중지한다.
|
||||
3. `122B`를 시작한다.
|
||||
4. 122B로 고품질 초안/수정안을 생성한다.
|
||||
5. QA 검증을 진행한다.
|
||||
|
||||
### 권장 명령
|
||||
```bash
|
||||
cd ~/llama.cpp/download
|
||||
./switch_to_122b.sh
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 복구 절차
|
||||
다음 조건이면 복구:
|
||||
- QA까지 완료됨
|
||||
- 추가 122B 작업이 없음
|
||||
- 다음 작업부터 기본 상시 구성으로 돌아가도 됨
|
||||
|
||||
복구 순서:
|
||||
1. 122B 중지
|
||||
2. Coder 재시작
|
||||
3. Vision 재시작
|
||||
4. 기본 상시 구성 복귀 확인
|
||||
|
||||
### 권장 명령
|
||||
```bash
|
||||
cd ~/llama.cpp/download
|
||||
./restore_default_workers.sh
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 운영 원칙
|
||||
- 122B는 상시 모델이 아님
|
||||
- 122B는 반드시 **8083 전용 포트**에서만 사용
|
||||
- 8081(Coder), 8084(Vision) 포트 모델을 다른 모델로 대체하지 않음
|
||||
- 122B 전환 전 권장: `Coder + Vision off`
|
||||
- 필요 시 QA도 off 가능
|
||||
- 작업 종료 후 122B는 drop하고 기본 구조 복귀
|
||||
|
||||
---
|
||||
|
||||
## 메인 에이전트 판단 규칙
|
||||
메인/플래너는 아래 규칙을 따른다:
|
||||
- Coder 결과가 최소 품질 기준 미달이면 그대로 채택하지 않는다.
|
||||
- QA가 반복 실패하면 Coder 재시도만 무한 반복하지 않는다.
|
||||
- 복잡 설계/고품질 코드 생성이 필요하면 122B 사용을 우선 검토한다.
|
||||
- 122B 사용 시 전환 절차와 복구 절차를 반드시 따른다.
|
||||
Reference in New Issue
Block a user