크라우니 거대SLM 망 자체 분별력 강화 — 표현일치로 망단독 홀드아웃 100%
개요
웨이브4 대형 E2E에서 6층 3진망이
단독으로는 분별 못 하고 분류를 word-majority(단어 다수결)에 의존했다. 근인을 진단·해소:
학습·추론 표현 불일치(distribution shift). 표현을 일치시키니 망이 단독으로 미학습 조합을 100% 일반화. 직접 구현(에이전트·외부API 불필요, 레이트리밋 안전).
가설과 진단
- 웨이브4 망: 학습은 클린 단일슬롯 큐브, 추론은 문맥 어텐션 OR 큐브 → 학습/추론 분포가 다름 → 망이 추론 분포를 못 봄 → 단독 분별 실패(입력극성/word-majority가 실신호).
- 가설: 학습·추론을 같은 표현(문장 = 단어 OR 큐브)으로 일치시키면 망이 단독으로 일반화한다.
검증 (망강화.한선)
- 교사 12샘플(긍정 6 = T구역 2슬롯 OR, 부정 6 = A구역 2슬롯 OR), 라벨 티/타.
- 홀드아웃 6샘플 = 학습에 안 쓴 단어 조합(k 시프트) — 일반화 측정.
- 6층 망(심층_망생성) → 확장_증류에폭 20에폭(표현일치 큐브) → 심층_평가(망 단독, 순전파+출력부호 vs 라벨).
| 망단독 훈련 | 망단독 홀드아웃 |
|---|
| 학습 전(무학습) | 42% | 50% |
| 학습 후(20에폭) | 92% | 100% |
→
망이 단독으로 미학습 조합 100% 일반화 = word-majority(사전 라벨 단어 필요)를 넘어선 진짜 학습 분별력. 망은 사전 라벨 없는 큐브도 영역으로 분류 → 미지어 일반화 가능.
VM 함정 발견 (영속)
인코_빈큐브()+설정(슬롯) 반복 = 배열 손상(feedback_hanseon_set_cube_corrupt): 큐브를 인코_빈큐브 후 설정으로 켜는 함수를 반복 호출 시 일부가 빈 배열(길이0) 반환. 손상이 슬롯 값에 상관(슬롯5 켜는 큐브 전부 손상) = arena/배열메타 손상(멀티블록 행버그 계열).
회피: 큐브를 추가로 직접 구성(설정 대신 슬롯값 순서대로 추가). 단발 설정은 정상, 반복 핫경로만 회피.
의의
- 웨이브4의 "망은 분별 못 함, word-majority가 다 함"은 버그(표현 불일치)였지 한계가 아니었다. 3진 6층망은 실제로 학습·일반화한다.
- word-majority는 사전 라벨 어휘만 분류 / 망은 미지 큐브도 영역분류 → 망 통합 시 일반화 범위 확대.
다음
- 거대SLM2 파이프를 표현일치로 정렬(학습·추론 모두 문장 OR 큐브) → 망을 판정에 통합, 미지어(어휘 외) 일반화 분류 추가
- 교사셋 확대/커리큘럼으로 망단독 훈련 92%→100%
- 딥리서치(#8 망 분별력 기법) 레이트리밋 해제 후 재시도 — 본 결과로 이미 핵심(표현일치) 확보
- 자동 GC(설정/배열 손상 근본)
관련 파일
- /Users/ef/crowny-butler/libs/망강화.한선 (+.rpn.한선)
- 웨이브1~6 문서: docs.crowny.org/docs/2026-06-13-crowny-slm-거대구현-웨이브1~6
보강 (2026-06-14) — 영역개념 일반화 결정타
40에폭 학습 후 추가 검증: 교사는 전부 2슬롯 OR 큐브였으나,
학습에 전혀 없던 단일슬롯 큐브(T구역 슬롯1 단독 / A구역 슬롯19 단독)를 망에 통과 →
T큐브 부호 +1(티) · A큐브 부호 -1(타) 정확 분류. 형태가 다른 미학습 입력을 영역으로 분류 = 망이 "T구역→티, A구역→타"
개념을 학습(훈련 페어 메모리화가 아님). 훈련 92%/홀드 100%(±1 포화 갱신 경계샘플 1개, 과적합 아닌 건강한 상태). 진짜 학습 분별력 확정.