← 목록
기타 2026-06-14 4KB 읽기 3분

크라우니 거대SLM 망 자체 분별력 강화 — 표현일치로 망단독 홀드아웃 100%

개요

웨이브4 대형 E2E에서 6층 3진망이 단독으로는 분별 못 하고 분류를 word-majority(단어 다수결)에 의존했다. 근인을 진단·해소: 학습·추론 표현 불일치(distribution shift). 표현을 일치시키니 망이 단독으로 미학습 조합을 100% 일반화. 직접 구현(에이전트·외부API 불필요, 레이트리밋 안전).

가설과 진단

  • 웨이브4 망: 학습은 클린 단일슬롯 큐브, 추론은 문맥 어텐션 OR 큐브 → 학습/추론 분포가 다름 → 망이 추론 분포를 못 봄 → 단독 분별 실패(입력극성/word-majority가 실신호).
  • 가설: 학습·추론을 같은 표현(문장 = 단어 OR 큐브)으로 일치시키면 망이 단독으로 일반화한다.

검증 (망강화.한선)

  • 교사 12샘플(긍정 6 = T구역 2슬롯 OR, 부정 6 = A구역 2슬롯 OR), 라벨 티/타.
  • 홀드아웃 6샘플 = 학습에 안 쓴 단어 조합(k 시프트) — 일반화 측정.
  • 6층 망(심층_망생성) → 확장_증류에폭 20에폭(표현일치 큐브) → 심층_평가(망 단독, 순전파+출력부호 vs 라벨).
망단독 훈련망단독 홀드아웃
학습 전(무학습)42%50%
학습 후(20에폭)92%100%
망이 단독으로 미학습 조합 100% 일반화 = word-majority(사전 라벨 단어 필요)를 넘어선 진짜 학습 분별력. 망은 사전 라벨 없는 큐브도 영역으로 분류 → 미지어 일반화 가능.

VM 함정 발견 (영속)

인코_빈큐브()+설정(슬롯) 반복 = 배열 손상(feedback_hanseon_set_cube_corrupt): 큐브를 인코_빈큐브 후 설정으로 켜는 함수를 반복 호출 시 일부가 빈 배열(길이0) 반환. 손상이 슬롯 값에 상관(슬롯5 켜는 큐브 전부 손상) = arena/배열메타 손상(멀티블록 행버그 계열). 회피: 큐브를 추가로 직접 구성(설정 대신 슬롯값 순서대로 추가). 단발 설정은 정상, 반복 핫경로만 회피.

의의

  • 웨이브4의 "망은 분별 못 함, word-majority가 다 함"은 버그(표현 불일치)였지 한계가 아니었다. 3진 6층망은 실제로 학습·일반화한다.
  • word-majority는 사전 라벨 어휘만 분류 / 망은 미지 큐브도 영역분류 → 망 통합 시 일반화 범위 확대.

다음

  1. 거대SLM2 파이프를 표현일치로 정렬(학습·추론 모두 문장 OR 큐브) → 망을 판정에 통합, 미지어(어휘 외) 일반화 분류 추가
  2. 교사셋 확대/커리큘럼으로 망단독 훈련 92%→100%
  3. 딥리서치(#8 망 분별력 기법) 레이트리밋 해제 후 재시도 — 본 결과로 이미 핵심(표현일치) 확보
  4. 자동 GC(설정/배열 손상 근본)

관련 파일

  • /Users/ef/crowny-butler/libs/망강화.한선 (+.rpn.한선)
  • 웨이브1~6 문서: docs.crowny.org/docs/2026-06-13-crowny-slm-거대구현-웨이브1~6

보강 (2026-06-14) — 영역개념 일반화 결정타

40에폭 학습 후 추가 검증: 교사는 전부 2슬롯 OR 큐브였으나, 학습에 전혀 없던 단일슬롯 큐브(T구역 슬롯1 단독 / A구역 슬롯19 단독)를 망에 통과 → T큐브 부호 +1(티) · A큐브 부호 -1(타) 정확 분류. 형태가 다른 미학습 입력을 영역으로 분류 = 망이 "T구역→티, A구역→타" 개념을 학습(훈련 페어 메모리화가 아님). 훈련 92%/홀드 100%(±1 포화 갱신 경계샘플 1개, 과적합 아닌 건강한 상태). 진짜 학습 분별력 확정.