← 목록
기타 2026-06-11 3KB 읽기 2분

크라우니 SLM P5 — 룰 자동추출 → 셀코어 규칙저장소 적재 (딥리서치 권고 5/5 완성)

개요

딥리서치(SLM 전문가 기법) 권고 5개 중 마지막 미구현분 P5 완성. 라벨 데이터셋에서 if-then 룰을 지지도(support) 게이팅으로 자동 추출해 셀코어 규칙저장소에 영속 적재. 채택된 룰 = 망각면역 상징 앵커(신경 미세조정이 흔들려도 학습된 지식을 앵커링).

무엇을 했는지

  • 룰자동추출.한선 (25번째 SLM 모듈): RuleFit/decompositional 단순화 스타일
  • 절차: 예제 → 풍부큐브 인코딩 → 활성슬롯 서명 → 서명별 지지수·라벨일관 집계
  • 지지수 ≥ minsup AND 라벨일관 통과분만 셀학습_큐브룰추출로 룰 생성·축적
  • 분류: 매칭 룰 중 우선순위(조건수=특이도) 최고 라벨, 무매칭 → 음(이관) 폴백
  • 적재(영속): 신규 rule 레코드 타입으로 규칙저장소.dat append
  • rule|룰자동추출|슬롯:값,...|라벨|지지수
  • dedup: 사이드카 색인 규칙저장소_룰.idx ("IDX\n" 헤더로 포함 pos0 모호성 회피,
  • 키=[서명/라벨]). 재호출 시 신규 0건 검증됨.

    검증 결과 (모두 GREEN)

    • 컴파일+실행 rc=0 (나눗셈 프리 — crownyc divbug 회귀 우회 충족)
    • 추출: 고유패턴 3 → 채택 2 (티/타), 드롭 1 (저지지 1건)
    • 분류: [3,2,4]→티, [-3,-2,-4]→타, [0,0,0]→음(무매칭 이관) — 3/3
    • 적재: 신규 2건 → 재호출 dedup 0건. 규칙저장소.dat에 rule 레코드 2건 확인
    • 포함() 시맨틱 실측: 미발견=-1, pos0=0 → < 0 가드 정확
    • 일괄 컴파일 회귀: crowny-butler/libs 129/129 PASS

    관련 파일

    • /Users/ef/crowny-butler/libs/룰자동추출.한선 — 본체 (추출_ 접두)
    • /Users/ef/Downloads/CrownyTVM/std/규칙저장소.dat — rule 레코드 적재 대상
    • /Users/ef/Downloads/CrownyTVM/std/규칙저장소_룰.idx — dedup 색인
    • 의존: 셀코어학습.한선(큐브룰추출/매칭/축적), 풍부한임베딩.한선, 벡터인코더.한선

    잔여 이슈

    • 색인 읽기() 단일 16384바이트 한계 — 색인이 16KB 넘으면 뒷부분 키 dedup 누락 가능
    (중복 적재 무해, 코드 주석에 명시). 장기적으로 회전 색인(WAL 패턴) 전환 후보.
    • 스피어 잔여 백로그: 추론서빙 게이트vs액션 모순, 테스트타임검증 도구부호 가중치
    • 후보: 음 BCT 비트평면 산술 가속 (popcount 마스크)

    SLM 트랙 누적

    25 한선씨 모듈, 딥리서치 권고 5/5 완성 (P1~P5). 헌법층(음대수·정본규칙) → L0(삼진BCT) → L1(삼진커널) → L2(학습/지식) → 파이프라인 수직 통합 + 상징 앵커 닫힘.