← 목록
기타 2026-06-11 2KB 읽기 3분

크라우니 SLM 딥리서치 — 삼진 LUT 커널 → ISA729 로워링

핵심 발견

  • 삼진 커스텀 ISA 선례 실증: xTern(RISC-V TNN, +67% 처리량·+57.1% 에너지효율·실리콘 +0.9%), BNRV(BitNet RISC-V, matmul 5.8×·e2e 2.83×). → ISA729 opcode emit은 검증된 길.
  • LUT=mpGEMM 표준 우회: T-MAC(가중치 4묶음 부분합 사전계산→tbl/pshuf 룩업, shift&accumulate), LUT Tensor Core(lmma 명령, 2^(K-1) 대칭화 엔트리, bit-serial). 공통 명령쌍=load-table + lookup-accumulate.
  • ★4상 2비트 패킹 ↔ Frieder-Luk BCT: +1=01, 0=00, -1=10, 금지=11. 크라우니 음-0=11 배치 정확 정렬. a/b 비트평면 분리 → popcount/AND로 트릿연산 emit.
  • 균형3진 산술 유리: 단일트릿 곱=무캐리, 덧셈=9중 2캐리, 부호반전=trit-negate 단일 op(=비트평면 swap). 내적=trit shift-add.
  • 명령선택: iburg tree-pattern matching+비용DP, 비2진 노드는 custom C lowering 필수(LLVM 멀티출력 교훈). RPN 스택→누산기+소수 레지스터 스케줄링(초과만 spill).

크라우니 실행 권고

  • A. ISA729에 삼진LUT로드+룩업누산 opcode 쌍 추가. 테이블 대칭화 2^(K-1)(균형3진 부호반전 odd-function 자연성립). bit-serial 1~다트릿. 삼진곱적.{M}{N}{K} shape-typed 매크로.
  • B. 트릿반전(trit-negate) 단일 opcode(뺄셈/내적=반전+덧셈 합성). 곱셈=무캐리 단일트릿+shift-add. 4상 BCT 정렬: 티=01/옴=00/타=10/음=11.
  • C. iburg ISel + custom C lowering 훅(비2진). RPN 스택→누산기 스케줄링(한선씨 RPN 직접적용).

정직 한계

  • xTern/T-MAC/Quark/survey 원문 PDF 압축으로 니모닉/인코딩 [미확인]. 수치는 abstract+2~3 2차출처 교차확인분만.
  • ISA729(489op/27트릿)는 크라우니 내부 스펙, 외부출처 없음 → 매핑 권고까지만, opcode 번호 검증 불가.
  • 음(-0) 산술 시맨틱은 균형3진 표준에 대응물 없음(0과 동일? 흡수원소? Kleene 모름?) → 크라우니 헌법/VM 명세로 자체정의 필요[미확인]. Frieder-Luk 11 할당은 인코딩 슬롯 매칭일 뿐.
  • 균형3진 곱셈 무캐리·덧셈 2캐리·trit-negate는 Jones+Wikipedia 2출처 일치 신뢰높음.

구현 연결

삼진커널.한선(T-MAC LUT, 곱셈0) 완료 → 다음 삼진BCT.한선(Frieder-Luk 비트평면, trit-negate, carry-free 산술 = 크라우니기계어 L0). 음(-0)=11 흡수 시맨틱 자체정의.