크라우니코드 에이전트의 영어 intent를 한글 canonical로 100% 변환하는 4층 자기학습 다국어 색인 엔진을 구축했다. 테슬라 기가팩토리 5대 원칙(수직통합, 자동화, 규모, 피드백 루프, 실패 회복)을 적용해 13년 장기 성장 가능한 구조로 설계했다.
L0: canonical 한글 intent (keywords_canonical.dat) — 유일한 진실
L1: alias 매핑 테이블 (keywords_alias.dat) — 영어→한글
L2: 단어 사전 + 조어 규칙 (translation_dict/rules.dat) — 자동 확장
L3: 학습 피드백 루프 (translation_learned.dat) — 컴파일 검증 통과분
keywords_canonical.dat, keywords_alias.dat 등 5개 파일 생성extract_canonical.sh로 기존 keywords.dat + semantic_map.dat에서 자동 추출translation_dict.dat: 237개 핵심 단어 (server→서버, cache→캐시 등)translation_rules.dat: 96개 합성 패턴 ({x}_server→{x}서버 등)translate_intent.sh: L1→L2→L3→검증 파이프라인hanseonc_high 컴파일로 품질 게이트--auto-promote: 실시간 L3 승격expand_dict.sh: 자가 확장 사전 로봇 (scan→heuristic→ingest→refine)crownycode-gigaline.sh: 세션 시작 시 rescue→refine 한 명령| 단계 | 커버리지 | 증가분 |
|---|---|---|
| 초기 (L1+L2 only) | 25.3% | — |
| 사전 1차 확장 (337 단어) | 36.6% | +11.3% |
| Claude 배치 1 (200 단어) | 59.3% | +22.7% |
| Claude 배치 2 (200 단어) | 70.3% | +11.0% |
| Claude 배치 3 (300 단어) | 88.2% | +17.9% |
| Claude 배치 4 (94 단어) | 94.5% | +6.3% |
| 특수 토큰 스윕 (47 단어) | 98.8% | +4.3% |
| 최종 (vm 추가) | 100% | +1.2% |
L0 canonical: 2,154
L1 alias: 2,216
L2 사전단어: 1,222
L2 조어규칙: 96
L3 학습승격: 1,169
실패 후보큐: 0
1,402개 영어 intent → 한글 canonical 100% 변환, 전원 크라우니어 컴파일 검증 통과.
agent.sh의 semantic_resolve_intents() 개선:
/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/keywords_canonical.dat — L0 한글 정체/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/keywords_alias.dat — L1 영→한/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/translation_dict.dat — L2 사전 1,222 단어/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/translation_rules.dat — L2 규칙 96개/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/translation_learned.dat — L3 학습 1,169건/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/translate_intent.sh — 변환기 CLI/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/expand_dict.sh — 자가 확장 로봇/Users/ef/Downloads/CrownyTVM/crownycode-agent/intent/extract_canonical.sh — 초기 추출기/Users/ef/.claude/scripts/crownycode-gigaline.sh — 기가팩토리 래퍼/Users/ef/Downloads/CrownyTVM/crownycode-agent/agent.sh — O→A 수리 + 이중 색인 연결bash~/.claude/scripts/crownycode-gigaline.sh cycle # rescue + refine
~/.claude/scripts/crownycode-gigaline.sh stats # 현황 확인
expand_dict.sh heuristic 고정 사전 규칙 확장 여지 있음 (현재 300개 고정 매핑)keywords_canonical.dat에 의미코드 역참조 아직 미완 (현재 _ 플레이스홀더)사전조회_단어 — L2 단어 사전 조회다국어_alias조회 — L1 정확매핑다국어_토큰변환 — L2 토큰 전수 분해다국어_컴파일검증 — 크라우니어 검증 루프다국어_L3승격 — 학습DB 승격다국어_번역파이프 — L1→L3→L2 파이프다국어_기가라인사이클 — rescue/refine 루프std/기가팩토리.한선 — 실행 가능한 간소 검증판 (L1/L2/L3 파이프라인)crownycode-agent/intent/han_companion/translate_intent.한선 — 번역기 한선씨 동반crownycode-agent/intent/han_companion/expand_dict.한선 — 자가확장 한선씨 동반gigaline rescue (마커 파일로 1회만)translate, gigaline./crownycode-agent/agent.sh translate "api_gateway" → L2|API게이트웨이/Users/ef/.claude/projects/-Users-ef/memory/project_crownycode_gigafactory.md문자열.han의 대문자 함수가 lexer의 KwUpper 키워드와 충돌 → 임포트 불가나누기_ 인라인 재정의로 우회 (향후 문자열.한선 리팩터 필요)intent/gigafactory.db — SQLite 메인 DBintent/gigafactory_db.sh — DB 관리 CLI (init/migrate/backup/verify/translate/promote)intent/gigafactory_monitor.sh — 모니터링 CLIintent/gigafactory_quality.sh — 품질 검증 CLIintent/server-translate.js — HTTP API 서버intent/backups/ — 일일 백업 디렉토리com.crowny.gigafactory.plist — 6시간마다 자동 실행gigafactory_cron.sh — 메트릭 수집 + 일일 백업 + 경보 + 실패 회복サーバー → L1|서버, 缓存 → L1|캐시 검증 통과| 파일 | 용도 |
|---|---|
gigafactory.db | SQLite 메인 DB (WAL, 884KB) |
gigafactory_db.sh | DB 관리 CLI (14개 서브커맨드) |
gigafactory_monitor.sh | 모니터링 (collect/dashboard/alert/trend/health) |
gigafactory_quality.sh | 품질 검증 (6개 검사) |
gigafactory_cron.sh | LaunchAgent 크론 |
server-translate.js | HTTP API + 웹 대시보드 |
translate_intent.sh | CLI 변환기 |
translate_batch_fast.awk | 고속 배치 엔진 |
expand_dict.sh | 자가 확장 로봇 |
augment_input.sh | agent.sh 전처리 |
test_gigafactory.sh | 회귀 테스트 (27건) |
extract_canonical.sh | 초기 추출기 |
keywords_canonical.dat | L0 한글 정체 (3,292) |
keywords_alias.dat | L1 영→한 (2,216+80 다국어) |
translation_dict.dat | L2 사전 (1,238) |
translation_rules.dat | L2 규칙 (96) |
translation_learned.dat | L3 학습 (1,169) |
backups/ | 일일 백업 (SHA256, 7일 보관) |
han_companion/ | 한선씨 동반 파일 |
std/기가팩토리.한선 | 한선씨 검증판 |