의미어 고도화 3차 — 히스토리 시스템 + 파이프라인
개요
hansunc.crowny.org에 의미어 고도화 이력 관리 시스템 구축. 크라우니코드에 직접 적용하지 않고, 별도 스테이징 영역에서 작업 → 검증 → 전체적용하는 3단계 파이프라인 확립.
무엇을 했는지
1. hansunc.crowny.org/history 페이지
/history전용 페이지: 타임라인, 파이프라인 시각화, 스테이징 테이블, 도메인 커버리지- TOAU 테마 색상 체계, 30초 자동 갱신
- 4개 상태: staging → verifying → verified → applied
2. History API (7개 엔드포인트)
GET /api/history/summary— 전체 현황 (키워드/패턴/학습DB 수, 스테이징 건수, 커버리지)GET /api/history/entries— 고도화 이력 목록GET /api/history/staging— 스테이징 대기 항목GET /api/history/coverage— 도메인별 커버리지POST /api/history/stage— 스테이징 등록POST /api/history/verify— 검증 완료 표시POST /api/history/apply— 적용 (검증 완료만)GET /api/history/export— 전체 데이터 내보내기
3. 의미어 분석 결과
현재 상태:- 키워드 16,503건, 8,046 고유 intent
- 충돌 중복 4,352건 — 같은 키워드가 다른 intent에 매핑
- 내장함수 95개 누락 — 핵심 함수 키워드 미등록
- 빈약 도메인 4개 — 암호/보안(7), 파일/IO(9), 패턴(9)
4. 스테이징 데이터 4건 생성
| ID | 유형 | 내용 | 검증 |
|---|---|---|---|
| s001 | 중복제거 | 충돌 4,352건 정리 | 미시작 |
| s002 | 내장함수매핑 | 95개 누락 보충 (146건, 99신규) | 통과 |
| s003 | 도메인강화 | 빈약 4개 강화 (70건, 40신규) | 통과 |
| s004 | 의미어정밀화 | intent 네이밍 정규화 | 미시작 |
5. 검증 + 적용 스크립트
verify-and-apply.sh— 5단계 검증 (형식, 내부중복, 기존충돌, 신규분석, intent유효성)--apply플래그로 백업 후 자동 적용- keywords.dat 백업 자동 생성
6. 인프라 연동
- all.crowny.org:
/api/hansunc/history엔드포인트 추가,/api/overview에 hansunc 현황 포함 - monitoring.crowny.org: probe.sh에 hansunc 의미어 상태 프로브 추가 (5분마다)
- 포트 충돌 해결: crowny-party(9760→9768) 이동, hansunc 9760 전용 확보
관련 파일
/Users/ef/crowny-hansunc/public/history.html— 히스토리 페이지/Users/ef/crowny-hansunc/server.js— History API 7개 추가/Users/ef/crowny-hansunc/data/history.json— 이력 데이터/Users/ef/crowny-hansunc/data/staging.json— 스테이징 데이터/Users/ef/crowny-hansunc/data/고도화-s002-내장함수매핑.dat— 내장함수 146건/Users/ef/crowny-hansunc/data/고도화-s003-도메인강화.dat— 도메인 강화 70건/Users/ef/crowny-hansunc/data/verify-and-apply.sh— 검증+적용 스크립트/Users/ef/crowny-all/server.js— hansunc 연동 추가/Users/ef/crowny-monitoring/probe.sh— 의미어 프로브 추가
다음 단계 (적용 순서)
- s002 적용 (
--apply) → 내장함수 99건 신규 추가 - s003 적용 → 도메인 40건 신규 추가
- s001 착수 → 충돌 중복 4,352건 정리 (가장 큰 작업)
- s004 착수 → intent 네이밍 정규화
- 전체 적용 후 크라우니코드 에이전트 싱크
잔여 이슈
- s001 중복 제거 — 4,352건 충돌 분석 및 우선순위 기반 정리
- s004 intent 정규화 — 도메인_동작_대상 네이밍 규칙 적용
- crowny-party 포트 변경(9768) 게이트웨이 반영
- 한선씨 동반 파일 작성
추가 작업 (s001 + s004 적용)
s001 — 충돌 중복 제거
- 충돌 키워드 1,219개 → 점수 기반 자동 해결
- 중복 줄 4,499줄 제거 (16,494 → 11,995)
- 선택 기준: 우선순위 > 네임스페이스 > 한글 > 짧은 intent
- 변경 로그: data/s001-changes.log (4,319건)
s004 — intent 정규화
- fn_ 접두어 2,461건 → 한글 도메인명으로 변환
- 초장문 intent 79건 → 30자 이하로 축약
- 코드스니펫 intent 120건 → 제거
- 영문 잔류(FSM, A*, XOR 등) → 한글화
최종 결과
- 키워드: 16,494 → 11,875건 (정제)
- 중복: 0건, fn_ 접두어: 0건, 30자 초과: 0건
- 평균 intent 길이: 9.6자
- 고유 intent: 7,446종
- 백업: data/backups/ (3건)