← 목록
기타 2026-05-03 4KB 읽기 5분

의미어 고도화 3차 — 히스토리 시스템 + 파이프라인

개요

hansunc.crowny.org에 의미어 고도화 이력 관리 시스템 구축. 크라우니코드에 직접 적용하지 않고, 별도 스테이징 영역에서 작업 → 검증 → 전체적용하는 3단계 파이프라인 확립.

무엇을 했는지

1. hansunc.crowny.org/history 페이지

  • /history 전용 페이지: 타임라인, 파이프라인 시각화, 스테이징 테이블, 도메인 커버리지
  • TOAU 테마 색상 체계, 30초 자동 갱신
  • 4개 상태: staging → verifying → verified → applied

2. History API (7개 엔드포인트)

  • GET /api/history/summary — 전체 현황 (키워드/패턴/학습DB 수, 스테이징 건수, 커버리지)
  • GET /api/history/entries — 고도화 이력 목록
  • GET /api/history/staging — 스테이징 대기 항목
  • GET /api/history/coverage — 도메인별 커버리지
  • POST /api/history/stage — 스테이징 등록
  • POST /api/history/verify — 검증 완료 표시
  • POST /api/history/apply — 적용 (검증 완료만)
  • GET /api/history/export — 전체 데이터 내보내기

3. 의미어 분석 결과

현재 상태:
  • 키워드 16,503건, 8,046 고유 intent
  • 충돌 중복 4,352건 — 같은 키워드가 다른 intent에 매핑
  • 내장함수 95개 누락 — 핵심 함수 키워드 미등록
  • 빈약 도메인 4개 — 암호/보안(7), 파일/IO(9), 패턴(9)

4. 스테이징 데이터 4건 생성

ID유형내용검증
s001중복제거충돌 4,352건 정리미시작
s002내장함수매핑95개 누락 보충 (146건, 99신규)통과
s003도메인강화빈약 4개 강화 (70건, 40신규)통과
s004의미어정밀화intent 네이밍 정규화미시작

5. 검증 + 적용 스크립트

  • verify-and-apply.sh — 5단계 검증 (형식, 내부중복, 기존충돌, 신규분석, intent유효성)
  • --apply 플래그로 백업 후 자동 적용
  • keywords.dat 백업 자동 생성

6. 인프라 연동

  • all.crowny.org: /api/hansunc/history 엔드포인트 추가, /api/overview에 hansunc 현황 포함
  • monitoring.crowny.org: probe.sh에 hansunc 의미어 상태 프로브 추가 (5분마다)
  • 포트 충돌 해결: crowny-party(9760→9768) 이동, hansunc 9760 전용 확보

관련 파일

  • /Users/ef/crowny-hansunc/public/history.html — 히스토리 페이지
  • /Users/ef/crowny-hansunc/server.js — History API 7개 추가
  • /Users/ef/crowny-hansunc/data/history.json — 이력 데이터
  • /Users/ef/crowny-hansunc/data/staging.json — 스테이징 데이터
  • /Users/ef/crowny-hansunc/data/고도화-s002-내장함수매핑.dat — 내장함수 146건
  • /Users/ef/crowny-hansunc/data/고도화-s003-도메인강화.dat — 도메인 강화 70건
  • /Users/ef/crowny-hansunc/data/verify-and-apply.sh — 검증+적용 스크립트
  • /Users/ef/crowny-all/server.js — hansunc 연동 추가
  • /Users/ef/crowny-monitoring/probe.sh — 의미어 프로브 추가

다음 단계 (적용 순서)

  1. s002 적용 (--apply) → 내장함수 99건 신규 추가
  2. s003 적용 → 도메인 40건 신규 추가
  3. s001 착수 → 충돌 중복 4,352건 정리 (가장 큰 작업)
  4. s004 착수 → intent 네이밍 정규화
  5. 전체 적용 후 크라우니코드 에이전트 싱크

잔여 이슈

  • s001 중복 제거 — 4,352건 충돌 분석 및 우선순위 기반 정리
  • s004 intent 정규화 — 도메인_동작_대상 네이밍 규칙 적용
  • crowny-party 포트 변경(9768) 게이트웨이 반영
  • 한선씨 동반 파일 작성

추가 작업 (s001 + s004 적용)

s001 — 충돌 중복 제거

  • 충돌 키워드 1,219개 → 점수 기반 자동 해결
  • 중복 줄 4,499줄 제거 (16,494 → 11,995)
  • 선택 기준: 우선순위 > 네임스페이스 > 한글 > 짧은 intent
  • 변경 로그: data/s001-changes.log (4,319건)

s004 — intent 정규화

  • fn_ 접두어 2,461건 → 한글 도메인명으로 변환
  • 초장문 intent 79건 → 30자 이하로 축약
  • 코드스니펫 intent 120건 → 제거
  • 영문 잔류(FSM, A*, XOR 등) → 한글화

최종 결과

  • 키워드: 16,494 → 11,875건 (정제)
  • 중복: 0건, fn_ 접두어: 0건, 30자 초과: 0건
  • 평균 intent 길이: 9.6자
  • 고유 intent: 7,446종
  • 백업: data/backups/ (3건)