← 목록
기타 2026-06-11 5KB 읽기 5분

크라우니 인프라 하드웨어 비교 — 젯슨 토르 vs 맥스튜디오 이원화 (딥리서치 검증)

개요

맥스튜디오에서 터미널 Claude Code 110세션 운영 중 컴퓨터가 못 버틴 사례에서 출발해, 젯슨 토르 도입의 타당성을 딥리서치(인용 교차검증)로 분석. 한선씨 4상 사이징 도구 (/Users/ef/crowny-butler/libs/하드웨어비교.한선, 컴파일·실행 검증)로 정량화.

한 줄 결론

110세션 문제는 CPU·I/O·RAM 병목(오케스트레이션)이지 GPU가 아니다. 토르는 그 작업을 대체 못 한다(R1 타). 토르는 별개로 "로컬 소형 AI + 실시간 학습 + 3진 블록체인 시뮬" 전용 노드(R4 티)로 둬라. 대체가 아니라 역할 분리(이원화)가 정답. "5조 파라미터·24대" 산정은 폐기.

검증 스펙 (딥리서치 2026-06-11, 출처 인용)

플랫폼메모리대역폭연산CPUTDP가격
맥스튜디오 M3 Ultra512GB 통합819 GB/sNPU 32c24P+8E270W$3999~14099
젯슨 AGX 토르 T5000128GB LPDDR5X273 GB/s2070 FP4(sparse)14c Neoverse-V3AE40~130W$3499
H100 SXM80GB HBM33.35 TB/s1979 FP8700W$25~40K
H200141GB HBM3e4.8 TB/s3958 FP8700W
B200~192GB HBM3e~7.7 TB/s9000 FP4(dense)~1000W$30~50K
REBEL-Quad(국산)144GB HBM3e4.8 TB/s2048 FP8(미공개)
FuriosaAI RNGD(국산)48GB HBM31.5 TB/s512 FP8180W
주의: 토르 2070은 FP4 sparse 마케팅 수치. Orin→Thor 대역폭 증가는 7.5배가 아니라 1.33배(273/204.8) — LLM 토큰속도(메모리 바운드)는 약 1.3배. 맥 819GB/s = 토르의 3배.

4상 사이징 결과 (도구 실측)

역할 R1 오케스트레이션(110세션) / R2 동시추론 / R3 1인비동기추론 / R4 학습+3진블록체인
플랫폼R1R2R3R4
맥스튜디오
젯슨토르
H100
B200
REBEL
RNGD

110세션 병목의 본질

  • 각 세션 = 독립 Node.js 프로세스(~270~370MB RAM). 110개 = 순수 RAM ~30~40GB +
JSONL 로그 커질수록 메타데이터 재생성·오토세이브 루프가 코어 점유. 장시간 세션 메모리 누수(재시작 회복).
  • 실제 추론은 클라우드(AWS Trainium + Google TPU)에서 일어남 → 110세션은 로컬 GPU 거의 안 씀.
  • 토르 불리: ARM 14코어 vs 맥 24 P코어 / 128GB vs 512GB / SoM IO vs 워크스테이션 NVMe.

이원화 권고 (실제 워크로드 기준 사이징)

노드대수(현실)역할
맥스튜디오~3대 (1대당 세션 <50)CLI 세션 분산, API 에이전트 팬아웃, 파일/git/빌드 IO
젯슨 토르2~3대로컬 SLM(1~8B/BitNet 삼진) 추론 + 실시간 LoRA + 벡터DB + 4상3진 블록체인 시뮬
클라우드 APIOpus(고도화/교사) + Flash-Lite(사용자 응대)
토르 적합·제약: 1인/비동기엔 적합, 273GB/s가 배치·동시성 제한 → 대중 동시서비스 부적합. 대중 서비스 스케일 시 B200/H200 또는 국산 REBEL-Quad(144GB·4.8TB/s·2048 FP8) 검토. CrownyOS L0(2비트1트릿)/L1(순수3진 BitNet)/L2(4상) 3층 SLM은 토르 FP4 강점과 정합 — 삼진 가중치가 대역폭 압박을 줄이는 올바른 방향.

정직 교정 (환각·과장)

  1. "Opus 4.8=5조 / Mythos=10조 파라미터" = [미확인]. Anthropic 파라미터 전면 비공개.
1차 출처 없음(머스크 발언 인용·비용역산 블로그뿐). → "24대 산정" 전제 붕괴, 폐기.
  1. "Fable 5 / Mythos 5는 가짜" 의심 = 반대로 교정. 딥리서치는 이 둘이 실재 공식모델
(2026-06-09 출시, claude-fable-5 공개 / claude-mythos-5 한정)이라는 공식 문서 출처를 찾음. 단 파라미터·HW 스펙은 여전히 비공개.
  1. 토르 "2070 TFLOPS" = sparse FP4 마케팅. Orin 대비 "7.5배"는 정밀도 단위 다른 비교.
  2. "토르로 맥 대체" 프레임 = 부정확. 대체 불가(CPU/RAM/IO 열세) → 역할 분리가 정확.

크라우니 SLM 연결

이번 세션에 구축한 11 한선씨 모듈(레이트관리/추론서빙/모델배포허브/트리아지가디언/학습법 5종 등)이 토르 R4 노드에서 도는 로컬 SLM 소프트웨어다. 레이트관리=맥 세션 분배 throttle, 추론서빙=로컬추론→음만 클라우드, 모델배포허브=153셀 합의 배포, 트리아지가디언=도메인 전문가.

관련 파일

  • /Users/ef/crowny-butler/libs/하드웨어비교.한선 (4상 사이징 도구)
  • 출처: NVIDIA/Apple 공식, VideoCardz, CNX, ServeTheHome, Rebellions, FuriosaAI, Anthropic 공식

잔여

국산칩 TDP/가격 일부 미공개, 토르 dense 환산 실측, 맥 클러스터 실측 세션 한계 벤치.