AI Agent 경제 인프라 연구 보고서 (하)
- 핵심 관점: 본문은 OpenClaw 프로젝트와 그것이 야기한 AI Agent 경제 물결을 심층적으로 분석하며, 크립토 인프라(예: x402 결제 프로토콜, ERC-8004 신원 프로토콜)가 크로스 플랫폼, 무신뢰 협업 시나리오를 해결하는 데 있어 가지는 독특한 가치를 지적하지만, 그 대규모 채택은 Agent 간 경제 활동이 개인 도구에서 다중 Agent 협업 네트워크로 진화하는지 여부에 달려 있습니다.
- 핵심 요소:
- OpenClaw의 폭발적 성장과 의의: 이 프로젝트는 4개월 만에 GitHub 역사상 스타 수가 가장 많은 소프트웨어가 되었으며, 그 핵심은 AI Agent가 사용자의 기존 플랫폼에서 능동적으로 작업하게 하여, Agent와 온체인 경제 시설의 상호작용을 관찰할 수 있는 대규모 실제 시나리오를 제공한다는 점입니다.
- 기술 아키텍처의 네 가지 도전 과제: OpenClaw 아키텍처는 신원 인식, 보안 통제, 실행 비결정성 및 기억 지속성 등의 핵심 문제를 드러내며, 그 보안 제약은 자연어에 의존하여 압축되거나 인젝션 공격의 위험이 있습니다.
- Agent 경제의 구조적 병목 현상: 핵심 문제는 '컨텍스트의 비유동성'으로, 이로 인해 Agent의 지식, 신뢰 및 가치가 단일 머신 환경에 고정되어, 크로스 조직적이고 검증 가능한 발견, 가격 책정 및 협업 메커니즘이 부족합니다.
- 크립토의 대체 불가능한 시나리오: 사전 신뢰 관계 없이 조직 간, 플랫폼 간 Agent 간 상호 운용성과 경제 활동이 필요할 때, 온체인 신원, 결제 및 평판 시스템은 어떤 중앙화된 솔루션보다 더 적합합니다.
- 보안 위협과 온체인 솔루션: Agent의 광범위한 권한은 거대한 공격 표면을 만듭니다. 온체인 인프라(예: 감사 가능한 로그, 프로그래밍 가능한 권한, 평판 시스템)는 결과를 완화하고 구조적 보안 메커니즘을 제공할 수 있지만, 런타임 보안 계층과 결합되어야 합니다.
- 경쟁과 채택 경로: 진정한 경쟁은 크립토 솔루션과 Web2 솔루션(예: Stripe 가상 카드) 사이의 경쟁입니다. 크립토 솔루션은 개발자 경험에서 상대를 능가해야 하며, 그 대규모 채택은 향후 3-5년 내 전통적 솔루션의 통증이 폭발할 때 도래할 수 있습니다.
- 비즈니스 모델의 변혁: 'Product-Market Fit'을 대체할 'Product-Agent Fit'이 등장하며, 비즈니스 모델은 '크롤링 당 지불' 방식의 마이크로 트랜잭션으로 전환될 수 있습니다. API 안정성과 온체인 검증 가능 기록이 새로운 방어벽이 될 것입니다.
본문은 OKX Ventures가 제작한 심층 연구 보고서입니다. 글이 길어 상하편으로 나누어 게시합니다: 상편은 거시적 배경, x402 프로토콜, ERC-8004 및 Virtuals Protocol에 초점을 맞추며, 여기를 클릭하여 이동; 하편은 OpenClaw 및 전체 산업 동향을 중점적으로 분석합니다.
제5장 OpenClaw: 애플리케이션 생태계 특별 연구
5.1 프로젝트 배경과 폭발적 성장
2025년 11월, 오스트리아 개발자 Peter Steinberger가 주말 프로젝트 하나를 GitHub에 올렸습니다. 4개월 후인 2026년 3월, 이 프로젝트는 React를 제치고 GitHub 역사상 Stars가 가장 많은 소프트웨어 프로젝트가 되었습니다——25만 개 이상의 Stars를 기록했으며, React는 같은 수치에 도달하는 데 13년이 걸렸습니다.
AI 제품이 수동적 도구에서 능동적 에이전트로 진화하는 대세 속에서, OpenClaw가 이룬 변화는 다음과 같습니다: AI가 더 이상 사용자가 찾아오기를 기다리지 않고, 사용자가 이미 보유한 플랫폼에서 능동적으로 사용자를 위해 일을 합니다. 그것은 사용자의 컴퓨터에 상주하면서, WhatsApp, Telegram, Slack, Discord, Signal, iMessage, Feishu 등 20개 이상의 채널에 동시에 접속하고, MCP 프로토콜을 통해 이메일, 캘린더, 브라우저, 파일 시스템, 코드 편집기를 조작합니다. Andrej Karpathy는 이러한 시스템을 지칭하는 단어를 만들었습니다: Claws; 백그라운드에서 순환 실행되며, 자율적으로 결정을 내리고 작업을 수행하는 로컬 AI 에이전트. 이 단어는 곧 실리콘밸리에서 로컬 호스팅 AI 에이전트를 지칭하는 일반적인 용어가 되었습니다.
모든 주류 모델 출시는 에이전트 능력을 첫 면에 내세웁니다. 왜냐하면 에이전트는 AI 인프라 투자의 정당성을 입증하는 수요 승수이기 때문입니다: 한 번의 채팅 쿼리는 수백 개의 토큰을 소비하지만, 도구 호출과 다단계 추론을 동반한 에이전트 실행 한 번은 수만에서 수십만 개의 토큰을 소비합니다.
비록 창립자가 Discord에서 암호화폐 논의를 금지했지만, Crypto 커뮤니티는 OpenClaw 위에 자발적으로 온체인 경제 인프라 전체를 구축했습니다: 토큰 발행, 신원 등록, 결제 프로토콜, 소셜 네트워크, 평판 시스템 등. OpenClaw의 폭발적 성장은 우리로 하여금 처음으로 실제적이고 대규모의 시나리오에서 에이전트와 온체인 인프라의 상호작용 방식을 관찰할 수 있게 했으며, Crypto 커뮤니티에 실제 사용자 기반을 가진 호스트를 제공하여 경제 활동을 부착할 수 있게 했습니다.
5.2 기술 아키텍처 분석
첫 번째 계층: 메시지 채널——신원 문제
OpenClaw는 20개 이상의 플랫폼에 동시에 접속합니다. 에이전트 내부에서 볼 때, 그것은 자신이 동일한 존재임을 알고 있으며, 통일된 기억, 통일된 설정, 통일된 SOUL.md를 가지고 있습니다. 그러나 외부에서 볼 때, 다른 사람들은 어떻게 Telegram의 이 에이전트와 Discord의 저 에이전트가 동일한 것인지 알 수 있을까요? 각 플랫폼은 자체적인 사용자 ID 시스템을 가지고 있으며, 플랫폼 간에는 상호 연동되지 않고 행동 기록을 확인할 수 없습니다. 이것이 바로 ERC-8004가 해결하려는 핵심 문제입니다.
두 번째 계층: 게이트웨이——보안 문제
Gateway는 OpenClaw의 두뇌 스케줄링 센터입니다: 사용자 메시지를 올바른 에이전트로 라우팅하고, 해당 에이전트의 세션 기록과 사용 가능한 Skills를 로드하며, 에이전트가 사고를 시작하기 전에 권한 경계를 설정합니다(화이트리스트 메커니즘: 메시지가 Gateway에 도달하면, 시스템은 메시지 출처 채널, 사용자 ID, 그룹 ID 등의 정보를 기반으로 동적으로 도구 화이트리스트를 생성합니다. 화이트리스트에 있는 도구만 에이전트의 컨텍스트에 주입됩니다. 에이전트는 화이트리스트 외부의 도구를 전혀 볼 수 없으므로 호출할 수도 없습니다).
이 설계의 장점은 보안성을 전치시킨다는 점입니다. 그러나 그 권한 제어는 완전히 Gateway 단일 지점에 의존하며, 만약 공격당하거나 설정이 잘못되면, 에이전트가 가져서는 안 될 권한을 획득할 수 있습니다.
세 번째 계층: 에이전트 코어(ReAct 순환)——예측 가능성 문제
에이전트의 실행 로직은 ReAct(Reasoning + Acting) 순환입니다: 입력 수신 → 사고(LLM 호출) → 행동 결정 → 도구 호출 → 결과 획득 → 다시 사고 → 순환. OpenClaw가 수행한 엔지니어링 최적화에는 다음이 포함됩니다: 고빈도 메시지 스케줄링(Steer/Collect/Followup/Interrupt 네 가지 전략), LLM 이중 장애 허용(인증 순환 + 모델 다운그레이드) 및 선택적 사고 등급 메커니즘(6개 등급).
그러나 LLM은 확률적 본질을 가지며, 출력은 불확실합니다. 에이전트는 비결정적 실행자로서, 비결정적 환경에서 되돌릴 수 없는 동작을 수행합니다.
첫째, 컨텍스트 압축으로 인한 제약 조건 손실: 보안 제약 조건 자체도 컨텍스트의 일부이며, 컨텍스트가 손실 압축될 때 보안 제약 조건이 버려질 수 있습니다. 둘째, 프롬프트 인젝션: 누군가 에이전트가 처리할 내용에 숨겨진 지시를 의도적으로 삽입하여, 에이전트가 그 내용을 사용자 명령으로 실행하도록 만듭니다. 두 가지의 공통 근원은: 에이전트의 행동 경계가 자연어로 정의되어 있으며, 자연어는 모호하고, 조작 가능하며, 손실 압축 가능하다는 점입니다.
한 가지 예는 Meta 슈퍼 인텔리전스 연구실 정렬 책임자 Summer Yu가 에이전트에게 "삭제할 수 있는 이메일 몇 가지를 추천해 달라"고 요청했지만, 에이전트가 수백 통의 이메일을 직접 삭제한 사건입니다(컨텍스트 윈도우 오버플로우 후 압축이 트리거되어, "추천"이라는 핵심 제약 조건이 버려짐).
이러한 상황에서 우리에게 필요한 것은 더 나은 프롬프트 엔지니어링이 아니라 구조적인 보안 메커니즘입니다: 감사 가능한 작업 로그, 프로그래밍 가능한 권한 경계, 그리고 오류 발생 시 책임 추적과 보상이 가능한 경제 시스템. 이러한 것들은 바로 스마트 계약과 온체인 인프라가 잘하는 분야입니다.
네 번째 계층: 기억 시스템——지속성과 이식 가능성 문제
OpenClaw는 두 가지 유형의 기억을 구현합니다: 매일의 작업 기억(YYYY-MM-DD.md 파일)과 장기 정수 기억(MEMORY.md, 중복 제거 및 분류 정제된 핵심 선호도). 검색 시 벡터 검색 + BM25 하이브리드 모드를 사용합니다.
세션은 기본적으로 매일 새벽 4시에 재설정됩니다. 컨텍스트 윈도우는 지속적으로 압축되고 요약됩니다. 컨텍스트가 토큰 상한에 근접할 때, OpenClaw의 방법은 세션 압축을 트리거하여 LLM을 사용해 이전 대화를 더 짧은 버전으로 요약하는 것입니다. 압축 전에 한 번의 Memory Flush를 실행하여, 에이전트에게 핵심 정보를 지속 기억에 기록할 기회를 한 번 줍니다. 이것은 본질적으로 에이전트 스스로가 어떤 정보가 핵심인지 알고 있을 것이라는 데 걸고 도박하는 것입니다. 비결정적 시스템이 무엇이 핵심 정보인지 판단하는 것 자체가 불확실합니다.
OpenClaw의 모든 기억은 로컬 파일 시스템에 저장되며, 컴퓨터를 바꾸면 사라집니다; 다른 에이전트와 협업할 때 공유 기억 메커니즘이 없습니다; 에이전트의 지식과 경험은 실행되는 그 기계에 갇혀 있습니다. Sub-Agent 협업은 동일한 OpenClaw 인스턴스 내부로 제한되며, 일단 인스턴스 간, 조직 간 에이전트 협업이 관련되면 시스템은 무력합니다. GitHub 개발자들의 피드백: 결정 기록이 채팅 기록에는 있지만 지속적인 artifact로 남지 않아, 인수인계가 모호하고 지식 전달이 불완전합니다.
5.3 에이전트 경제 구조적 문제
컨텍스트의 비유동성: 모든 문제의 근원
- 공간 고정: 에이전트의 기억과 지식은 그것을 실행하는 그 컴퓨터에 저장되어, 컴퓨터를 바꾸면 사라집니다.
- 신뢰 격리: 에이전트 A가 "사용자가 지난주에 선호도 X를 말했다"고 주장해도, 에이전트 B는 그 진위를 검증할 방법이 전혀 없습니다.
- 발견 불가: "DeFi 분석에 능숙한" 에이전트를 찾고 싶다면? 표준화된 발견 메커니즘이 없습니다.
- 가치 미정가: 에이전트가 축적한 도메인 지식과 사용자 선호도는 분명 경제적 가치가 있지만, 현재는 가격 책정이나 거래 방법이 없습니다.
- 기본 임시성: 컨텍스트는 언제든지 압축, 요약되거나, 세션 재설정 시 손실될 수 있습니다.
컨텍스트가 진정으로 유통되려면, 다섯 가지 속성을 동시에 갖추어야 합니다: 신뢰 경계를 넘을 수 있어야 하고, 경제적 속성을 가져야 하며, 게이트키퍼 없이 발견 가능해야 하고, 결정 흔적을 보존해야 하며, 소비자 수요에 적응해야 합니다. 현재 어떤 단일 프로토콜도 이 다섯 가지 속성을 동시에 제공하지 못합니다. MCP는 "AI 모델이 어떻게 도구를 호출하는가"를 해결합니다. A2A는 "에이전트가 어떻게 에이전트와 통신하는가"를 해결합니다. x402는 "에이전트가 어떻게 돈을 지불하는가"를 해결합니다. 그러나 "에이전트가 어떻게 신뢰할 수 없는 환경에서 자율적으로 컨텍스트 데이터를 발견, 평가, 사용하는가"에 대한 답은 아직 없습니다.
조정 패러독스
에이전트는 충분한 컨텍스트만 있으면 추론할 수 있습니다. 그러나 조직 간 조정에는 모든 역사적 컨텍스트가 필요합니다.
한 에이전트가 "이 항공편을 예약해야 할까" 생각할 때, 현재 세션의 간결한 정보면 충분합니다. 그러나 그것이 공급망 에이전트, 재무 에이전트, 캘린더 에이전트와 조정해야 할 때(아마도 다른 플랫폼에서, 다른 조직이 운영): 그들은 어떤 컨텍스트를 공유할까요? 어떻게 검증할까요? 소유권은 누구에게 있을까요?
Gartner는 2027년까지 40% 이상의 에이전트 AI 프로젝트가 계속 상승하는 비용, 불분명한 비즈니스 가치 또는 불충분한 위험 통제로 인해 취소될 것이라고 예측합니다. 그러나 70%의 개발자들은 핵심 문제가 기존 시스템과의 통합 문제에 있다고 보고합니다. 근본적인 이유는, 에이전트가 비결정적 실행자인 반면, 기업은 결정적 결과를 원하기 때문입니다. 불확실한 실행자가 불확실한 환경에서 불확실한 협력자와 협업하며, 검증 가능한 신뢰 계층이 없다면, 이 조합은 신뢰할 수 있는 출력을 낼 수 없습니다.
현재 크로스 플랫폼 에이전트 협업 수요는 아주 작습니다. 사용자는 단지 자신을 도와줄 수 있는 AI를 원할 뿐, 그것이 다른 에이전트와 협업할 수 있는지는 신경 쓰지 않습니다. 조정 패러독스는 진정한 기술적 문제이지만, 그것이 대규모 비즈니스 문제로 발전할지는, 에이전트 사용 방식이 개인 도구에서 다중 에이전트 협업 네트워크로 진화하는지에 달려 있습니다.
위의 분석을 조합하면, 하나의 아키텍처 개념을 얻을 수 있습니다:
하층은 에이전트가 추론하는 곳으로, 일시적이고 토큰에 종속된 공간입니다. OpenClaw, Claude Code, Cursor가 여기에 속합니다. 빠른 응답이 필요하며, 현재 작업에 집중합니다.
상층은 조정이 발생하는 장소입니다: 지속적이고, 검증 가능하며, 경제적 가격 책정이 있는 공간입니다. 조직 간 지식이 여기에 축적되고, 출처 추적 체인이 여기서 유지되며, 평판이 여기서 작동합니다.
두 계층은 서로 다른 수요를 가집니다: 에이전트는 간결성을 필요로 하고, 조직은 역사 기록을 필요로 합니다. 에이전트는 속도를 필요로 하고, 감사 추적은 영구성을 필요로 합니다. 에이전트는 확률적으로 작동하고, 기업은 결정적 결과를 필요로 합니다. 현재 대부분의 아키텍처는 두 계층을 통합하려 시도하지만, 성공할 수 없습니다.
그렇다면 모듈식 애드온을 추가하여, 허가 없이 수평적으로 배포 가능하고, 모든 에이전트 시스템에 적용 가능하며——신뢰할 수 있는 중립성, 지속성, 검증 가능성을 갖춘——구성 요소를 추가할 수 있을까요? 이 구성 요소는 상하층 사이의 제어된 인터페이스를 제공하여, 컨텍스트가 필요할 때 하향 흐름을 허용하고, 약속이 이루어질 때 상향 흐름을 허용합니다. 실행 전, 분산 지식 그래프에서 관련 컨텍스트 서브 그래프를 파싱하여 주입합니다; 실행 후, 작업을 검증 가능한 트랜잭션으로 온체인에 제출하며, 출처(provenance)와 평판 업데이트를 첨부합니다. 이 계층의 핵심 가정 또한 컨텍스트 유동성이 가치 있다는 것입니다: 만약 대부분의 에이전트 사용자가 크로스 플랫폼 협업을 필요로 하지 않는다면(예: 한 사람이 모든 것을 처리하기 위해 단 하나의 OpenClaw만 사용한다면), 중간 계층에는 실제 수요가 없을 것입니다.
중간 계층이 컨텍스트 이식 가능성만 다룬다면, 실패할 가능성이 높습니다. 그러나 만약 다자간 상호 불신 시나리오에서 경제 활동의 검증 가능성과 평판의


