Tech / AI / 자동차 최신 정보

  • Home
  • IT | AI
  • 한국 개발자가 만든 오픈소스 Ouroboros — AI 코딩 벤치마크 1위

한국 개발자가 만든 오픈소스 Ouroboros — AI 코딩 벤치마크 1위

📌 핵심 요약: 한국 개발자가 만든 오픈소스 Ouroboros가 AI-assisted DES(이산 이벤트 시뮬레이션) 벤치마크에서 전체 1위를 기록했습니다. 같은 Claude Max를 사용했는데도 Claude 자체의 plan mode보다 더 높은 점수로. 모델이 아니라 워크플로가 결과를 바꿀 수 있다는 것을 증명한 사례입니다. Search Engine Land


AI 코딩 툴을 쓰다 보면 이런 경험을 합니다. 프롬프트를 입력했는데 AI가 엉뚱한 방향으로 달려가거나, 중간에 막히면 그냥 멈추거나, 같은 말을 반복해서 해야 겨우 원하는 결과가 나옵니다.

문제는 AI의 능력이 아닐 수 있습니다. AI 코딩이 실패하는 가장 큰 이유는 출력이 아니라 입력에 있습니다. 병목은 AI의 능력이 아니라 인간의 명확성입니다. cryptobriefing

Ouroboros는 그 전제에서 출발합니다.


Ouroboros란 무엇인가

Ouroboros는 AI 코딩을 위한 에이전트 OS입니다. 비결정론적 에이전트 작업을 재현 가능하고, 관찰 가능하며, 정책에 구속된 실행 계약으로 전환하는 로컬 우선 런타임 레이어입니다. cryptobriefing

쉽게 말하면 이렇습니다. Claude Code, Codex CLI 같은 AI 코딩 런타임과 개발자 사이에 앉아서, 즉흥적인 프롬프팅을 구조화된 사양 우선 워크플로로 바꿔주는 미들웨어입니다.

이름의 유래도 의미심장합니다. 우로보로스(Ouroboros)는 자신의 꼬리를 먹는 뱀으로, 자기 참조와 순환을 상징합니다. 뱀이 한 바퀴를 완성할 때마다, 이전보다 더 많이 알게 됩니다. 실행할 때마다 사양이 정제되고, 결과가 다음 루프의 입력이 되는 구조입니다. cryptobriefing


벤치마크 1위 — 같은 모델, 다른 결과

이 벤치마크는 단순한 코딩 테스트가 아닙니다. AI-assisted discrete-event simulation 평가로, 단순히 코드를 짜는 게 아니라 실제 시스템을 이해하고, 모델링하고, 시뮬레이션을 실행하고, 사람이 읽을 수 있는 결과물까지 만들어내야 합니다. “얼마나 빨리 코드를 쓰느냐”가 아니라 “얼마나 복잡한 문제를 끝까지 풀어내느냐”를 봅니다. Search Engine Land

과제는 광산 운송 시스템이었습니다. 광산 트럭, 적재 지점, 하역 지점, 경로, 대기열. 이 구조를 먼저 이해해야 합니다. Search Engine Land

결과는 놀라웠습니다. Ouroboros는 Claude Code 안에서 ooo 워크플로로 실행됐고, Claude 자체의 plan mode보다 더 높은 점수를 기록했습니다. 같은 모델, 같은 환경이었는데 결과가 달랐습니다. Search Engine Land

실패 복구 능력도 증명됐습니다. 실행 도중 MCP 서버가 실패했습니다. 보통은 여기서 멈추거나 오류를 냅니다. Ouroboros는 달랐습니다. 스킬 기반 접근으로 자동으로 폴백했고, 결과는 유지됐습니다. 실패 복구가 설계에 내장되어 있었기 때문입니다. Search Engine Land

흥미로운 비교 데이터도 나왔습니다. fat skills 기반 접근, 즉 superpowers 같은 방식은 기본 plan mode보다 오히려 낮은 성능을 보였습니다. Ouroboros처럼 구조화된 워크플로가 핵심이었습니다. Search Engine Land


ooo 워크플로 — 5단계 순환 구조

Ouroboros의 핵심은 interview → crystallize → execute → evaluate → evolve의 5단계 워크플로입니다.

인터뷰 단계에서 소크라테스식 질문이 12개의 숨겨진 가정을 드러내고, 씨드(seed) 단계에서 답변을 불변 사양으로 결정화합니다(모호성: 0.15). 실행 단계에서 더블 다이아몬드 분해를 통해 실행하고, 평가 단계에서 기계적 → 의미론적 → 합의의 3단계 검증을 거칩니다. cryptobriefing

가장 독특한 부분은 첫 단계, 인터뷰입니다. 코드를 바로 작성하는 대신 AI가 먼저 질문합니다.

소크라테스가 2,500년 전에 물었던 것처럼 — “당신이 진정으로 아는 것은 무엇인가?” Ouroboros는 이 질문을 진화하는 AI 워크플로 엔진으로 전환합니다. 코드를 쓰기 전에 숨겨진 가정을 노출함으로써 AI 코딩의 실패를 수정합니다. MSN

“task CLI를 만들어줘”라고 하면 AI가 바로 코드를 짜는 게 아니라 이렇게 묻습니다. “task란 무엇인가? priority란 무엇인가?” 이 온톨로지 질문에 답하면 — 삭제 가능한가 아니면 아카이브 가능한가? 혼자 쓰는가 팀이 쓰는가? — 재작업의 전체 범주를 제거하게 됩니다. cryptobriefing


9개의 에이전트 — 각자 다른 사고 방식

Ouroboros에는 9개의 에이전트가 있으며 각각 다른 사고 방식을 가집니다. 온디맨드로 로드되며 미리 로드되지 않습니다. 소크라테스식 인터뷰어처럼 질문만 하는 에이전트, 실행에 집중하는 에이전트, 막혔을 때 측면 사고로 돌파구를 찾는 에이전트까지 — 상황에 따라 적합한 에이전트가 자동으로 투입됩니다. cryptobriefing

코드 구조도 탄탄합니다. 인터뷰 및 씨드 생성(bigbang), PAL 라우터를 통한 모델 티어 선택(routing), 더블 다이아몬드 실행(execution), 스태그네이션 감지 및 측면 사고(resilience), 3단계 평가 파이프라인(evaluation)이 레이어별로 분리된 구조입니다. Claude


설치와 지원 런타임

Ouroboros는 Claude Code, Codex CLI, OpenCode, Hermes와 함께 작동합니다. 인스톨러가 Claude Code, Codex CLI, Hermes CLI를 자동으로 감지하고 MCP 서버를 등록합니다. CNBC

설치는 한 줄입니다.

bash

curl -fsSL https://raw.githubusercontent.com/Q00/ouroboros/main/scripts/install.sh | bash

pip로 설치할 수도 있습니다.

bash

pip install ouroboros-ai # 기본
pip install ouroboros-ai[claude] # + Claude Code 의존성
pip install ouroboros-ai[mcp] # + MCP 서버/클라이언트
pip install ouroboros-ai[all] # 전체

Python 3.12 이상이 필요합니다.

팀 협업 환경에서도 쓸 수 있습니다. Ouroboros는 OpenClaw 통합을 통해 Slack, Discord 같은 채팅 플랫폼 안에서 ooo 커맨드를 직접 실행할 수 있게 됐습니다. CNBC


최신 업데이트 — MCP 브릿지와 ooo publish

최근 릴리스에서도 활발한 업데이트가 이어지고 있습니다.

MCP 브릿지 기능이 추가됐습니다. ~/.ouroboros/mcp_servers.yaml에서 업스트림 MCP 서버 구성을 자동으로 검색하고, ExecuteSeedHandler를 통해 mcp_manager를 주입하며, ooo evolve에서 외부 툴과 함께 사용할 수 있습니다. 또한 ooo publish 스킬이 추가되어 씨드 사양을 구조화된 GitHub 이슈로 변환할 수 있습니다. letsdatascience


왜 주목해야 하나 — 모델이 아닌 워크플로의 힘

Ouroboros가 던지는 핵심 메시지는 이것입니다.

같은 Claude Max를 쓰는데 결과가 달랐습니다. 이 사실은 AI 코딩 툴에 대한 기존의 생각을 뒤흔듭니다. 더 좋은 결과를 위해 반드시 더 좋은 모델이 필요한 것이 아닙니다. 모델을 어떻게 사용하느냐, 즉 워크플로가 결과를 결정할 수 있습니다. Search Engine Land

Ouroboros 이전에는 “어떻게 프롬프트를 잘 쓸까”가 고민이었다면, 이제는 “어떻게 사양을 명확히 정의할까”가 질문이 됩니다. AI에게 무엇을 만들어달라고 하기 전에, 무엇을 만들어야 하는지를 먼저 정의하는 것 — 그것이 Ouroboros의 철학입니다.

프로젝트는 github.com/Q00/ouroboros에서 MIT 라이선스로 공개되어 있습니다.

이 글은 2026년 5월 2일 기준으로 작성됐습니다. Ouroboros는 활발히 개발 중인 프로젝트로, 최신 기능과 변경 사항은 GitHub 공식 저장소에서 확인하세요.

#Ouroboros #Q00 #오픈소스AI #에이전트OS #ClaudeCode #ooo워크플로 #한국개발자 #AI코딩 #DES벤치마크


Releated Posts

OpenAI, 스마트폰 만든다 — 앱 대신 AI 에이전트가 다한다

📌 핵심 요약: 애플 하드웨어 계획으로 유명한 업계 애널리스트 밍치 궈가 OpenAI가 MediaTek, Qualcomm과 협력해 스마트폰 칩을 개발…

ByByderella sohn 4월 30, 2026

한국어로 Claude에게 명령하면 토큰이 2~3배 더 든다?

Claude에 같은 내용을 한국어로 입력하면 영어보다 토큰이 2~3배 더 소모됩니다. 요금도, 컨텍스트 한도도 모두 토큰 기준입니다. 한국어 사용자는…

ByByderella sohn 4월 30, 2026

GPT-5.5 출시 — 덜 안내해도 끝까지 완수하는 OpenAI의 새 기준

📌 핵심 요약: OpenAI가 2026년 4월 23일, 가장 스마트하고 직관적인 모델이라고 밝힌 GPT-5.5를 공개했습니다. 코드명은 ‘Spud’. GPT-5.4 출시로부터…

ByByderella sohn 4월 29, 2026

OpenAI Codex 대규모 업데이트 — 코딩 툴을 넘어 맥 전체를 제어

📌 핵심 요약: OpenAI가 2026년 4월 16일 Codex의 대규모 업데이트를 공개했습니다. 매주 300만 명 이상의 개발자가 사용하는 Codex가…

ByByderella sohn 4월 21, 2026

댓글 남기기

Sohnderella에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기