2026-04-15. 노모유 인디 개발자 데일리 (제333호)
📰 뉴스
Sora가 멈춘 뒤에도 세계 모델은 계속될 수 있을까?
Sora가 나왔을 때, 기술 업계 전체는 “세계 모델이 완성됐다”고 외쳤습니다.
OpenAI가 공개한 수십 초짜리 영상 몇 개는 픽셀이 너무 사실적이어서 진짜처럼 보였습니다. 모두가 전체 세계를 시뮬레이션하려면 몇 자릿수의 계산량만 더 쌓으면 된다고 생각했습니다.
하지만 NLP의 거장 Chris Manning과 그가 세운 Moon Lake는 이 열광의 시대에 큰 따귀를 날렸습니다.
영상 생성 모델은 애초에 세계 모델이 아닙니다.
이것은 학술 논쟁이 아닙니다. AI의 다음 10년을 둘러싼 노선 싸움입니다.
아름다운 픽셀, 텅 빈 두뇌
Sora는 볼링공이 핀을 쓰러뜨리는 완벽한 영상을 만들 수 있습니다. 하지만 핀이 왜 쓰러지는지는 모릅니다.
공의 질량도, 중력가속도도, 충돌의 물리 법칙도, 다른 각도에서 공을 던지면 결과가 어떻게 달라질지도 모릅니다. 인터넷에 있는 수많은 볼링 영상의 픽셀 분포를 기억하고, 통계적 방법으로 그럴듯해 보이는 장면을 이어 붙였을 뿐입니다.
이는 문제집의 모든 답을 외웠지만 공식 자체는 이해하지 못한 학생과 같습니다. 시험에 원문제가 나오면 만점을 받을 수 있지만, 문제가 조금만 바뀌면 완전히 막혀 버립니다.
그래서 순수 픽셀 노선의 모든 “세계 모델”은 수십 초 정도의 일관성만 유지할 수 있습니다. 그 시간을 넘으면 물체가 갑자기 사라지거나, 서로를 통과하거나, 이상한 형태로 변합니다. 이들은 “세계가 어떤 모습인지”에 대한 추상 개념이 전혀 없습니다. 그저 프레임마다 다음 픽셀이 무슨 색이어야 하는지 예측할 뿐입니다.
진짜 세계 모델은 픽셀이 아니라 결과를 예측합니다.
컵을 집어 들면 손을 놓는 순간 바닥에 떨어져 깨질 것을 압니다. 문을 열면 문 뒤에 무엇이 있을 수 있는지 압니다. 도로를 걸을 때는 마주 오는 차를 피해야 한다는 것을 압니다. 이것은 수많은 영상에서 배운 것이 아니라, 세계가 작동하는 규칙을 이해하기 때문입니다.
이것이 세계 모델의 핵심입니다. 인과 추론, 행동 조건, 장기 일관성입니다. 그리고 이것들은 순수 픽셀 노선이 영원히 해결하지 못할 문제입니다.
구조는 규모가 아니다
Moon Lake는 AI의 다음 10년에서 가장 중요한 주장일지도 모르는 말을 내놓았습니다. 구조는 규모가 아니다.
지난 5년 동안 AI 업계 전체는 “씁쓸한 교훈”에 세뇌되어 있었습니다. 데이터와 계산력을 쌓기만 하면 어떤 문제든 해결된다는 믿음입니다. 언어도 그랬고, 이미지도 그랬으니, 세계 모델도 당연히 그럴 것이라고 여겼습니다.
하지만 Chris Manning은 모두가 놓친 사실을 지적합니다. 언어 자체는 고도로 추상화된 기호 시스템입니다. 모든 단어는 하나의 개념을 나타냅니다. 대형 언어 모델은 사실 인류가 수천 년 동안 쌓아 온 추상적 사고 위에 서 있습니다.
반면 픽셀은 가장 낮은 수준의 원시 데이터입니다. 픽셀에서 세계에 대한 추상적 이해로 바로 도약하려면 계산력을 몇 자릿수 더 늘리는 정도가 아니라 다섯 자릿수가 필요합니다. 경제적으로 불가능하고 시간적으로도 받아들일 수 없습니다.
인간도 세계를 그렇게 이해하지 않습니다.
신경과학은 우리의 눈이 매초 수십억 비트의 시각 정보를 받지만, 뇌는 그중 극히 작은 일부만 처리한다고 말합니다. 우리는 세계 전체를 픽셀 단위로 스캔하지 않습니다. 세계에 대한 추상적 의미 모델을 구축합니다. 우리는 책상이 단단하고, 물이 젖어 있으며, 불이 뜨겁다는 것을 압니다. 이런 추상 개념이 복잡한 세계에서 생존하게 해줍니다.
Moon Lake가 가는 길이 바로 이것입니다. 그들은 픽셀에서 모든 것을 직접 생성하려 하지 않습니다. 먼저 논리, 물리, 인과, 일관성을 처리하는 기호화된 세계 상태 모델을 만들고, 그다음 독립적인 렌더링 모델로 그것을 아름다운 픽셀로 바꿉니다.
이것은 천재적인 아키텍처 설계입니다. “세계가 무엇인가”와 “세계가 어떻게 보이는가”를 완전히 분리합니다. 전자는 게임의 플레이 방식, 로봇의 행동, 에이전트의 추론 능력을 결정하고, 후자는 시각 효과만 담당합니다.
언제든 렌더러를 바꿔 같은 게임 세계를 사이버펑크 스타일, 지브리 스타일, 사실적 스타일로 바꿀 수 있습니다. 하지만 세계의 하부 논리는 절대 변하지 않습니다.
노선 싸움은 이미 시작됐다
지금 AI 업계에는 세계 모델을 둘러싼 완전히 다른 두 노선이 있습니다.
하나는 OpenAI와 대부분의 회사가 가는 순수 픽셀 노선입니다. 무한한 데이터와 무한한 계산력으로 세계 시뮬레이션 문제를 힘으로 밀어붙이는 방식입니다.
다른 하나는 Moon Lake가 가는 구조 우선 노선입니다. 인간이 이미 가진 지식과 도구를 활용해 효율적인 추상 세계 모델을 구축하는 방식입니다.
많은 사람은 후자가 “씁쓸한 교훈”에 반대하고 역사를 거꾸로 돌리는 것이라고 말합니다. 하지만 Chris Manning은 분명히 말합니다. 우리는 규모에 반대하는 것이 아니라, 어리석은 규모에 반대합니다.
같은 목표에 도달하는 두 방법이 있고, 하나는 A100 1만 장이 필요하고 다른 하나는 100장만 필요하다면, 후자가 더 올바른 선택임이 분명합니다. 게다가 순수 픽셀 노선은 그 목표에 아예 도달하지 못할 수도 있습니다.
물론 지금 누가 이길지 말하기에는 너무 이릅니다. 하지만 한 가지는 확실합니다. 예쁜 영상만 생성하는 회사는 영원히 진짜 세계 모델을 만들 수 없습니다.
세계 모델의 궁극적인 목표는 멋진 영상을 보여주는 것이 아니라, 그 세계 안에서 행동하고, 탐험하고, 창조하고, 배우게 하는 것이기 때문입니다.

🖥️ 소프트웨어
Tamagrow
Tamagrow는 GitHub push를 자동으로 소셜미디어 초안으로 바꿔 주는 개발자 도구로, LinkedIn, X 등 플랫폼을 지원합니다.

Nebria
Nebria는 시각장애 및 저시력 사용자를 위한 별하늘 앱으로, 촉각 모스 부호를 통해 별 이름과 빛의 이동 시간 정보를 전달하며 야간 촬영 모드를 지원합니다.

sharpscreen
sharpscreen은 AI 기반 이력서 선별 도구로, 문맥을 이해하고 경험의 깊이와 직무 적합도를 평가하며, 99.6% 정확도를 주장하고 1000회의 무료 평가를 제공합니다.

MapiLeads
MapiLeads는 지역 잠재 고객 발굴 및 영업 자동화 도구로, 업체 정보를 자동 수집하고 개인화된 콜드 이메일을 생성합니다.

PostPeer
PostPeer는 소셜미디어 게시를 위한 콘텐츠 자동화 API 도구로, 인디 개발자가 만들었으며 콘텐츠 워크플로와 자동 게시를 지원합니다.

🎮 게임
Gladiator Command
Gladiator Command는 전략 인디 게임으로, 현재 출시되었습니다.

Commitment
Commitment는 2인 인디 스튜디오가 Steam에 출시한 첫 게임으로, 서사와 협동 플레이를 중심으로 하며 현재 출시되었습니다.

🌐 웹사이트
HistoryLens
HistoryLens는 지역별 역사 사건을 나란히 비교해 볼 수 있는 웹 앱으로, 유럽, 아시아, 아메리카, 아프리카 4개 지역의 역사 비교를 지원합니다.

cvoice
cvoice는 캐릭터화된 텍스트 음성 변환을 제공하는 온라인 서비스로, 영구 무료이며 공개 API와 다양한 캐릭터 음색을 지원합니다.

Liaoliaokan
Liaoliaokan은 실제 면접 경험을 기반으로 한 AI 모의 면접 사이트로, 음성 상호작용과 오답 기록을 지원해 구직자의 면접 역량 향상을 돕습니다.

Yumoo
Yumoo는 음식 사진을 지브리 스타일 일러스트로 바꾸는 웹사이트로, 식사 추억을 낮은 비용으로 기록하는 데 사용됩니다.

✍️ 안내
데일리 관련 정보:
웹사이트: https://www.nomoyu.com/
RSS: https://www.nomoyu.com/rss/rss.xml
위챗 공식 계정: 明航的AI副业
편하게 소통해 주세요
전체 링크는 웹사이트에서 확인할 수 있습니다.