Muse Spark: 개인 초지능을 향한 확장

Muse Spark: Scaling towards personal superintelligence

📅 2026-04-08 📰 Hacker News (Top) ⬆ 233

요약

Meta는 새로운 Muse Spark 모델을 발표했으며, 이는 도구 사용, 시각적 사고의 연쇄, 멀티에이전트 오케스트레이션을 지원하는 네이티브 멀티모달 추론 모델이다. Contemplating 모드는 여러 에이전트가 병렬로 추론하도록 오케스트레이션하여 Gemini Deep Think, GPT-4o와 경쟁 수준의 성능을 달성한다. 의료 협력을 통해 건강 관련 추론 능력을 강화했으며, 프리트레이닝, 강화학습, 테스트 타임 추론의 세 축으로 확장 가능성을 검증했다.

핵심 포인트

멀티모달 지각: 시각 정보를 여러 도메인과 도구에 걸쳐 통합하여 시각적 STEM 질문, 개체 인식, 위치 파악에 강한 성능을 보인다. 이를 통해 집안일 수리 튜토리얼, 미니게임 생성 등 상호작용 경험을 가능하게 한다.
Contemplating 모드: 여러 에이전트가 병렬로 추론하는 방식으로 Humanity's Last Exam에서 58%, FrontierScience Research에서 38%의 성능을 달성하여 극단적 추론 모드와 경쟁 수준을 보인다.
의료 추론: 1,000명 이상의 의사와 협력하여 수집한 학습 데이터로 영양 정보, 운동 중 활성화되는 근육 등 맞춤형 건강 정보를 대화형으로 표시할 수 있다.
프리트레이닝 효율: 지난 9개월간 재구축한 프리트레이닝 스택으로 이전 Llama 4 Maverick 대비 같은 성능 도달에 필요한 계산량을 10배 이상 줄였다. 이는 모델 아키텍처, 최적화, 데이터 큐레이션의 종합적 개선의 결과이다.
확장 축 검증: 프리트레이닝, 강화학습(RLHF), 테스트 타임 추론의 세 축에서 성능이 예측 가능하고 효율적으로 확장됨을 입증했다. 더 큰 모델들이 개발 중이며, 현재 스택이 확장에 적합함을 보여준다.
개인화 초지능 방향: 사용자의 주변 환경을 분석하고 웰니스를 지원하는 개인 맞춤형 AI 어시스턴트로의 진화를 목표로 설계되었다.

왜 중요한가

Meta의 멀티모달 추론 모델과 확장 방식이 개인화된 AI 어시스턴트의 새로운 기준을 제시하며, 프리트레이닝 효율 개선은 산업 전반의 모델 학습 비용 감소에 영향을 미칠 수 있다.

📄 전문 번역

Meta의 Muse Spark 공개: 개인용 슈퍼인텔리전스로 향하는 첫 발걸음

Meta 슈퍼인텔리전스 랩이 새로운 모델 시리즈 'Muse'의 첫 번째 모델인 Muse Spark를 공개했습니다. 시각과 텍스트를 함께 이해하는 멀티모달 추론 모델이면서, 도구 사용, 시각적 사고 과정, 다중 에이전트 조율 등을 지원하는 게 특징이죠.

Muse Spark는 우리가 추진 중인 확장 전략의 첫 단계입니다. 더 큰 모델을 개발할 수 있도록 연구부터 모델 학습, 인프라(Hyperion 데이터센터 포함) 전반에 걸쳐 전략적 투자를 하고 있거든요.

오늘은 Muse Spark의 새로운 기능과 실제 활용 사례를 먼저 살펴본 다음, 우리가 개인용 슈퍼인텔리전스에 어떻게 접근하고 있는지 기술적 배경까지 소개하겠습니다.

Muse Spark의 핵심 기능

Muse Spark는 멀티모달 인식, 추론, 건강 관련 작업 등에서 경쟁력 있는 성능을 보여줍니다. 장기 자동화 시스템이나 코딩 워크플로우 같은 분야는 계속 개선 중이지만, 현재 우리의 스택이 효과적으로 확장되고 있다는 것을 여러 결과가 증명하고 있어요.

특히 새롭게 추가한 Contemplating 모드는 여러 에이전트가 병렬로 추론하도록 조율합니다. 덕분에 Gemini Deep Think나 GPT Pro 같은 고급 추론 모드와 경쟁할 수 있게 됐죠. Contemplating 모드로는 'Humanity's Last Exam'에서 58%, 'FrontierScience Research'에서 38%의 성능을 달성했습니다.

Muse Spark는 지금 바로 meta.ai와 Meta AI 앱에서 사용할 수 있고, Contemplating 모드는 곧 점진적으로 롤아웃될 예정입니다.

개인용 슈퍼인텔리전스란 무엇인가

우리의 궁극의 목표는 당신의 세계를 이해하는 개인용 슈퍼인텔리전스를 만드는 것입니다. 주변 환경을 분석하는 것부터 건강 관리를 돕는 것까지, Muse Spark의 고급 추론 능력이 이런 개인화된 경험을 가능하게 하거든요.

멀티모달 기능

Muse Spark는 처음부터 시각 정보를 여러 분야와 도구 전반에 통합하도록 설계됐습니다. 시각 STEM 문제, 개체 인식, 위치 파악 등에서 뛰어난 성능을 발휘하는데요, 이런 기능들이 모여서 재미있는 미니게임 만들기나 가전제품 고장 수리할 때 동적 주석으로 안내하는 식의 상호작용형 경험을 만들 수 있습니다.

활용 사례:

프롬프트: 이것을 웹에서 플레이할 수 있는 스도쿠 게임으로 만들어 줄 수 있을까?

프롬프트: 커피 머신과 그라인더의 핵심 부품을 파악하고, 라떼를 만드는 과정을 간단한 웹페이지 튜토리얼로 만들어 줘. 각 단계 위에 마우스를 올리면 관련 부품이 강조되도록 해 줘.

건강 관련 기능

개인용 슈퍼인텔리전스의 주요 활용 분야 중 하나가 바로 건강입니다. Muse Spark의 건강 추론 능력을 높이기 위해 1,000명 이상의 의사와 협력해서 학습 데이터를 구성했거든요. 덕분에 더 정확하고 포괄적인 답변을 줄 수 있게 됐습니다.

음식의 영양 정보나 운동 중 활성화되는 근육 같은 정보를 시각적으로 풀어서 설명할 수도 있어요.

활용 사례:

프롬프트: 나는 페스카테리언이고 콜레스테롤이 높아. 추천 음식에는 초록 점, 
추천하지 않는 음식에는 빨간 점을 찍어 줘. 점이 겹치지 않게 하고 위치도 
정확하게 해 줘. 점 위에 마우스를 올리면 개인화된 설명과 
"건강 점수"(10점 만점), 칼로리, 탄수화물, 단백질, 지방을 보여 줘.

프롬프트: 두 이미지 모두에서 어떤 근육이 늘어나는지, 난이도는 어느 정도인지 
보여 줘. 점 위에 마우스를 올리면 근육군에 대해 더 자세히 설명하고 
자세를 개선하는 방법을 알려 줘. 나는 요가를 더 잘하고 싶어. 
파트너와 나란히 비교하고, 우리 둘 다 1부터 10까지로 평가해 줘.

기술적 확장 전략: 세 가지 축

개인용 슈퍼인텔리전스를 구현하려면 모델의 능력이 예측 가능하고 효율적으로 확장돼야 합니다. 우리는 사전학습(Pretraining), 강화학습(Reinforcement Learning), 테스트 타임 추론(Test-time Reasoning) 이 세 가지 축을 따라 확장 특성을 연구하고 추적하고 있습니다.

1. 사전학습 단계

사전학습은 Muse Spark가 멀티모달 이해, 추론, 코딩 능력 같은 기초를 쌓는 단계입니다. 강화학습과 테스트 타임 컴퓨트가 이 기초 위에서 발휘될 수 있거든요.

지난 9개월간 우리는 사전학습 스택을 완전히 다시 구축했습니다. 모델 아키텍처, 최적화, 데이터 큐레이션 등 여러 분야에 개선을 가했는데요, 이 모든 개선이 모여서 컴퓨트의 각 단위에서 뽑아낼 수 있는 성능을 크게 높였습니다.

우리의 새로운 레시피가 제대로 작동하는지 검증하기 위해 작은 모델들로 스케일링 법칙을 만들고, 특정 성능 수준에 도달하는 데 필요한 학습 FLOPs를 비교했습니다. 결과는 명확했어요. 이전 모델인 Llama 4 Maverick 대비 10배 이상 적은 컴퓨트로 동일한 성능에 도달할 수 있게 됐습니다.

🔗 원문 보기 👍 유용해요