📮 10배 강력해졌는데 비용은 1/10? 😮

#Qwen3-Next #GPT-5-Codex I 님, 모두레터가 왔어요😺🌿

2025. 9. 21.

함께 공유하고 성장하는 연구 문화를 전파해요

2025년 9월 22일 모두레터

친구랑 같이읽기 I 웹에서 보기 I 지난 레터 보기

Image created with GPT-5

님, 알리바바와 OpenAI가 각자의 방식으로 AI 효율성을 극대화한 모델을 공개했어요.

Qwen3-Next는 80B 중 3B만 써도 Gemini 2.5 Flash를 능가했고, OpenAI의 GPT-5-Codex는 코딩 작업에 특화되어 더 높은 정확도를 보여줬어요. 더 적은 리소스로 더 나은 성능을 내는 방향으로 AI가 진화하고 있네요! ⚡️

이번 주 AI 소식:

Qwen3-Next, 80B 모델인데 3B만 활성화되는 초효율 AI 등장
OpenAI, 에이전틱 코딩 특화 'GPT-5-Codex' 공개

Qwen3-Next, 80B 모델인데 3B만 활성화되는 초효율 AI 등장

©Qwen

Qwen팀이 MoE(Mixture of Experts) 아키텍처를 혁신적으로 개선한 Qwen3-Next를 공개했습니다. 전체 파라미터는 80B지만 한 번에 활성화되는 파라미터는 3B(3.7%) 이하라는 놀라운 효율성을 보여주고 있어요. 이 모델에는 하이브리드 어텐션 메커니즘과 고도로 희소(sparse)한 MoE 구조, 안정적인 학습을 위한 최적화 기법, 그리고 다중 토큰 예측으로 추론 속도를 높이는 기능이 적용되었습니다.

성능도 인상적인데요. 기존 Qwen3-32B보다 10% 미만의 훈련 비용으로 더 나은 성능을 달성했고, Gemini-2.5-Flash-Thinking을 능가하는 벤치마크 결과를 보여줬어요. 특히 256K 토큰까지 처리 가능하고 32K 이상 긴 컨텍스트에서는 10배 이상 빠른 추론 속도를 자랑합니다. Hugging Face에 오픈소스로 공개되어 누구나 사용할 수 있습니다.

Qwen3-Next: Towards Ultimate Training & Inference Efficiency

OpenAI, 에이전틱 코딩 특화 'GPT-5-Codex' 공개

©OpenAI

OpenAI가 에이전틱(agentic) 코딩에 특화된 GPT-5-Codex를 출시했어요. 이 모델은 실제 소프트웨어 엔지니어링 작업에 중점을 두고 학습되어, 개발자들의 실무를 직접적으로 지원할 수 있도록 설계되었습니다. GPT-5-Codex의 핵심 특징은 작업의 복잡도에 따라 사고(thinking) 시간을 동적으로 조정할 수 있다는 점입니다. 간단한 대화형 세션에서는 빠르게 응답하고, 복잡한 작업에서는 충분한 시간을 들여 정확한 결과를 제공한다고 해요.