Qwen3-Next, 80B ๋ชจ๋ธ์ธ๋ฐ 3B๋ง ํ์ฑํ๋๋ ์ดํจ์จ AI ๋ฑ์ฅ
Qwenํ์ด MoE(Mixture of Experts) ์ํคํ ์ฒ๋ฅผ ํ์ ์ ์ผ๋ก ๊ฐ์ ํ Qwen3-Next๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ์ ์ฒด ํ๋ผ๋ฏธํฐ๋ 80B์ง๋ง ํ ๋ฒ์ ํ์ฑํ๋๋ ํ๋ผ๋ฏธํฐ๋ 3B(3.7%) ์ดํ๋ผ๋ ๋๋ผ์ด ํจ์จ์ฑ์ ๋ณด์ฌ์ฃผ๊ณ ์์ด์. ์ด ๋ชจ๋ธ์๋ ํ์ด๋ธ๋ฆฌ๋ ์ดํ ์ ๋ฉ์ปค๋์ฆ๊ณผ ๊ณ ๋๋ก ํฌ์(sparse)ํ MoE ๊ตฌ์กฐ, ์์ ์ ์ธ ํ์ต์ ์ํ ์ต์ ํ ๊ธฐ๋ฒ, ๊ทธ๋ฆฌ๊ณ ๋ค์ค ํ ํฐ ์์ธก์ผ๋ก ์ถ๋ก ์๋๋ฅผ ๋์ด๋ ๊ธฐ๋ฅ์ด ์ ์ฉ๋์์ต๋๋ค.
์ฑ๋ฅ๋ ์ธ์์ ์ธ๋ฐ์. ๊ธฐ์กด Qwen3-32B๋ณด๋ค 10% ๋ฏธ๋ง์ ํ๋ จ ๋น์ฉ์ผ๋ก ๋ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ , Gemini-2.5-Flash-Thinking์ ๋ฅ๊ฐํ๋ ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์คฌ์ด์. ํนํ 256K ํ ํฐ๊น์ง ์ฒ๋ฆฌ ๊ฐ๋ฅํ๊ณ 32K ์ด์ ๊ธด ์ปจํ ์คํธ์์๋ 10๋ฐฐ ์ด์ ๋น ๋ฅธ ์ถ๋ก ์๋๋ฅผ ์๋ํฉ๋๋ค. Hugging Face์ ์คํ์์ค๋ก ๊ณต๊ฐ๋์ด ๋๊ตฌ๋ ์ฌ์ฉํ ์ ์์ต๋๋ค.
OpenAI๊ฐ ์์ด์ ํฑ(agentic) ์ฝ๋ฉ์ ํนํ๋ GPT-5-Codex๋ฅผ ์ถ์ํ์ด์. ์ด ๋ชจ๋ธ์ ์ค์ ์ํํธ์จ์ด ์์ง๋์ด๋ง ์์ ์ ์ค์ ์ ๋๊ณ ํ์ต๋์ด, ๊ฐ๋ฐ์๋ค์ ์ค๋ฌด๋ฅผ ์ง์ ์ ์ผ๋ก ์ง์ํ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค. GPT-5-Codex์ ํต์ฌ ํน์ง์ ์์ ์ ๋ณต์ก๋์ ๋ฐ๋ผ ์ฌ๊ณ (thinking) ์๊ฐ์ ๋์ ์ผ๋ก ์กฐ์ ํ ์ ์๋ค๋ ์ ์ ๋๋ค. ๊ฐ๋จํ ๋ํํ ์ธ์ ์์๋ ๋น ๋ฅด๊ฒ ์๋ตํ๊ณ , ๋ณต์กํ ์์ ์์๋ ์ถฉ๋ถํ ์๊ฐ์ ๋ค์ฌ ์ ํํ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ๋ค๊ณ ํด์.
์ด๋ฆฐ ์ธ๋ฏธ๋
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ ๐ ๐จ ๋ด์ค๋ ํฐ โฎ ๐ฒ๐๐๐ผ๐พ ๐ค๐ข๐ค๐ค