์๋ก์ด ํ ์ฃผ๊ฐ ์์๋๋ค์๐ฑ.
์ฃผ๋ง ์ฌ์ด ์คํAI๊ฐ ์ฝ๋ฉ AI ์์ด์ ํธ '์ฝ๋ฑ์ค'๋ฅผ ์ถ์ํ์ด์.
๊ฐ๋ฐ์๋ค์ ์์ ๋ฐฉ์์ ๋ณํ๋ฅผ ๊ฐ์ ธ์ฌ ์ด ๋๊ตฌ, ๋๋ ์ด๋ฒ ์ฃผ AI ์์๊ณผ ํจ๊ป ์ดํด๋ณด์ธ์.
๊ทธ๋ผ ์ด๋ฒ์ฃผ๋ ์ฆ๊ฒ๊ฒ, ์์ํ ๊ฒ์! :)
ํ๊น ํ์ด์ค, ๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ ํธ๋ ๋ ๋ถ์ ๋ณด๊ณ ์ ๊ณต๊ฐ
Qwen3, ํ ํฌ๋์ปฌ ๋ฆฌํฌํธ ํตํด ๋ชจ๋ธ ๊ตฌ์กฐ์ ์ฑ๋ฅ ์์ธ ๊ณต๊ฐ
ํ๊น ํ์ด์ค๊ฐ ๋น์ ์ธ์ด ๋ชจ๋ธ(Vision Language Models, ์ด๋ฏธ์ง์ ํ ์คํธ๋ฅผ ํจ๊ป ์ฒ๋ฆฌํ๋ AI)์ ์ต์ ํธ๋ ๋๋ฅผ ์๊ฐํ๋ ๋ณด๊ณ ์๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด ํ ์คํธ ์ค์ฌ AI๋ฅผ ๊ฐ๋ฐํ๋ ํ๋ค๋ ์ต๊ทผ์๋ ๋ค์ํ ํํ์ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฉํฐ๋ชจ๋ฌ(multimodal, ์ฌ๋ฌ ํ์์ ์ ๋ณด ์ฒ๋ฆฌ) ๋ชจ๋ธ ๊ฐ๋ฐ์ ์ฃผ๋ ฅํ๊ณ ์์ต๋๋ค.
์ฃผ๋ชฉํ ๋งํ ๋ฐ์ ์ผ๋ก๋ ๋ชจ๋ ํํ์ ๋ฐ์ดํฐ๋ฅผ ์ํธ ๋ณํํ๋ any-to-any ๋ชจ๋ธ, ์ถ๋ก ๋ฅ๋ ฅ์ด ๊ฐํ๋ ๋ชจ๋ธ, ์์ ํจ์จ์ ๊ฒฝ๋ํ ๋ชจ๋ธ, MoE(์ ๋ฌธ๊ฐ ํผํฉ) ๊ธฐ์ , ๋ก๋ณดํฑ์ค์ ์ฐ๊ณํ VLA(Vision-Language-Action) ๋ชจ๋ธ ๋ฑ์ด ์์ต๋๋ค. ์ด๋ฌํ ๊ธฐ์ ๋ฐ์ ์ AI๊ฐ ์๊ฐ ์ ๋ณด๋ฅผ ์ดํดํ๋ ๊ฒ์ ๋์ด ์ค์ ๋ฌผ๋ฆฌ์ ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ ์ ์๋ ๊ธฐ๋ฐ์ ๋ง๋ จํ๊ณ ์์ต๋๋ค.
Vision Language Models (Better, Faster, Stronger)
์๋ฆฌ๋ฐ๋ฐ์ Qwen3 ์๋ฆฌ์ฆ์ ๋ํ ์์ธํ ๊ธฐ์ ๋ณด๊ณ ์๊ฐ ๊ณต๊ฐ๋์์ต๋๋ค. ์ด ์๋ฆฌ์ฆ๋ MoE ๊ธฐ์ ์ด ์ ์ฉ๋ ๋ชจ๋ธ๊ณผ ์ผ๋ฐ ๋ชจ๋ธ์ ํฌํจํ๋ฉฐ, 0.6B๋ถํฐ 235B๊น์ง ๋ค์ํ ํฌ๊ธฐ๋ก ์ ๊ณต๋ฉ๋๋ค.
์ด์ ๋ฒ์ ์์ 29๊ฐ์๋ ์ง์ ์ธ์ด๊ฐ 119๊ฐ๋ก ๋ํญ ํ์ฅ๋์ด ๋ค๊ตญ์ด ์ฒ๋ฆฌ ์ญ๋์ด ๊ฐํ๋์์ต๋๋ค. ํฅ๋ฏธ๋ก์ด ์ ์ ์ถ๋ก ๋ชจ๋ ์ฌ์ฉ ์ 32B, 8B ๋ฑ ์์ ๋ชจ๋ธ์ด ์คํ๋ ค A22B ๊ฐ์ ํฐ ๋ชจ๋ธ๋ณด๋ค ๊ฒฝ์ ๋ชจ๋ธ ๋๋น ๋์ ์ ์๋ฅผ ๊ธฐ๋กํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด๋ ํจ์จ์ ์ธ ์ํ ์ถ๋ก ๋ชจ๋ธ์ ๋ถ์กฑ์ด๋ผ๋ ์์ฅ ์ํฉ๋ ์ํฅ์ ๋ฏธ์น ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.
์ด๋ฆฐ ์ฐ๊ตฌ์ค
์ด๋ฆฐ ์ธ๋ฏธ๋
์นผํด๋ฅผ ์ํ 1๋ถ AIํ
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ