์ค๊ตญ์ AI ๊ธฐ์ ๋ฅ์ํฌ(DeepSeek)๊ฐ ์ญ๋ ์ต๋ ๊ท๋ชจ์ ์คํ์์ค AI ๋ชจ๋ธ '๋ฅ์ํฌ-V3(DeepSeek-V3)'๋ฅผ ๋ฐํํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ์ด 6710์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง๊ณ ์์ผ๋ฉฐ, MoE(Mixture-of-Experts, ์ ๋ฌธ๊ฐ ํผํฉ) ๊ธฐ๋ฒ์ ํ์ฉํด ์ค์ ์ฐ์ฐ์๋ ํ ํฐ๋น 370์ต ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ง ์ฌ์ฉํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. 14์กฐ 8000์ต ๊ฐ์ ํ ํฐ์ผ๋ก ์ฌ์ ํ๋ จ๋์์ผ๋ฉฐ, ์ต๋ 12๋ง 8000 ํ ํฐ์ ์ปจํ ์คํธ ์ฐฝ์ ์ง์ํฉ๋๋ค.
๋ฒค์น๋งํฌ ํ ์คํธ์์๋ '๋ผ๋ง 3.1'์ ๋ฅ๊ฐํ๊ณ , API๋ก๋ง ์ ๊ทผ ๊ฐ๋ฅํ 'GPT-4'์ ๊ฐ์ ๋น๊ณต๊ฐ ๋ชจ๋ธ๊ณผ ๋น๊ตํด๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ํนํ Math-500 ํ ์คํธ์์ 90.2์ ์ ๊ธฐ๋กํ๋ฉฐ 'ํ์'(80์ )์ ํฌ๊ฒ ์์ฐ๋๋ฐ์. ์ด๋ H800 GPU 1๊ฐ๋ก ์ฝ 279๋ง ์๊ฐ, ์ด 557๋ง ๋ฌ๋ฌ(82์ต์)๋ผ๋ ๊ฒฝ์ ์ ์ธ ๋น์ฉ์ผ๋ก ๋ฌ์ฑํ ์ฑ๊ณผ๋ผ๊ณ ํฉ๋๋ค. ํ์ฌ ๋ฅ์ํฌ-V3๋ ์ฝ๋ฉ, ๋ฒ์ญ, ์์ธ์ด ์์ฑ, ์ด๋ฉ์ผ ์์ฑ ๋ฑ ๋ค์ํ ํ ์คํธ ์์ ์ ์ํํ ์ ์๊ณ , ํ๊น ํ์ด์ค์ ๊นํ๋ธ์์ ๋ฐ๋ก ์ฌ์ฉํด ๋ณผ ์ ์๋ค๊ณ ํฉ๋๋ค.
์๋ฆฌ๋ฐ๋ฐ๊ฐ ํ ์คํธ์ ์ด๋ฏธ์ง๋ฅผ ๋์์ ์ดํดํ๋ ๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ 'QVQ'๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ํ์ 2.5(Qwen 2.5) ์๋ฆฌ์ฆ์ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ธ 'ํ์2-VL-72B'๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ฐ๋์๋๋ฐ์. MMMU์ MathVista ๋ฑ 4๊ฐ์ง ์ํ ๊ด๋ จ ๋ฒค์น๋งํฌ ํ ์คํธ์์ ๋๋ผ์ด ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
QVQ๋ 'GPT-4o'์ 'ํด๋ก๋ 3.5 ์๋คํธ(Claude 3.5 Sonnet)' ๊ฐ์ ์ต์ ๋ชจ๋ธ๋ค์ ๋ฐ์ด๋๋ ์ฑ๋ฅ์ ๋ณด์๊ณ ์. ๊ณ ๋๋ ์ถ๋ก ์ ํนํ๋ ์คํAI์ 'o1' ๋ชจ๋ธ์ ๊ทผ์ ํ ์ ์๋ฅผ ๊ธฐ๋กํ๋ค๊ณ ํ๋ค์. ํ์ง๋ง ์์ง ํ๋ฆฌ๋ทฐ ๋จ๊ณ๋ผ์ ์ํ ๋ ผ๋ฆฌ๋ ํ๊ฐ ํ์์ด ๋ฐ์ํ ์ ์์ผ๋ฉฐ, ํ์ฌ๋ ์์ ์ฑ๊ณผ ์ค๋ฆฌ์ ์ธก๋ฉด์์ ์ถ๊ฐ์ ์ธ ๋ณด์์ด ํ์ํ ์ํ๋ผ๊ณ ํฉ๋๋ค.
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ