์ธ๊ณต์ง๋ฅ ๋ถ์ผ ์ต๊ณ ๊ถ์์ ํํ ์ค ํ๋๋ก ์๊ผฝํ๋ 'NeurIPS(Neural Information Processing Systems) 2024'๊ฐ 12์ 10์ผ๋ถํฐ 15์ผ๊น์ง ์บ๋๋ค ๋ฐด์ฟ ๋ฒ์์ ์ด๋ ธ์ต๋๋ค. ์ด๋ฒ ํํ์์๋ ์ ํต์ ์ธ ์ฐ๊ตฌ ์ฃผ์ ์ธ ๊ฐ์ฒด ํ์ง์ ์ธ๊ทธ๋ฉํ ์ด์ ๋ถํฐ, ์ต๊ทผ ๊ฐ๊ด๋ฐ๊ณ ์๋ ๋ํจ์ (diffusion) ๋ชจ๋ธ๊ณผ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM), ๋ฉํฐ๋ชจ๋ฌ(multimodal) LLM๊น์ง ๋ค์ํ ์ฃผ์ ์ ๋ ผ๋ฌธ๋ค์ด ๋ฐํ๋์์ต๋๋ค.
ํนํ, ์ฌํด์ ๋ฒ ์คํธ ํ์ดํผ๋ก ๋ ํธ์ ๋ ผ๋ฌธ์ด ์ ์ ๋๋ฉฐ ์ฃผ๋ชฉ์ ๋ฐ์๋๋ฐ์. ์ฒซ ๋ฒ์งธ๋ ์๊ฐ์ ์๋ํ๊ท ๋ชจ๋ธ๋ง ๊ด๋ จ ๋ ผ๋ฌธ์ผ๋ก, ์ด๋ฏธ์ง ์์ฑ ๋ชจ๋ธ์์ ๋๋ฆฌ ํ์ฉ๋๊ณ ์๋ ๋ํจ์ ํธ๋์คํฌ๋จธ๋ฅผ ๋์ฒดํ ์ ์๋ ์๋ก์ด ์ ๊ทผ๋ฒ์ ์ ์ํฉ๋๋ค. ๋ ๋ฒ์งธ๋ ์๋ ๋ฏธ๋ถ(auto differentiation) ๊ธฐ๋ฒ์ ํ์ฉํด ๊ณ ์ฐจ์ ๋ฐ ๊ณ ์ฐจ ๋ฏธ๋ถ ์ฐ์ฐ์๋ฅผ ์์ค ํจ์๋ก ํฌํจ์ํค๋ ์ ๊ฒฝ๋ง ์ต์ ํ ๋ฐฉ๋ฒ์ ๋ค๋ฃจ๊ณ ์์ต๋๋ค.
์ฌํด ์ด๋ถํฐ ์ฃผ๋ชฉ๋ฐ์๋ ์คํAI์ ๋น๋์ค ์์ฑ ๋ชจ๋ธ '์๋ผ(Sora)'๊ฐ ๋๋์ด ๊ณต๊ฐ๋์์ต๋๋ค. ์๋ผ๋ ๋ณ๋์ ๊ณต์ ํํ์ด์ง์์ ์ฌ์ฉํด ๋ณผ ์ ์๋๋ฐ์. ํธ๋ํฝ ์ํฉ์ ๋ฐ๋ผ ์ ๊ท ์คํAI ๊ณ์ ๋ก๊ทธ์ธ์ด ์ผ์์ ์ผ๋ก ์ ํ๋ ์ ์๋ค๊ณ ํฉ๋๋ค.
์๋ผ๋ ์ต๋ 1080p ํด์๋๋ก ์ต๋ 20์ด ๊ธธ์ด์ ๋น๋์ค๋ฅผ ์์ฑํ ์ ์๋ ๊ฐ๋ ฅํ ๊ธฐ๋ฅ์ ์ ๊ณตํ๊ณ ์. ์ฌ์ฉ์๋ ์์ ์ ์์ ์ ํ์ฉํ๊ฑฐ๋, ํ ์คํธ ํ๋กฌํํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ ํ ์๋ก์ด ๋น๋์ค๋ฅผ ์ ์ํ ์ ์์ต๋๋ค. ์ฑGPT ํ๋ฌ์ค ์ฌ์ฉ์๋ ๋งค๋ฌ 480p ํด์๋์ ๋น๋์ค๋ฅผ 50๊ฐ๊น์ง ์ถ๊ฐ ๋น์ฉ ์์ด ์์ฑํ ์ ์๊ณ ์. ํ๋ก ์๊ธ์ ๋ฅผ ์ด์ฉํ๋ฉด 10๋ฐฐ์ ์ฌ์ฉ๋๊ณผ ๋ ๋์ ํด์๋ ๋ฐ ๊ธด ์์ ์์ฑ ์ต์ ์ ํ์ฉํ ์ ์์ต๋๋ค. ์คํAI๋ ๋ด๋ ์ด ๋ค์ํ ์ฌ์ฉ์ ์๊ตฌ๋ฅผ ๋ฐ์ํ ๋ง์ถคํ ์๊ธ์ ๋ ์ ๋ณด์ผ ๊ณํ์ด๋ผ๊ณ ํ๋ค์!
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ