โ์์ดํ ์ถ์ ๋๋ฃ์ ํจ๊ป ์ผํด๋ณด๋
๊ณ์ํด์ ์์ดํ ์ถ์ ์ ๋ฝ๊ฒ ๋์์ด์โ
"์ค์ ๋ฌด์ธ๊ฐ๋ฅผ ์ง์ ํด ๋ณด๋ฉด์ ๋ฐฐ์ฐ๋(Learning by Doing) ๋ฐฉ์์ด ๊ต์ฅํ ์ธ์ ๊น์์ด์.
์ ๋ ์ฑ ์์ ์์์ ์ด๋ก ์ ๋จผ์ ๊ณต๋ถํ๊ณ ์ดํดํ ๋ค์ ๋ฌด์ธ๊ฐ๋ฅผ ํด ๋ณด๋ ์์ ๊ณต๋ถ๋ฅผ ํด์๋๋ฐ, ์์ดํ ์ ํ๋ก์ ํธ๋ฅผ ํตํด ์ง์ ์์ ๋๋ฝํ๊ฐ๋ฉฐ ๋ฐฐ๋๋ค๊ณ ์๊ณ ์๊ฑฐ๋ ์. ๊ทธ๋ ๊ฒ ์์ ๋๋ฝํ ๊ฐ๋ฉด์ ๋ฐฐ์ด ๋ด์ฉ์ ๋จธ๋ฆฌ๊ฐ ์์์ง๋ผ๋ ์์ ์ฌ์ ํ ๊ธฐ์ตํ๊ฒ ๋๊ฑฐ๋ ์."
AI์ AI์ ๋ง๋๊ฒฐ์ ์๊ฐํ๋ ์ฝํ ์ธ ๊ฐ ํฅ๋ฏธ๋กญ์ต๋๋ค. AI ๋ง๋๊ฒฐ ์์คํ ์ ๋ฉํฐ ์์ด์ ํธ ํ๊ฒฝ์ ๊ฐํํ์ต*์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ฐ ๋ฐ ํ์ตํ๋๋ฐ์. ๋ง์ง๋ง์ผ๋ก ํ์ต๋ ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ๊ฒ์์ ์งํํด ๋ญํน์ ๋งค๊น๋๋ค. ์ด ์์คํ ์ ์ฒซ๋ฒ ์งธ ํ๋ก์ ํธ์ธ ์ถ๊ตฌ ์์คํ ํ๊ฒฝ์ ์ ๋ํฐ(Unity)๋ก ๊ตฌํํ๊ณ ๊ฒฐ๊ณผ๋ฅผ '์๋ก(Elo)' ํ์ ์ผ๋ก ์งํํฉ๋๋ค. ๊ฐํํ์ต ํ๋ก์ ํธ์ ๊ด์ฌ ์๋ ๋ถ๋ค์ ๋ฆฌ๋๋ณด๋๋ ๊ตฌ๊ฒฝํด ๋ณด์ธ์!
*๋ฉํฐ ์์ด์ ํธ ๊ฐํํ์ต(Multi-Agent Reinforcement Learning): ๋ค์์ ์์ด์ ํธ๊ฐ ํ์ ๋๋ ๊ฒฝ์ํ๋ ํ๊ฒฝ์์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ ๊ฐํํ์ต์ ํ์ ๋ถ์ผ
Introducing AI vs. AI a deep reinforcement learning multi-agents competition system
AI ๊ด๋ จ ๋ ผ๋ฌธ์ ๊ฐ๋ตํ ์๊ฐํ๋ ์ฑ๋ Two Minute Papers์์ ์๋น๋์(NVIDIA)์ ์๋ก์ด AI ๋ชจ๋ธ์ด ์๊ฐ๋์์ต๋๋ค. ํ์๋ฉ์ค(Timelapse) ๋น๋์ค๋ฅผ ์ด์ฉํด ์๋ฌผ์ด ์๋ผ๊ฑฐ๋ ๊ณ์ ์ด ๋ฐ๋๋ ๋ชจ์ต์ 'StyleGAN2' ๋ชจ๋ธ๋ก ๊ตฌํํ๋๋ฐ์. ์ ์ด ์์์ ๋ณด๊ณ ๊ฒ์ ์ ๊ณ์ ์ ๋ํ ์ผ์ด ๋ ์ ๊ตํ๊ฒ ํํ๋ ์ ์๊ฒ ๋ค๋ ์๊ฐ์ ํ๋๋ฐ, ๋์ ์ด๋ค ์๊ฐ์ด ๋๋์? ๊ด๋ จ ๋ ผ๋ฌธ์ ์ฌ๊ธฐ์ ๋ณผ ์ ์์ต๋๋ค.
NVIDIA's New AI: Nature Videos Will Never Be The Same!
์ด๋ฒ ๊ธ์ ๊ตฌ๊ธ ๋ฆฌ์์น์ ์๋ ํ๊ณ ๋ฐ ์ดํ ์ฐ๊ตฌ ์๋ฆฌ์ฆ์ ๋ค๋ฒ ์งธ ๊ธ๋ก, ํจ์จ์ ์ธ ํ์ต์ ์ํ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ์ด์ผ๊ธฐ์ ๋๋ค. ๋ฅ๋ฌ๋์ด ์ง์์ ์ผ๋ก ๋ฐ์ ํ๋ฉด์ ๋ชจ๋ธ์ด ๋ ํฌ๊ณ ๋ณต์กํด์ง๋ค ๋ณด๋, ํ์ฌ๋ค์ 'ํจ์จ์ฑ'๊ณผ '๋น์ฉ'์ ๊ณ ๋ คํ๊ธฐ ์์ํ๋๋ฐ์. ๊ตฌ๊ธ(Google)์ ํ๋ จ, ๋ฐ์ดํฐ, ์ถ๋ก ์ ๋ํ ํจ์จ์ ํฌ์ํ๊ณ ์๊ณ , ๊ทธ ๋ฐ์ ๋ณด์, ๊ฐ์ธ์ ๋ณด ๋ณดํธ๊น์ง ๊ณ ๋ คํ๊ณ ์์ต๋๋ค. ๋ ์์ธํ ๋ด์ฉ์ ์๋ ๋งํฌ์์ ์ดํด๋ณด์ธ์.
Google Research, 2022 & beyond: Algorithms for efficient deep learning
ํ๊น ํ์ด์ค ๋ธ๋ก๊ทธ์ Vision๊ณผ Language model์ ๊ฒฐํฉํ ๋ฉํฐ๋ชจ๋ฌ(Multi-modal) ๋ชจ๋ธ๋ค์ ์๊ฐํ๋ ๊ธ์ด ์ฌ๋ผ์์ต๋๋ค. OpenAI์ CLIP๊ณผ ๊ฐ์ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ์ด๋ฏธ์ง ์บก์ ๋(Image Captioning)*, ํ ์คํธ ์ด๋ฏธ์ง ์์ฑ ๋ฐ ์กฐ์, ๋น์ฃผ์ผ Q&A์ ๊ฐ์ ํ์คํฌ(Task)์์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์คฌ๋๋ฐ์. ์๋ ๊ธ์์ ๋ฉํฐ๋ชจ๋ฌ์ ๋ํด ๊ฐ๊ด์ ์ผ๋ก ์ค๋ช ํ๊ณ ์์ผ๋ ๊ถ๊ธํ ๋ถ๋ค์ ์ฝ์ด ๋ณด์ธ์!
*์ด๋ฏธ์ง ์บก์ ๋(Image Captioning): ๋จธ์ ๋ฌ๋ ๋ถ์ผ์ ํ ๊ณผ์ ๋ก, ์ด๋ฏธ์ง๋ก ์ ๋ ฅ์ด ์ฃผ์ด์ก์ ๊ฒฝ์ฐ ์ด๋ฏธ์ง์ ๋ํ ๋ฌ์ฌ๋ฅผ ์์ฐ์ด์ ํํ๋ก ์์ฑํด๋ด๋ ๊ณผ์
A Dive into Vision-Language Models
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ