โ์์ดํ ์ถ์ ๋๋ฃ์ ํจ๊ป ์ผํด๋ณด๋
๊ณ์ํด์ ์์ดํ ์ถ์ ์ ๋ฝ๊ฒ ๋์์ด์โ
"์ค์ ๋ฌด์ธ๊ฐ๋ฅผ ์ง์ ํด ๋ณด๋ฉด์ ๋ฐฐ์ฐ๋(Learning by Doing) ๋ฐฉ์์ด ๊ต์ฅํ ์ธ์ ๊น์์ด์.
์ ๋ ์ฑ ์์ ์์์ ์ด๋ก ์ ๋จผ์ ๊ณต๋ถํ๊ณ ์ดํดํ ๋ค์ ๋ฌด์ธ๊ฐ๋ฅผ ํด ๋ณด๋ ์์ ๊ณต๋ถ๋ฅผ ํด์๋๋ฐ, ์์ดํ ์ ํ๋ก์ ํธ๋ฅผ ํตํด ์ง์ ์์ ๋๋ฝํ๊ฐ๋ฉฐ ๋ฐฐ๋๋ค๊ณ ์๊ณ ์๊ฑฐ๋ ์. ๊ทธ๋ ๊ฒ ์์ ๋๋ฝํ ๊ฐ๋ฉด์ ๋ฐฐ์ด ๋ด์ฉ์ ๋จธ๋ฆฌ๊ฐ ์์์ง๋ผ๋ ์์ ์ฌ์ ํ ๊ธฐ์ตํ๊ฒ ๋๊ฑฐ๋ ์."
AI์ AI์ ๋ง๋๊ฒฐ์ ์๊ฐํ๋ ์ฝํ ์ธ ๊ฐ ํฅ๋ฏธ๋กญ์ต๋๋ค. AI ๋ง๋๊ฒฐ ์์คํ ์ ๋ฉํฐ ์์ด์ ํธ ํ๊ฒฝ์ ๊ฐํํ์ต*์ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ฐ ๋ฐ ํ์ตํ๋๋ฐ์. ๋ง์ง๋ง์ผ๋ก ํ์ต๋ ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ๊ฒ์์ ์งํํด ๋ญํน์ ๋งค๊น๋๋ค. ์ด ์์คํ ์ ์ฒซ๋ฒ ์งธ ํ๋ก์ ํธ์ธ ์ถ๊ตฌ ์์คํ ํ๊ฒฝ์ ์ ๋ํฐ(Unity)๋ก ๊ตฌํํ๊ณ ๊ฒฐ๊ณผ๋ฅผ '์๋ก(Elo)' ํ์ ์ผ๋ก ์งํํฉ๋๋ค. ๊ฐํํ์ต ํ๋ก์ ํธ์ ๊ด์ฌ ์๋ ๋ถ๋ค์ ๋ฆฌ๋๋ณด๋๋ ๊ตฌ๊ฒฝํด ๋ณด์ธ์!
*๋ฉํฐ ์์ด์ ํธ ๊ฐํํ์ต(Multi-Agent Reinforcement Learning): ๋ค์์ ์์ด์ ํธ๊ฐ ํ์ ๋๋ ๊ฒฝ์ํ๋ ํ๊ฒฝ์์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ ๊ฐํํ์ต์ ํ์ ๋ถ์ผ
Introducing AI vs. AI a deep reinforcement learning multi-agents competition system
AI ๊ด๋ จ ๋ ผ๋ฌธ์ ๊ฐ๋ตํ ์๊ฐํ๋ ์ฑ๋ Two Minute Papers์์ ์๋น๋์(NVIDIA)์ ์๋ก์ด AI ๋ชจ๋ธ์ด ์๊ฐ๋์์ต๋๋ค. ํ์๋ฉ์ค(Timelapse) ๋น๋์ค๋ฅผ ์ด์ฉํด ์๋ฌผ์ด ์๋ผ๊ฑฐ๋ ๊ณ์ ์ด ๋ฐ๋๋ ๋ชจ์ต์ 'StyleGAN2' ๋ชจ๋ธ๋ก ๊ตฌํํ๋๋ฐ์. ์ ์ด ์์์ ๋ณด๊ณ ๊ฒ์ ์ ๊ณ์ ์ ๋ํ ์ผ์ด ๋ ์ ๊ตํ๊ฒ ํํ๋ ์ ์๊ฒ ๋ค๋ ์๊ฐ์ ํ๋๋ฐ, ๋์ ์ด๋ค ์๊ฐ์ด ๋๋์? ๊ด๋ จ ๋ ผ๋ฌธ์ ์ฌ๊ธฐ์ ๋ณผ ์ ์์ต๋๋ค.
NVIDIA's New AI: Nature Videos Will Never Be The Same!
์ด๋ฒ ๊ธ์ ๊ตฌ๊ธ ๋ฆฌ์์น์ ์๋ ํ๊ณ ๋ฐ ์ดํ ์ฐ๊ตฌ ์๋ฆฌ์ฆ์ ๋ค๋ฒ ์งธ ๊ธ๋ก, ํจ์จ์ ์ธ ํ์ต์ ์ํ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ์ด์ผ๊ธฐ์ ๋๋ค. ๋ฅ๋ฌ๋์ด ์ง์์ ์ผ๋ก ๋ฐ์ ํ๋ฉด์ ๋ชจ๋ธ์ด ๋ ํฌ๊ณ ๋ณต์กํด์ง๋ค ๋ณด๋, ํ์ฌ๋ค์ 'ํจ์จ์ฑ'๊ณผ '๋น์ฉ'์ ๊ณ ๋ คํ๊ธฐ ์์ํ๋๋ฐ์. ๊ตฌ๊ธ(Google)์ ํ๋ จ, ๋ฐ์ดํฐ, ์ถ๋ก ์ ๋ํ ํจ์จ์ ํฌ์ํ๊ณ ์๊ณ , ๊ทธ ๋ฐ์ ๋ณด์, ๊ฐ์ธ์ ๋ณด ๋ณดํธ๊น์ง ๊ณ ๋ คํ๊ณ ์์ต๋๋ค. ๋ ์์ธํ ๋ด์ฉ์ ์๋ ๋งํฌ์์ ์ดํด๋ณด์ธ์.
Google Research, 2022 & beyond: Algorithms for efficient deep learning
ํ๊น ํ์ด์ค ๋ธ๋ก๊ทธ์ Vision๊ณผ Language model์ ๊ฒฐํฉํ ๋ฉํฐ๋ชจ๋ฌ(Multi-modal) ๋ชจ๋ธ๋ค์ ์๊ฐํ๋ ๊ธ์ด ์ฌ๋ผ์์ต๋๋ค. OpenAI์ CLIP๊ณผ ๊ฐ์ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ์ด๋ฏธ์ง ์บก์ ๋(Image Captioning)*, ํ ์คํธ ์ด๋ฏธ์ง ์์ฑ ๋ฐ ์กฐ์, ๋น์ฃผ์ผ Q&A์ ๊ฐ์ ํ์คํฌ(Task)์์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์คฌ๋๋ฐ์. ์๋ ๊ธ์์ ๋ฉํฐ๋ชจ๋ฌ์ ๋ํด ๊ฐ๊ด์ ์ผ๋ก ์ค๋ช ํ๊ณ ์์ผ๋ ๊ถ๊ธํ ๋ถ๋ค์ ์ฝ์ด ๋ณด์ธ์!
*์ด๋ฏธ์ง ์บก์ ๋(Image Captioning): ๋จธ์ ๋ฌ๋ ๋ถ์ผ์ ํ ๊ณผ์ ๋ก, ์ด๋ฏธ์ง๋ก ์ ๋ ฅ์ด ์ฃผ์ด์ก์ ๊ฒฝ์ฐ ์ด๋ฏธ์ง์ ๋ํ ๋ฌ์ฌ๋ฅผ ์์ฐ์ด์ ํํ๋ก ์์ฑํด๋ด๋ ๊ณผ์
A Dive into Vision-Language Models
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ ๐ ๐จ ๋ด์ค๋ ํฐ โฎ ๐ฒ๐๐๐ผ๐พ ๐ค๐ข๐ค๐ค