๋ฉํ(Meta)๊ฐ ์ฌ์ง๊ณผ ๋์์์์ ์ด๋ฏธ์ง๋ฅผ ๋ถํ ํ ์ ์๋ AI ๋ชจ๋ธ์ธ 'SAM(Segment Anything Model)'๊ณผ ๋ฐ์ดํฐ์ 'SA-1B' ์ ๊ณต๊ฐํ์ต๋๋ค. SAM์ ํ๋กฌํํธ๋ก ๋์ํ๋ 'Promptable segmentation' ๋ชจ๋ธ์ธ๋ฐ์. ์ด ํ๋กฌํํธ๋ GPT ๋ฑ์ ๋ชจ๋ธ์์ ์ ๋ ฅ๊ฐ์ผ๋ก ์ฌ์ฉ๋๋ ํ ์คํธ๊ฐ ์๋, ํน์ ๊ฐ์ฒด๋ฅผ ๋ํ๋ด๋ ์ (Point)์ด๋ ๋ฐ์ด๋ฉ ๋ฐ์ค(Bounding box, ๊ฐ์งํ ๋ฌผ์ฒด ํ ๋๋ฆฌ) ๋ฑ์ ์ธ๊ทธ๋ฉํ ์ด์ ์ ํ์ํ ์ ๋ณด๋ฅผ ๋ํ๋ด๋ ๋จ์ด๋ผ๊ณ ํด์. SAM์ ์์ธํ ์๋ฆฌ๊ฐ ๊ถ๊ธํ๋ค๋ฉด, ์๋ ๋ธ๋ก๊ทธ ๊ธ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์!
GPT-4 ์ธ์ด ๋ชจ๋ธ์ ์ฐ์์ฑ์ ๋ณด์ฌ์ฃผ๊ธฐ ์ํ ์คํ์ผ๋ก ๊ฐ๋ฐ๋ 'Auto-GPT'. ์ฌ์ฉ์๊ฐ ์์ํ์ ์กฐ๊ฑด์ ํด๋น๋๋ ๋ชฉํ(Goal)์ ์ค์ ํ๋ฉด, ๋ณต์กํ ํ๋กฌํํธ ์์ด๋ GPT ๋ชจ๋ธ์ด ์์จ์ ์ผ๋ก ์ถ๋ก (Reasoning)ํ์ฌ ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ง๋ค์ด ์ค๋๋ค. ์ด๋ค ํธ์(Tweet)์์๋ 'Auto-GPT'์๊ฒ ํ๋ก๊ทธ๋๋ฐ์ ์์ผฐ๋๋, ์ฌ์ฉ์์ ์ปดํจํฐ์ 'Node.js'๊ฐ ์ค์น๋ผ ์์ง ์์์ ์ธ์ํ๊ณ ์ค์น ๋ฐฉ๋ฒ์ ๊ฒ์ํ์ฌ ์ค์ค๋ก ์ค์น๊น์ง ํ๋ค๊ณ ํด์. ์์ผ๋ก AI๋ ์ธ๊ฐ์ ๋ ๋ ํ ์์ด์ ํธ๊ฐ ๋ ์ ์์๊น์?
์ฑGPT, ํด๋ก๋(Claude) ๋ฑ์ ๊ฐ๋ ฅํ ์ธ์ด ๋ชจ๋ธ๋ค์ '์ธ๊ฐ ํผ๋๋ฐฑ ๊ธฐ๋ฐ ๊ฐํํ์ต(RLHF, Reinforcement Learning from Human Feedback)'์ ํตํด ์ฌ์ฉ์์ ๊ธฐ๋์ ์ฌ์ฉ ํจํด์ ๋ ์ ๋ง๋๋ก ํ์ธํ๋๋์์ด์. ํ๊น ํ์ด์ค ๋ธ๋ก๊ทธ์ ์๊ฐ๋ 'StackLLaMA'๋ ์ง๋ฌธ๊ณผ ๋ต๋ณ์ผ๋ก ์ด๋ค์ง 'Stack Exchange' ๋ฐ์ดํฐ์ ๊ณผ RLHF๋ฅผ ์ด์ฉํด ๋ผ๋ง(LLaMA) ๋ชจ๋ธ์ ํ์ต์ํจ ๋ชจ๋ธ์ธ๋ฐ์. ์๋ ํ๊น ํ์ด์ค ๊ธ์์ ๋ฏธ๋ฆฌ ๊ธฐ๋ฅ์ ์ฒดํํ ์ ์๋ ๋ฐ๋ชจ์ ์ค์ต ๊ฐ์ด๋ ๋ฑ์ ์ ๊ณตํ๊ณ ์์ผ๋, ์ฐธ๊ณ ํด ๋ณด์ธ์.
StackLLaMA: A hands-on guide to train LLaMA with RLHF
GPT ๋ชจ๋ธ์ ๋ง๋ ์คํAI์์ 'AI ๋ชจ๋ธ์ ์์ ์ฑ(Safety)'์ ๊ดํ ๊ธ์ ๋ฐํํ์ต๋๋ค. ์ฑGPT ๋ฑ์ AI ๋๊ตฌ๋ค์ด ์ธ๊ฐ์ ์์ฐ์ฑ๊ณผ ์ฐฝ์๋ ฅ์ ๋์ด๋ ๋ฑ ์ค๋๋ ๋ง์ ์ด์ ์ ์ ๊ณตํ๊ณ ์์ง๋ง, ๋์์ ์ด๋ค์ ์ํ์ฑ๋ ์ธ๊ธํ๋ฉฐ ์์ ์ฑ ๊ฐํ์๋ ์ง์คํ๊ณ ์์์ ๋ฐํ์ด์. ์๋ฅผ ๋ค๋ฉด, ํญ๋ ฅ์ ์ธ ์ฝํ ์ธ ๋ฅผ ์์ฑํ๊ฑฐ๋, ์ค๋ต์ ์ ๋ต์ฒ๋ผ ์ ์ํ๋ ํ ๋ฃจ์๋ค์ด์ (Hallucination, ํ๊ฐ) ๋ฑ์ ๋ฌธ์ ๋ค์ด ์๊ฒ ์ฃ ? GPT-4์์ ์์ ์ฑ ์งํ์ ๊ฐ์ , ์ฒญ์๋ ๋ณดํธ๋ฅผ ์ํ ์ฐ๋ น ์ ํ ๊ฒํ ๋ฑ ๋ ์์ ํ AI ์ธ์์ ๋ง๋ค๊ธฐ ์ํ ๋ค์ํ ๊ณํ๋ค์ ์๋ ๊ธ์์ ํ์ธํด ๋ณด์ธ์!
Our approach to AI safety
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ