๊ตฌ๊ธ ๋ฆฌ์์น์์ '๋จธ์ ์ธ๋ฌ๋ ์ฑ๋ฆฐ์ง(Machine Unlearning Challenge)'๋ฅผ ์ฒ์์ผ๋ก ๊ฐ์ตํ์ต๋๋ค๐. ์ฐ๋ฆฌ๊ฐ ์๊ณ ์๋ ๋จธ์ ๋ฌ๋์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ดํฐ์ ํน์ง์ ์ธ ํจํด์ ์๋ณํ์ฌ ์์ธกํ๊ฑฐ๋ ๊ฒฐ์ ๋ด๋ฆฌ๋ ๊ณผ์ ์ ์๋ฏธํฉ๋๋ค. ํ์ง๋ง ์ด๋ฐ ์ ๊ทผ ๋ฐฉ์์๋ ์ฌ์ํ ์นจํด์ ๊ฐ๋ฅ์ฑ๋ ์กด์ฌํด์. ์๋ฅผ ๋ค์ด, ์๋ฃ ๊ธฐ๋ก๊ณผ ๊ฑด๊ฐ ๋ฐ์ดํฐ๋ ๊ฐ์ธ์๊ฒ ๋งค์ฐ ๋ฏผ๊ฐํ ์ ๋ณด์ธ๋ฐ์. ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ด ์ด๋ฌํ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ์์ธกํ๊ฑฐ๋ ์ง๋จ์ ์ํํ๋ฉด, ๊ฐ์ธ์ ์๋ฃ ๊ธฐ๋ก๊ณผ ๊ฑด๊ฐ ์ํ์ ๋ํ ์ ๋ณด๊ฐ ๋ ธ์ถ๋ ์ ์๊ฒ ์ฃ .
๋ง์ฝ ์ด๋ฏธ ํ์ต๋ ๋ชจ๋ธ์์ ํน์ ๋ฐ์ดํฐ์ ์ ๋ณด๋ฅผ ์๊ฒ ํ ์ ์๋ค๋ฉด ์ด๋จ๊น์? '๋จธ์ ์ธ๋ฌ๋'์ ์ด๋ฐ ์ ๊ทผ์์๋ถํฐ ์๊ธด ๋ถ์ผ์ธ๋ฐ์. ๋ชจ๋ธ์์ ํน์ ๋ฐ์ดํฐ๋ฅผ ์ ๊ฑฐํ๊ฑฐ๋, ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ค์ ํ๊ฑฐ๋, ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ์ด๊ธฐํํ๋ ๋ฑ์ ์์ ์ ์ํํ๊ณ ์. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ ์ ๋ง์ถ ์ ์๊ฑฐ๋, ๋ฐ์ดํฐ์ ๋ณด์๊ณผ ๊ฐ์ธ ์ ๋ณด ๋ณดํธ๋ฅผ ๊ฐํํ ์ ์๋ค๊ณ ํ๋ค์. ์ด๋ฒ ๋จธ์ ์ธ๋ฌ๋ ์ฑ๋ฆฐ์ง๋ ์ธ๊ณ์ ์ธ AI ํํ์ธ NeurIPS 2023์ ์ผ๋ถ๋ก ์ด๋ฆฌ๊ณ , 7์ ์ค์๋ถํฐ 9์ ์ค์๊น์ง ์งํ๋๋ค๊ณ ํฉ๋๋ค.
์ค๋๋ฅ ์(Andrew Ng)์ด ๋ง๋ ๊ต์ก ๊ธฐ์ ํ์ฌ 'DeepLearning.AI'์์ LLM(Large Language Model)์ ํ์ฉํ ์์ฑ ๋ชจ๋ธ ๊ฐ์๋ฅผ ์ถ์ํ์ต๋๋ค. ๋จ์ํ ๊ฐ๋ ์ค๋ช ์ ๋์ด, ๋ฐ์ดํฐ ์์ง๋ถํฐ ์ฑ๋ฅ ํ๊ฐ์ ๋ฐฐํฌ๊น์ง ์์ฑ ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐ ํ์ํ ๋ชจ๋ ๊ณผ์ ์ ์ค๋ช ํ๋ค๊ณ ํ๋๋ฐ์. ๋จผ์ ํธ๋์คํฌ๋จธ, ํ๋กฌํํธ ์์ง๋์ด๋ง ๋ฑ LLM ๋ถ์ผ์ ๊ธฐ์ด ๊ฐ๋ ๋ค์ ์๊ฐํ๊ณ ์. PEFT(Parameter Efficient Fine-Tuning), RLHF(Reinforement Learning from Human Feedback)์ ๊ฐ์ด LLM์ ํ์ธํ๋(Fine-tuning)ํ๊ณ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํ ๋ค์ํ ๊ธฐ๋ฒ๊น์ง ๋ค๋ฃน๋๋ค. ๊ฐ์๋ ์ฝ์ธ๋ผ์์ ๋ฌด๋ฃ๋ก ์๊ฐํ ์ ์๊ณ , ์๋ฃ์ฆ๋ ๋ฐ๊ธํ ์ ์์ผ๋ ์ฐธ๊ณ ํด ์ฃผ์ธ์!
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ