์ธ์ด ๋ชจ๋ธ์ด ์ ์ ์ปค์ง๋ฉด์ ์ด์ ๋ ์ผ๋ฐ์ธ๋ค์ด ์ฌ์ฉํ๊ณ ์๋ GPU๋ก๋ ํ์ธ ํ๋(Fine-tuning)*ํ๊ธฐ ์ฝ์ง ์์ ์ธ์์ด ์จ ๊ฒ ๊ฐ์ต๋๋ค. Parameter-Efficient Fine-Tuning(PEFT)์ Pretrained LLM(Large Language Model) ํ๋ผ๋ฏธํฐ์ ๋๋ถ๋ถ์ ๋๊ฒฐ(Freezing)์ํค๊ณ ์์๋ง์ ํ์ธ ํ๋ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. PEFT์๋ LoRA, Prefix tuning, P-tuning, Prompt tuning ๋ฑ์ ๊ธฐ๋ฒ๋ค์ด ์๋๋ฐ์. ๋ชจ๋ธ ์ ์ฒด๋ฅผ ํ์ธ ํ๋ํ๋ ๊ฒ๋ณด๋ค ํจ์จ์ ์ด๋ฉฐ ์ฑ๋ฅ๋ ์ข๋ค๊ณ ํฉ๋๋ค.
*ํ์ธ ํ๋(Fine-tuning): ๊ธฐ์กด์ ํ์ต๋์ด์ ธ ์๋ ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ์ํคํ ์ณ๋ฅผ ์๋ก์ด ๋ชฉ์ ์ ๋ง๊ฒ ๋ณํํ๊ณ ์ด๋ฏธ ํ์ต๋ ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ๋ฏธ์ธํ๊ฒ ์กฐ์ ํ์ฌ ํ์ต์ํค๋ ๋ฐฉ๋ฒ
PEFT: Parameter-Efficient Fine-Tuning of Billion-Scale Models on Low-Resource Hardware
์ฌ๋์ ํผ๋๋ฐฑ์ ํ์ฉํ ๊ฐํํ์ต, Reinforcement Learning from Human Feedback(RLHF) ๋ค์ด๋ณด์ จ๋์? RLHF๊ฐ ๋์ค๊ฒ ๋ ๋ฐฐ๊ฒฝ์ ์ธ์ด ๋ชจ๋ธ์์ "์ข์(good)" ํ ์คํธ๋ฅผ ์ ์ํ๋ ๊ฒ์ด ์ฃผ๊ด์ ์ด๊ณ ๋งฅ๋ฝ ์์กด๋๊ฐ ๋์(Context dependent) ์ด๋ ต๊ธฐ ๋๋ฌธ์ธ๋ฐ์. ์ด๋ฅผ ์์ค ํจ์(Loss function)๋ก ๋ํ๋ด๋ ๊ฑด ๋์ฑ ์ด๋ ต๊ฒ ์ฃ . RLHF๋ ๋ชจ๋ธ๋ก ์์ฑ๋ ํ ์คํธ์ ๋ํ ์ฌ๋์ ํผ๋๋ฐฑ์ ์ฑ๋ฅ์ ์ฒ๋๋ก ์ฌ์ฉํ๊ณ , ๊ฐํํ์ต์ ์ด์ฉํด ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐฉ์์ ๋๋ค. ์ต๊ทผ ๊ฐ์ฅ ํซํ ChatGPT์๋ RLHF๊ฐ ์ฌ์ฉ๋๋ค๊ณ ํ๋ค์!
Illustrating Reinforcement Learning from Human Feedback (RLHF)
๊ตฌ๊ธ ํํ AIํ์์ ์ด์ ๋ ๋ง์ดํฌ๋กํ ํ๋ก๋ก ์์ ์ปดํจํฐ๋ฅผ ๊ตฌ์ถํ๊ณ ์์ต๋๋ค. ์์ ์ปดํจํฐ๊ฐ ์ ๋๋ก ์๋ํ๋๋ก ์ ์ํ๋ ค๋ฉด ํ๋ก์ธ์๋ฟ๋ง ์๋๋ผ ์ฃผ๋ณ ๊ธฐ๊ธฐ๋ค๋ ๋ง์ถคํ์ผ๋ก ์ค๊ณ๋ผ์ผ ํ๋ค๊ณ ํฉ๋๋ค. ์๋ ํ๋นํธ(qubit) ์ํ(State)๋ฅผ ๊ด์ฐฐํ๋ ค๊ณ ํ๋ฉด, ๊ทธ ์ํ์ ์ํฅ์ ์ฃผ๊ฒ ๋๋ค๋ ๋ฌธ์ ๊ฐ ์์๋๋ฐ์. ์๋ ๊ธ์์ ์ค๋ช ํ๋ ์ด์ ๋ ๋ง์ดํฌ๋กํ ์ฆํญ๊ธฐ๋ฅผ ์ฌ์ฉํ๋ฉด ์ด๋ฅผ ํด๊ฒฐํ ์ ์๋ค๊ณ ํฉ๋๋ค.
*ํ๋นํธ(qubit ๋๋ quantum bit): ์์ ์ปดํจํฐ๋ก ๊ณ์ฐํ ๋์ ๊ธฐ๋ณธ ๋จ์
Amplification at the Quantum limit
ํ ์ํ๋ก(TensorFlow)์์ 2๋ ์ ๋ถํฐ ์ค๋นํ๋ TensorFlow Decision Forests(TF-DF) ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ๋๋์ด Production(์ด์)์ผ๋ก ์ค๋น ์๋ฃ๋๋ค๊ณ ํฉ๋๋ค. TF-DF ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ๋ฉด ํธ๋ฆฌ์ ๊ฐ์, ํธ๋ฆฌ์ ์ต๋ ๊น์ด ๋ฑ ํ์ดํผ ํ๋ผ๋ฏธํฐ(Hyperparameter)๋ฅผ ๊ฐํธํ๊ฒ ํ๋ํ ์ ์๊ณ , ๊ตฌ๊ธ ํด๋ผ์ฐ๋๋ฅผ ํตํ ๋ชจ๋ธ ์๋น, ๋ถ์ฐ ํ์ต๋ ๊ฐ๋ฅํ๋ค๊ณ ํฉ๋๋ค. ์๋ ๊ฒฐ์ ํธ๋ฆฌ(Decision tree) ๋ชจ๋ธ์ Scikit-learn์ผ๋ก ๋ง์ด ๊ตฌํํ์๋๋ฐ์. ํ ์ํ๋ก์์ ์ถ์๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์ด๋จ์ง ์ ๋ง ๊ถ๊ธํ๋ค์!
Updates: TensorFlow Decision Forests is production ready
๋ชจ๋์์ฐ๊ตฌ์ ๊ณต์ SW/AI ๋ด์ค๋ ํฐ