LLaMA
๋ฑ์ฅ๋ฐฐ๊ฒฝ
๐ค ๋ฏผ๊ฐ์ ๋ณด ๋ฌธ์
ํ์ฌ๋ฅผ ๋ค๋ ๋ณธ ์ฌ๋๋ค์ด๋ผ๋ฉด ๋ง์ด ๊ณต๊ฐํ ๋ฌธ์ ์ธ๋ฐ, ๊ธฐ์ ์ ๋ด๋ถ์ ๋ฏผ๊ฐ ์ ๋ณด๊ฐ ๋ฐ์ผ๋ก ๋๊ฐ๋ ๊ฒ์ ๋ง๊ธฐ ์ํด ์ฌ๋ฌ ๋ณด์ ์ฅ์น๋ฅผ ํด๋ก๋๋ค. ๋ํ์ ์ธ ๊ฒ์ด ๋ง๋ถ๋ฆฌ์ธ๋ฐ ์ด๋ฐ ๋ด๋ถ๋ง ํ๊ฒฝ์์๋ Chat-GPT์ ๊ฐ์ ์ธ๋ถ LLM ๊ธฐ๋ฅ ํ์ฉ์ด ์ ํ๋ฉ๋๋ค.
๐ชช ๋ผ์ด์ผ์ค ๋ฌธ์
๋จธ์ ๋ฌ๋/๋ฅ๋ฌ๋ ๋ถ์ผ์ ์ ๋ฐ์ ์ธ ํ๋ก์ธ์ค๋ฅผ ์ดํด๋ณผ ๋ ํ์ต ๋ฐ์ดํฐ - ์ฌ์ ํ์ต ๋ชจ๋ธ - ํ์ต / ์ถ๋ก ์ด ์งํ๋๋ ํ์ดํ๋ผ์ธ์ ๊ฑฐ์น๊ฒ ๋ฉ๋๋ค. ์ด ๊ณผ์ ์์ ์ 3๊ฐ ์ค ํ๋๋ผ๋ ๋น์์ ์ฉ ๋ผ์ด์ผ์ค๊ฐ ์๋ ๊ฒฝ์ฐ ๋ชจ๋ธ์ ์์ฉํ๊ฐ ์ด๋ ต์ต๋๋ค.
์คํ์์ค LLM
์ผ๋ฐ์ ์ผ๋ก LLM ์๋น์ค๋ฅผ ํ๋ ๊ธฐ์ ๋ค์ ์ด์ ํํ๋ฅผ ๋ณด๋ฉด ์ผ๋ฐ ์ฌ์ฉ์๊ฐ ๋ชจ๋ธ์ ์ง์ ์ ๊ทผํ๋ ๊ฒ์ ์ ํํ๊ณ ์๋๋ฐ, ์ด๋ฅผ Closed LLM์ด๋ผ๊ณ ํฉ๋๋ค. Closed LLM์ ์์์ ์ธ๊ธํ ๋ฌธ์ ๋ค์์ ์์ ํ๊ฒ ์์ ๋กญ์ง๋ ์์ต๋๋ค. (ํนํ ๋ฏผ๊ฐ์ ๋ณด ๋ฌธ์ ๋ก๋ถํฐ)
๋ฐ๋ผ์ ์ด๋ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฑ์ฅํ ๊ฒ์ด Meta์ ์คํ์์ค LLM์ธ LLaMA์ ๋๋ค. ์คํ์์ค LLM์ด๋ ๊ณต๊ฐ๋ ์ฌ์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ๋ผ์ด์ผ์ค ๋ฌธ์ ๋ ๋ฏผ๊ฐ์ ๋ณด ๋ฌธ์ ๋ก๋ถํฐ ์์ ๋ก์ด ์ฌ์ ํ์ต๋ LLM ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๋๋ค. ์ด๋ฅผ ํ์ฉํด ํน์ ํ์คํฌ์ Fine-tuning์ ๋ ์ค๋ ํ์ต์ํค๋ ๊ฒ์ด ๋ ๋ซ๋ค๋ ๊ฒ์์ ์ถ๋ฐํ ๊ฒ์ด์ฃ .
LLaMA์ ํ์ต๋ฐฉ๋ฒ
LLaMA๋ ์คํ์์ค๋ก ์ ๊ณต๋ ์ฌ์ ํ์ต ๋ชจ๋ธ์ธ๋งํผ ์ค์ ํ์ฉ์ ์ํด์๋ ์ถ๊ฐ์ ์ธ ํ์ต์ด ํ์ํฉ๋๋ค. ๋ง์ ์ฌ๋ก์์ GPT์ API๋ฅผ ํ์ฉํด ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ถํ๊ณ ์ด๋ฅผ ํ์ต์ ํ์ฉํ๋ ํ์ต ๋ฐฉ๋ฒ๋ก ์ด ์ฐ๊ตฌ๋๊ณ ์์ต๋๋ค.
๐จ๐ซ Self-Instruct
GPT API๋ฅผ ํ์ฉํด ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ถํ๋ ๋ํ์ ์ธ ๋ฐฉ์์ ๋๋ค. ์ผ๋ฐ์ ์ธ ์ ์ฐจ๋ ์๋์ ๊ฐ์ด ์ํํ ์ ์์ต๋๋ค.
- ๋ฐ์ดํฐ ์์ง์ ์ํ Prompt Pool์ ํ๋ณดํ๊ณ , ๋ค์ํ ์์ ์ ๋ํด ํ๋กฌํํธ-์ ๋ต ์๋ ๋ง๋ ๋ค.
- ๊ธฐ์กด Pool์์ ์ํ๋งํ์ฌ LLM์๊ฒ ์๋ก์ด Instrcution์ ์์ฑ
- ์์ฑ๋ Instruction์ ๋ถ๋ฅ ์ฌ๋ถ ํ๋จ
- ์์ฑ Instruction์ ๋ต๋ณ(Instance) ์์ฑ
- ๊ธฐ์กด Pool๊ณผ ๊ธฐ์ค ์ ์ฌ๋ ์ดํ์ธ ๋ฐ์ดํฐ๋ง Pool์ ์ถ๊ฐํ๊ณ ํ ์คํธ๋ก ํด๊ฒฐํ ์ ์๋ ์์ (์๋ฅผ ๋ค์ด, ์ด๋ฏธ์ง) ์ ๊ฑฐ
- ์ด๋ ๊ฒ ์์ฑ๋ ๋ฐ์ดํฐ๋ก ์ง๋ํ์ต(SFT) ์งํ
๐ฆ Alpaca
Alpaca๋ 2023๋ ์คํ ํฌ๋์์ ๋ฐํํ LLM SFT ํ๋ก์ ํธ๋ก Self-Instruct ๋ฐฉ์์ผ๋ก ์์ฑํ ๋ฐ์ดํฐ๋ฅผ LLaMA์ SFT๋ฅผ ์งํํ ๋ชจ๋ธ์ ๋๋ค. ์ฆ, Alpaca๋ LLaMA๋ฅผ ํ์ฉํด fine-tuningํ ๋ชจ๋ธ์ ๋๋ค.
์ฐธ๊ณ ์๋ฃ
[1] ๊ฐํ์ฑ. "Text Generation 3 : sLLM Models". boostcamp ai tech.