์ด ํ๋ก์ ํธ๋ ๋ค์ํ ๋ฐฉ์์ ์ํ ๋ฌธ์ ํด๊ฒฐ์ ์ํ LLM ์์ฉ ๊ธฐ๋ฒ์ ์ฐ๊ตฌํ๊ณ ๊ตฌํํ ํ๋ก์ ํธ ๋ชจ์์
๋๋ค.
๊ฐ ํ์ ๋๋ ํ ๋ฆฌ๋ ๋
๋ฆฝ์ ์ธ ์คํ ํ๋ก์ ํธ๋ก ๊ตฌ์ฑ๋์ด ์์ผ๋ฉฐ, ๋ค์ํ ๋ชจ๋ธ ๋ฐ ์ถ๋ก ๋ฐฉ์์ ๊ธฐ๋ฐํ์ฌ LLM์ ์ด์ฉํด ์ํ ๋ฌธ์ ๋ฅผ ํธ๋ ๋ฐฉ๋ฒ์ ํ์ํฉ๋๋ค.
| ํ๋ก์ ํธ | ์ค๋ช |
|---|---|
verifier |
LLaDA-CoT์ ์ถ๋ ฅ์ ๊ฒ์ฆํ๋ Verifier. DeepSeek ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก OpenMathReasoning dataset์ ํ์ต. |
chain-of-thought |
QLoRA ๊ธฐ๋ฐ์ Chain-of-Thought ํ์ต ๋ฐ ์ค๋ต ๊ธฐ๋ฐ ์ฌํ์ต/๋ผ์ฐํ ๋ชจ๋ธ ํฌํจ. |
discrete-diffusion-llm |
Semi-AutoRegressive ๋ฐฉ์์ผ๋ก ์ํ ์ถ๋ก ์ ์ํํ๋ diffusion-style ๋ชจ๋ธ. |
tool-integrated-reasoning |
Tool ํธ์ถ ๊ธฐ๋ฐ ์ํ ์ถ๋ก (TIR)์ Nemotron ๋ชจ๋ธ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌํํ ์คํ. |
๊ฐ ์๋ธ ๋๋ ํ ๋ฆฌ์ requirements.txt ํ์ผ์ ์ฐธ๊ณ ํด์ฃผ์ธ์
๊ฐ ํ๋ก์ ํธ ๋๋ ํ ๋ฆฌ ์์ ์๋ README.md๋ฅผ ์ฐธ๊ณ ํ์ธ์.