- ์ฝ๋ค๋ก ์๋ก์ด ๊ฐ์ํ๊ฒฝ ๋ง๋ค์ด์ค๋ค
- conda create -n textgen python=3.10
- ์ด ํ๊ฒฝ ์๋์ ์ค์นํ ํ ํ์ฑํํ๊ธฐ
- conda activate textgen
- ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ค์ ์ค์นํ๋ค
- conda install cuda pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia/label/cuda-11.7.0
- ์ด์ ๊นํ์์ ๋ฐ์์ค์
- git clone https://github.com/oobabooga/text-generation-webui.git
- pip install ninja
- cd text-generation-webui
- pip install -r requirements.txt
- ์์ ๊ฐ์ ์๋ฌ๊ฐ ๋ฌ๋ค. ํ๋ฒ ์ก์๋ณด์.
- https://github.com/oobabooga/one-click-installers/issues/30#issuecomment-1518040167
- ํ์๊ฐ์ด ๋๊ฒ ๊ณ ์ํ๋ฉด ์์๋ณธ ๊ฒฐ๊ณผ C complier๊ฐ ์์ด์ ๋ฐ์ํ ๋ฌธ์ ์๋ค. ์ด๋์๋ ์ ๋ฆฌ๋ ๋ฌธ์๋ฅผ ์ฐพ์ ์ ์์๋ค
- sudo apt install build-essential
- ์ด๊ฑธ๋ก c์ปดํ์ผ๋ฌ๋ฅผ ๊น๊ณ ๋ค์ ์๋ํด๋ณด์
- pip install -r requirements.txt
- ์๋๋ค.
- python server.py
- http://127.0.0.1:7860 ์ ์ ์ํ๋ฉด ์๋์ฐ์์ ์ฐฝ์ด ์ด๋ฆฐ๋ค. ์ฐ๋ถํฌ์ ๋ฆฌ๋ ์ค๊ฐ ์ด๋ ๊ฒ ์ฐ๊ฒฐ๋๋ค๋ ์ ๋น๋ก์ด ๊ธฐ๋ถ์ด๋ค.
- ์ฑ๊ณต
- ์ด์ ๋ชจ๋ธ๋ค์ ๋ชจ๋ ํ ์คํธํด๋ณด์.
- ์๋๋ค. ๋ชจ๋ธ์ ๋ก๋ํ๋ฉด ModuleNotFoundError: No module named 'llama_inference_offload' ์ด๋ฐ ์๋ฌ๊ฐ ๋ฌ๋ค
- https://github.com/qwopqwop200/GPTQ-for-LLaMa/issues/161
- ์์ ๊ฐ์ GPTQ๋ฅผ ๋๋ฆฌ๊ธฐ ์ํด์๋ ์ถ๊ฐ ์์ ์ด ํ์ํ๋ค
- ์์๋ณด๋ ์ด๊ฑด ์๋์ ์๋์ฐ ์ค์นํ ๋์ ๊ฐ์ ์์ ์ด ํ์ํ๋ค.
- git clone https://github.com/oobabooga/GPTQ-for-LLaMa.git -b cuda
- cd GPTQ-for-LLaMa && python setup_cuda.py install
- ๋ง์ง๋ง์ผ๋ก GPTQ-for-LLaMa ํด๋์์ ๋ชจ๋ ํ์ผ์ ํต์ฑ๋ก ์๋ผ๋ด๊ธฐ ํํ
- text-generation-webui ํด๋ ์์ผ๋ก ์ด๋ํ๊ณ
- ์ฌ๊ธฐ์ ํต์ฑ๋ก ๋ถ์ฌ๋ฃ๊ธฐํ๋ค. ๋ฎ์ด์ฐ๊ธฐ๋ ํ์ง ์๋๋ค. explore.exe๋ฅผ ์ด์ฉํด ์์ ํ๊ฒ ์ด๋์ํค์
- python server.py --listen --listen-port 8001 --chat --auto-devices
- ๋ชจ๋ธ๋ค์ ๋ก๋ฉํด๋ณธ๋ค. ์ธํ ๋ง ๋ง์ผ๋ฉด GPTQ ๋ชจ๋ธ๋ค๋ ๋ก๋ฉ์ด ์๋๋ค.
- ์ธ๋ถ์์ wsl๋ก ๋ถ๊ธฐ์ํด ํฌํธ ์ฐ๊ฒฐํ๊ธฐ
- ๊ด๋ฆฌ์ ํ์์์์
- netsh interface portproxy add v4tov4 listenport=8001 listenaddress=0.0.0.0 connectport=8001 connectaddress=172.28.51.232
- 0.0.0.0์ ์ธ๋ถ์์ ๋ถ์ ์ ์๊ฒ ์ด์ด์ค๋ค๋ ๋ป์ด๊ณ 8001ํฌํธ๋ ์ธ๋ถ์ ์ด๋ฆฐ ํฌํธ์ด๋ค. 172.23.81.58์ wsl2 ํฌํธ์ด๋ค
- ํต์ฌ์ connectaddress ์ ํ์ฌ ์ฐ๋ถํฌ์ ip๋ฅผ ์ ์ด์ฃผ๋ ๊ฒ์ด๋ค. ์ฌ๊ธฐ์ localhost๊ฐ ๋ค์ด๊ฐ ์์ผ๋ ์ ์์ด ๊ณ์ ์๋์๋ ๊ฑฐ๋ค.
- ๋ง์ฝ์ ์ ๋ด๋ถ ํฌํธ๊ฐ ๋ฐ๋๋๋ฅผ ๋๋นํด ์ค์ผ์ฅด๋ฌ๋ฅผ ์ด์ฉํ๋๋ฐ ์ด๊ฑด
- https://velog.io/@popcorn_kim93/WSL2%EC%97%90-ssh-%EC%84%9C%EB%B2%84%EC%99%80-%EC%99%B8%EB%B6%80%EC%97%B0%EA%B2%B0-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%B6%95
- ๋ฅผ ๋ณด์. ์ฌ๋ฌ๋ฒ ์ฌ๋ถํ ํด๋ดค๋๋ฐ ์์ง์ ๋ณ ๋ฌธ์ ๊ฐ ์๋ค
- ๋ฌธ์ ๋ฐ์์ ์๋๋ ํด๋น ํฌํธ๋ฅผ ์ญ์ ํ๊ธฐ
- netsh interface portproxy delete v4tov4 listenaddress=0.0.0.0 listenport=8001
- wsl์์ ์ธ๋ถ๋ก ์ด๋ฆฐ ํฌํธ ํ์ธ. ์๋์ ํ์์ ํฌํธ์ ๋ค๋ฅด๋ค
- netsh interface portproxy show v4tov4
'AI ์์ฐ์ด' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋๋ค๋ฆฌ ๊ณ ๊ธ๋ฒ์ญ - ์ผ๋์ ๋ชจ๋ธ - ๊ณต๊ฐ ์์ (0) | 2024.06.19 |
---|---|
๋๋ค๋ฆฌ AI๋ก ์ด๋ฒ๋ฒ์ญํ๊ธฐ (0) | 2024.06.14 |
AI๋ฒ์ญ๊ธฐ ๋๋ค๋ฆฌ, ์๋ง(srt)๋ฒ์ญ ์ถ๊ฐ (0) | 2024.05.24 |