Ghudsavar 🏇🏻

Ghudsavar (Horse rider) - Helps you spin up a quick llama.cpp server (OpenAI API compatbile) which plugs into langchain & llamaindex w/o sweat. Currently for CPU only runtimes, made available as a docker image. Duplicate this 🤗 HF-space as your own CPU or GPU(with suitable build flags & ngl params) space & change the model weights to your own GGUF file.

BTW the free tier with 2 CPU-cores runs between 5-8tok/s with Gemma-2B-Instruct@Q8, which is alright for quick testing.

Local setup

git clone https://github.com/iakashpaul/Ghudsavar.git
cd Ghudsavar
docker build -t iakashpaul/Ghudsavar:latest .

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Ghudsavar 🏇🏻

Local setup

About

Releases

Packages

Languages

License

iakashpaul/Ghudsavar

Folders and files

Latest commit

History

Repository files navigation

Ghudsavar 🏇🏻

Local setup

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages