Skip to content

Latest commit

 

History

History
27 lines (23 loc) · 1.19 KB

README.md

File metadata and controls

27 lines (23 loc) · 1.19 KB

chatSakura:Open-source multilingual conversational model.

EN
chatsakura是一个基于bloomz的多语言对话大模型,支持中文、英语、日语、德语、法语。
模型大小仅为3B。

模型局限性

该模型目前存在以下问题:

  1. 在一些涉及数理推理、代码等场景下模型的能力仍有待提高。
  2. 无法鉴别危害性指令

模型发布

Model precision FP16 int8 int4
Finetuned Model chatSakura-3b chatSakura-3b-int8 chatSakura-3b-int4

安装使用

注意:int4和int8精度必须在GPU上运行,在Windows下尚未测试过是否可以运行。

conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia
pip install -r requirements.txt
python main.py

硬件需求

Model precision FP16 int8 int4
Finetuned Model 10G 6G 4G(推荐6G)