Releases · alibaba/TinyNeuralNetwork

31 May 09:41

llm_0.0.1

841294e

Annoucing easyquant for speeding up LLM inference via quantization Latest

Latest

With the help of quantization, we could achieve LLM inference efficiently with lower resource usage. Please install the package below and try out the examples here. We look forward to your feedback.

Assets 14

easyquant-0.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

399 MB 2023-05-31T07:37:42Z
easyquant-0.0.1-cp310-cp310-win_amd64.whl

408 MB 2023-05-31T08:04:00Z
easyquant-0.0.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

399 MB 2023-05-31T07:39:16Z
easyquant-0.0.1-cp311-cp311-win_amd64.whl

408 MB 2023-05-31T08:00:13Z
easyquant-0.0.1-cp36-cp36m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

399 MB 2023-05-31T07:23:11Z
easyquant-0.0.1-cp36-cp36m-win_amd64.whl

408 MB 2023-05-31T07:43:39Z
easyquant-0.0.1-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

399 MB 2023-05-31T07:27:25Z
easyquant-0.0.1-cp37-cp37m-win_amd64.whl

408 MB 2023-05-31T07:47:38Z
easyquant-0.0.1-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

399 MB 2023-05-31T07:35:13Z
easyquant-0.0.1-cp38-cp38-win_amd64.whl

408 MB 2023-05-31T07:51:42Z
Source code (zip)

2023-05-31T09:39:29Z
Source code (tar.gz)

2023-05-31T09:39:29Z

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: alibaba/TinyNeuralNetwork

Annoucing easyquant for speeding up LLM inference via quantization