shcho1118

Follow

Sanghun Cho shcho1118

Follow

2 followers · 0 following

Highlights

Pro

Pinned Loading

flash-attention flash-attention Public

Forked from Dao-AILab/flash-attention

Fast and memory-efficient exact attention

Python 4 2
optimum-quanto optimum-quanto Public

Forked from huggingface/optimum-quanto

A pytorch quantization backend for optimum

Python
marlin-scaled-zero-point marlin-scaled-zero-point Public

Forked from IST-DASLab/marlin

Modified version of Marlin (https://github.com/IST-DASLab/marlin) with scaled zero point as input

Python