Rudin6

Follow

Rudin6

Follow

Popular repositories Loading

Read-Segy-Su-Data Read-Segy-Su-Data Public

MATLAB
lectures lectures Public

Forked from gpu-mode/lectures

Material for gpu-mode lectures

Jupyter Notebook
marlin marlin Public

Forked from IST-DASLab/marlin

FP16xINT4 LLM inference kernel that can achieve near-ideal ~4x speedups up to medium batchsizes of 16-32 tokens.

Python
tiny-flash-attention tiny-flash-attention Public

Forked from weishengying/tiny-flash-attention

使用 cutlass 实现 flash-attention 精简版，具有教学意义

Cuda