Model-Compression-Techniques

Compress Transformers for faster inference using techniques like Knowledge Distillation, Quantization, ONNX Conversion and Pruning (Sparsification)

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
models		models
.gitignore		.gitignore
01-Modelling-KD.ipynb		01-Modelling-KD.ipynb
02-MobileBERT-Distillation.ipynb		02-MobileBERT-Distillation.ipynb
README.md		README.md

Provide feedback