Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
bert_dynamic.yaml		bert_dynamic.yaml
bert_qdq.yaml		bert_qdq.yaml
bert_static.yaml		bert_static.yaml
export.py		export.py
main.py		main.py
prepare_data.sh		prepare_data.sh
prepare_model.sh		prepare_model.sh
requirements.txt		requirements.txt
run_benchmark.sh		run_benchmark.sh
run_tuning.sh		run_tuning.sh

README.md

Evaluate performance of ONNX Runtime(BERT)

ONNX runtime quantization is under active development. please use 1.6.0+ to get more quantization support.

This example load a language translation model and confirm its accuracy and speed based on GLUE data.

Environment

Dynamic quantization environment:

onnx: 1.7.0 onnxruntime: 1.6.0+

Static quantization environment:

onnx: 1.9.0 onnxruntime: 1.10.0

Prepare dataset

download the GLUE data with prepare_data.sh script.

export GLUE_DIR=/path/to/glue_data
export TASK_NAME=MRPC

bash prepare_data.sh --data_dir=$GLUE_DIR --task_name=$TASK_NAME

Prepare model

Please refer to Bert-GLUE_OnnxRuntime_quantization guide for detailed model export.

Run the prepare_model.sh script

Usage:

bash prepare_model.sh --input_dir=./MRPC \
                      --task_name=$TASK_NAME \
                      --output_model=path/to/model # model path as *.onnx

Quantization

Quantize model with dynamic quantization:

bash run_tuning.sh --config=bert_dynamic.yaml \ 
                   --input_model=path/to/model \ # model path as *.onnx
                   --output_model=path/to/model_tune

Quantize model with QLinearOps:

bash run_tuning.sh --config=bert_static.yaml \ 
                   --input_model=path/to/model \ # model path as *.onnx
                   --output_model=path/to/model_tune

Quantize model with QDQ mode:

bash run_tuning.sh --config=bert_qdq.yaml \ 
                   --input_model=path/to/model \ # model path as *.onnx
                   --output_model=path/to/model_tune

Benchmark

bash run_tuning.sh --config=bert_dynamic.yaml \ 
                   --input_model=path/to/model \ # model path as *.onnx
                   --mode=performance # or accuracy

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ptq

ptq

README.md

Evaluate performance of ONNX Runtime(BERT)

Environment

Dynamic quantization environment:

Static quantization environment:

Prepare dataset

Prepare model

Quantization

Benchmark

Files

ptq

Directory actions

More options

Directory actions

More options

Latest commit

History

ptq

Folders and files

parent directory

README.md

Evaluate performance of ONNX Runtime(BERT)

Environment

Dynamic quantization environment:

Static quantization environment:

Prepare dataset

Prepare model

Quantization

Benchmark