An Unofficial Implementation for Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

Document Classification

Dataset

dcard + ptt 共 20 萬篇文章
這個 repo 為各種 pretrained model 的分類任務結果

Environement

Python 3.7
pip install -r requirements.txt

training

1. Train gensim word2vec

see word2vec/train.py

2. 更改資料集路徑、欄位等

see dataset.py

3. set config

See config.py

4. train bert model

default RoBERTa
python main.py --model=bert

5. train distilled LSTM

set config in config.py distil_hparams
python main.py --model=bert

結果

Roberta + LSTM 3 layers

Roberta 3 epoch acc. : 90 %
Distill 3 epoch LSTM :

'data': {
    'maxlen': 350
},
'lstm_model': {
    'freeze': False,
    'embed_size': 250,
    'hid_size': 256,
    'num_layers': 2,
    'dropout': 0.3,
    'with_attn': False,
    'num_classes': 16,
},
'bert_model': {
    'num_classes': 16,
    'ckpt': 'logs/roberta/version_6/epoch=1.ckpt'
}

Reference

(Distilling Task-Specific Knowledge from BERT into Simple Neural Networks)[https://arxiv.org/pdf/1903.12136.pdf]

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
logs		logs
model		model
word2vec		word2vec
.gitignore		.gitignore
README.md		README.md
config.py		config.py
dataset.py		dataset.py
main.py		main.py
performance.PNG		performance.PNG
requirements.txt		requirements.txt
train_bert.py		train_bert.py
train_distil.py		train_distil.py
train_simple.py		train_simple.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

An Unofficial Implementation for Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

Dataset

Environement

training

1. Train gensim word2vec

2. 更改資料集路徑、欄位等

3. set config

4. train bert model

5. train distilled LSTM

結果

Roberta + LSTM 3 layers

Reference

About

Releases

Packages

Languages

aqweteddy/BERTDistilForClassification

Folders and files

Latest commit

History

Repository files navigation

An Unofficial Implementation for Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

Dataset

Environement

training

1. Train gensim word2vec

2. 更改資料集路徑、欄位等

3. set config

4. train bert model

5. train distilled LSTM

結果

Roberta + LSTM 3 layers

Reference

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages