Определение расистских/сексистских твитов с помощью RoBERTa

Содержание:

Задание состоит из 3 частей:

Возьмите предобученую модель RoBERTa из библиотеки transformers от 🤗. Дообучите модель определять является ли твит расистским или сексистким с использованием соответствующего датасета. Не забудьте поделить датасет на тренировочную и тестовую выборку.
Оцените качество тестовой модели с использованием метрики Accuracy до и после дообучения. Проанализируйте, как выбор порога классификации влияет на точность с помощью PR-curve.
(Опционально) Реализуйте простой CLI, который принимает на вход предложение и выводит в консоль результат оценки модели, а также время, которое понадобилось модели на обработку этого предложения.

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
data		data
imgs		imgs
README.md		README.md
cli.py		cli.py
model.py		model.py
training.ipynb		training.ipynb

Provide feedback