Содержание:
Задание состоит из 3 частей:
-
Возьмите предобученую модель RoBERTa из библиотеки transformers от 🤗. Дообучите модель определять является ли твит расистским или сексистким с использованием соответствующего датасета. Не забудьте поделить датасет на тренировочную и тестовую выборку.
-
Оцените качество тестовой модели с использованием метрики Accuracy до и после дообучения. Проанализируйте, как выбор порога классификации влияет на точность с помощью PR-curve.
-
(Опционально) Реализуйте простой CLI, который принимает на вход предложение и выводит в консоль результат оценки модели, а также время, которое понадобилось модели на обработку этого предложения.