Предсказание выхода из строя датчиков в реактивном двигателе от NASA
Для предсказание использовался метод решающих деревьев, такие как от XGBoost, CatBoost и Random Forest
Dataset from Kaggle
В качестве проверки работы моделей используется cреднеквадратичная ошибка (RMSE) и коэффициент детерминации (
- Если установить показателя срок службы датчика(RUL) до 115 циклов, то методы решающих деревьев справлются с предсказанием лучше
- Если применить фильтра Savitzky-Golay три раза тоже получим прирост в качестве
- Лучший результат показал классический метод решаюших деревьев
- Поиск гипер-параметров с помощью Optuna не дает значимого прироста, поиск параметров занимает ~50 минут плюс обучения с лучшими параметрами занимает 14 минут, поэтому поиск был только для Random Forest метода
- Производительность RandomForest с лучшими параметрами увеличилась в три раза