В данное проекте подготавливаем датасет для построения ML модели, предсказывающую стоимость недвижимости.
Данные представляют собой таблицу в формате CSV, в каждой строке которой содержится информация об уникальном объекте недвижимости.
Основные цели проекта:
- Провести разведывательный анализ и очистку исходных данных.
- Выделить наиболее значимые факторы, влияющие на стоимость недвижимости.
- Построить модель для прогнозирования стоимости недвижимости.
- Разработать небольшой веб-сервис, на вход которому поступают данные о некоторой выставленной на продажу недвижимости, а сервис прогнозирует его стоимость.
Для регрессии - Средняя квадратичная ошибка (MSE), Коэффициент детерминации (R-squared).
-
- удалось провести разведывательный анализ и очистить данные от выбрасов и жаргонных сокращений.
-
- удалось выделить наиболее значимые факторы, влияющие на стоимость недвижимости: 'PricePerSqft' - означает цену недвижимости за квадратный фут, выделяется как наиболее значимый; 'sqft' и 'zipcode' также показывают значительную важность, но они уступают 'PricePerSqft'. Это подчёркивает, что площадь объекта и местоположение при оценке стоимости, но именно соотношение цены и площади играет ключевую роль.
-
- удалось выбратьи и построить оптимальную модель и подобрать гиперпараметры. Хотя подход optuna дает лучшую производительность модели, он значительно более времязатратен. Подход RandomizedSearchCV предлагает более быстрый процесс оптимизации с небольшим уступанием в точности. Выбор между этими двумя подходами зависит от приоритетов: если важнее точность, optuna подход предпочтительнее; если важнее скорость, то RandomizedSearchCV подход может быть более подходящим. Важно отметить, что различия в производительности не так велики, что может означать, что более быстрый подход является разумным компромиссом.
-
- Удалось разработать небольшой веб-сервис, предсказывающий стоимость недвижимости.
В целом, получилось преобразовать, подготовить данные, подобрать оптимальные гиперпараметры и создать вэб-сервис по предсказанию стоиомсти недвижимости.
docker pull exelero565/my_app_property
# Клонируйте репозиторий
git clone https://github.com/exelero565/Project.git
# Перейдите в директорию проекта
cd Project
# Создание и активация виртуального окружения (рекомендуется для изоляции зависимостей проекта):
python -m venv venv
# Для Windows
venv\Scripts\activate
# Для Unix или MacOS
source venv/bin/activate
# Установка необходимых зависимостей:
pip install -r requirements.txt
Проект распространяется под лицензией MIT. Вы можете свободно использовать и распространять этот код для личных и коммерческих целей с обязательной ссылкой на автора.