Insurance Claim Fraud Detection

Problem Statement

To build a classification methodology to determine whether a customer is placing a fraudulent insurance claim.

Architecture

The Csv file(s) from the data batches path is read, the validation,transformation steps are performed and the cleaned data is exported from a sqlite database to a csv file, and this csv file serves as the training data for the ML models.

Clustering: KMeans algorithm is used to create clusters in the preprocessed data and the optimum number of clusters is selected by plotting the elbow plot. The idea behind clustering is to implement different algorithms for each cluster.

After the clusters have been created, we find the best model for each cluster by using two algorithms, “SVM” and "XGBoost". For each cluster, both the algorithms are passed with the best parameters derived from GridSearch and the models for each cluster are saved for prediction.

The prediction csv file is created at the path fraudDetection/Prediction_Output_File/Predictions.csv

Deployment 🚀

A frontend application is developed using the flask framework and deployed to Heroku cloud platform.

App URL:

https://app-frauddetection.herokuapp.com/

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
DataTransform_Training		DataTransform_Training
DataTransformation_Prediction		DataTransformation_Prediction
DataTypeValidation_Insertion_Prediction		DataTypeValidation_Insertion_Prediction
DataTypeValidation_Insertion_Training		DataTypeValidation_Insertion_Training
EDA		EDA
PredictionArchivedBadData		PredictionArchivedBadData
Prediction_Batch_files		Prediction_Batch_files
Prediction_Database		Prediction_Database
Prediction_FileFromDB		Prediction_FileFromDB
Prediction_Logs		Prediction_Logs
Prediction_Output_File		Prediction_Output_File
Prediction_Raw_Data_Validation		Prediction_Raw_Data_Validation
Training_Batch_Files		Training_Batch_Files
Training_FileFromDB		Training_FileFromDB
Training_Logs		Training_Logs
Training_Raw_data_validation		Training_Raw_data_validation
application_logging		application_logging
best_model_finder		best_model_finder
data		data
data_ingestion		data_ingestion
data_preprocessing		data_preprocessing
file_operations		file_operations
models		models
preprocessing_data		preprocessing_data
static		static
templates		templates
.gitignore		.gitignore
Procfile		Procfile
README.md		README.md
appFlow.png		appFlow.png
flask_monitoringdashboard.db		flask_monitoringdashboard.db
main.py		main.py
predictFromModel.py		predictFromModel.py
prediction_Validation_Insertion.py		prediction_Validation_Insertion.py
requirements.txt		requirements.txt
runtime.txt		runtime.txt
schema_prediction.json		schema_prediction.json
schema_training.json		schema_training.json
test.py		test.py
trainingModel.py		trainingModel.py
training_Validation_Insertion.py		training_Validation_Insertion.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Insurance Claim Fraud Detection

Problem Statement

Architecture

Deployment 🚀

App URL:

Links 🔗

About

Releases

Packages

Languages

saw101/fraudDetection

Folders and files

Latest commit

History

Repository files navigation

Insurance Claim Fraud Detection

Problem Statement

Architecture

Deployment 🚀

App URL:

Links 🔗

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages