Skip to content

Latest commit

 

History

History
58 lines (45 loc) · 2.88 KB

README.md

File metadata and controls

58 lines (45 loc) · 2.88 KB

🌟  Project-2022


2022년에 진행했던 프로젝트에서 사용했던 코드들을 정리해논 페이지입니다.

📌   INDEX

  1. Prediction of Starbucks Coordinates Using Coordinates of Other Commercial

개요 : 스타벅스 주위에 다이소, 이다야, 올리브영와 같은 프랜차이즈 상권이 많은 것에 기반하여 해당 상권들의 좌표를 바탕으로 스타벅스의 최적 입지를 예측

github : https://github.com/Ijhee/Project-2022/tree/main/1)%20Starbucks

역할 : Crawling & EDA & Visualization (기여도 : 50%)

프로젝트 참여인원 : 2명

의의 : 상권분석을 수학적 관점으로 본 아이디어와 크롤링을 통해 직접 생성한 변수들로 분석을 진행한 것에 의의를 둠

  1. Data Augmentation in Two-Dimensional Space Using Clustering Techniques

개요 : PCA를 통해 데이터를 설명변수 2개와 독립변수 1개의 데이터로 축소한 후, 각 label의 predict proba가 가장 높은 값을 원의 중심점으로 지정한 뒤
해당 원 내에 데이터를 랜덤으로 생성

github : https://github.com/Ijhee/Project-2022/tree/main/2)%202DAugmentation

역할 : EDA & Modeling (기여도 : 50%)

프로젝트 참여인원 : 2명

의의 : 확률을 기준으로 생성한 원 내부의 좌표점들을 이용함으로서 데이터 증강에서의 새로운 아이디어를 제공.

  1. Reference Point of Permutation Importance : Index Based Selection

개요 : Permutation Importance에서 산출된 변수의 중요도를 기반으로 학습에 도움이 되는 변수와 도움이 되지 않는 변수의 reference point를 제공.

github : https://github.com/Ijhee/Project-2022/tree/main/3)%20IBS

역할 : Paper Research & Data Processing & Modeling (기여도 : 40%)

프로젝트 참여인원 : 3명

의의 : 확률을 기준으로 생성한 원 내부의 좌표점들을 이용함으로서 데이터 증강에서의 새로운 아이디어를 제공.

  1. Data augmentation and statistical hypothesis test to predict unbalanced insurance data

개요 : 불균형한 데이터에서의 데이터 증강 기법 적용과 통계적 가설 검정 방법을 주안으로 둔 데어터 분석 프로젝트

github : https://github.com/Ijhee/Project-2022/tree/main/4)%20Data%20augmentation%20and%20statistical%20hypothesis%20test%20to%20predict%20unbalanced%20insurance%20data

역할 : EDA & Visualization & DataProcessing & Model Selection (기여도 : 30%)

프로젝트 참여인원 : 5명

의의 : MCC 지표를 이용하여 불균형 데이터에서의 통계적 가설방법을 적용했고, 시각화-전처리-모델선택-변수선택-모델링-가설검정-결과도출까지 짜임새있는 프로젝트 진행.