2022년에 진행했던 프로젝트에서 사용했던 코드들을 정리해논 페이지입니다.
개요 : 스타벅스 주위에 다이소, 이다야, 올리브영와 같은 프랜차이즈 상권이 많은 것에 기반하여 해당 상권들의 좌표를 바탕으로 스타벅스의 최적 입지를 예측
github : https://github.com/Ijhee/Project-2022/tree/main/1)%20Starbucks
역할 : Crawling & EDA & Visualization (기여도 : 50%)
프로젝트 참여인원 : 2명
의의 : 상권분석을 수학적 관점으로 본 아이디어와 크롤링을 통해 직접 생성한 변수들로 분석을 진행한 것에 의의를 둠
개요 : PCA를 통해 데이터를 설명변수 2개와 독립변수 1개의 데이터로 축소한 후, 각 label의 predict proba가 가장 높은 값을 원의 중심점으로 지정한 뒤
해당 원 내에 데이터를 랜덤으로 생성github : https://github.com/Ijhee/Project-2022/tree/main/2)%202DAugmentation
역할 : EDA & Modeling (기여도 : 50%)
프로젝트 참여인원 : 2명
의의 : 확률을 기준으로 생성한 원 내부의 좌표점들을 이용함으로서 데이터 증강에서의 새로운 아이디어를 제공.
개요 : Permutation Importance에서 산출된 변수의 중요도를 기반으로 학습에 도움이 되는 변수와 도움이 되지 않는 변수의 reference point를 제공.
github : https://github.com/Ijhee/Project-2022/tree/main/3)%20IBS
역할 : Paper Research & Data Processing & Modeling (기여도 : 40%)
프로젝트 참여인원 : 3명
의의 : 확률을 기준으로 생성한 원 내부의 좌표점들을 이용함으로서 데이터 증강에서의 새로운 아이디어를 제공.
개요 : 불균형한 데이터에서의 데이터 증강 기법 적용과 통계적 가설 검정 방법을 주안으로 둔 데어터 분석 프로젝트
역할 : EDA & Visualization & DataProcessing & Model Selection (기여도 : 30%)
프로젝트 참여인원 : 5명
의의 : MCC 지표를 이용하여 불균형 데이터에서의 통계적 가설방법을 적용했고, 시각화-전처리-모델선택-변수선택-모델링-가설검정-결과도출까지 짜임새있는 프로젝트 진행.