Coming soon~
- 코드 및 Visual Studio Code, Python 다운로드
- 크롤러 코드 다운로드 링크 : WebCrawler_exe
- 현재 chrome 버전 정보를 확인, 버전에 맞는 chromedriver를 다운로드
- 자신의 크롬 버전을 찾고 chromedriver 다운로드
- 크롬버젼 확인 링크 : chrome://settings/help
- chromedriver 다운로드 링크 : chromedriver
- 크롤링한 이미지를 front, side, back 폴더를 만든 후 사진을 구별하여 분류
- 분류 후 이름을 코드로 재설정(코드는 따로 공개 X)
- 검색어 인물 이외의 다른 사람이 존재해도 무방
- 다른 인물은 Etc 로 분류
- Front
- Side
- Back
- category tool은 이미지를 front, side, back, delete로 쉽게 분류
- 자세한 설명 링크 및 코드 : Classify_imgFile_tool
- 라벨은 PascalVOC 포멧에 따라 xml로 제작하였고, 필요에 따라 json파일로도 변환이 가능하다.
- xml -> json 링크 : xml2json
- 전처리 작업으로 RatinaFace를 이용하여 이미지에서 얼굴영역을 찾은 다음, xml에 위치정보를 저장한다.
- RetinaFece 코드 링크 : Pytorch_retinaface
- 전처리 과정으로 대부분의 얼굴영역은 잡혔지만, 잡히지 않은 영역은 tool을 이용하여 작업하였다.
- tool 링크 : labelImg
- 얼굴 영역을 드래그하여 선택하고 라벨을 입력한다. 라벨이 잘 못된 영역은 더블 클릭하여 수정한다.
- Class : 200
- Total Images : 29,266
- xml : 29,266
- json : 29,266
Task number | Task | Count |
---|---|---|
Task1 | Tennis 남자 1~25위 (25명) | 5,183 |
Task2 | Tennis 여자 1~25위 (25명) | 8,284 |
Task3 | Trump cabinet (25명) | 5,174 |
Task4 | Biden cabinet (26명) | 4,000 |
Task5 | News3lv anchor (31명) | 373 |
Task6 | FOX anchor (26명) | 2,104 |
Task7 | ABC anchor (21명) | 2,514 |
Task8 | CBS anchor (21명) | 1,634 |
red bb : target
blue bb : etc