私の卒業研究です.
論文作成のために色々いじり,そのまま放置していたので,汚いコードになっています.
後で挙げ直すかもしれないです.
BiT(Big Transfer)を転移学習して,webから集めた画像を選別する.(データクレンジング)
具体的には,サーティワンのようなアイスクリームの画像が欲しい時に,webで「アイスクリーム」と調べるとソフトクリームが出てきたり,冷凍のアイスが出てきたりする.
そのようなデータセットにおいて,本当に欲しい画像(今回の例では,サーティワンのようなアイスクリーム)のみを取り出すことを目的としている.
- webから画像を収集する.
- 収集した画像の中から,本当に集めたい画像を10~20枚程度,選別する.(もしくは,自分で用意する)
- その画像でBiTを学習させ,収集した全ての画像に対してどれだけその画像に近いかをスコアを算出する.
- そのスコアが低いものを削除する.