
CNN i transfer learning do rozpoznawania mebli
Klasyfikacja obrazów w deep learningu i konkurs Kaggle
Transfer learning CNN do rozpoznawania 128 klas mebli (Kaggle).
Opis projektu
Model zbudowano na ok. 200 tys. obrazów mebli, osiągając ponad 80% trafności dla 128 klas.
Przegląd
iMaterialist Challenge (Furniture) na FGVC5 dostarczył duży zbiór danych do klasyfikacji 128 klas. Użyliśmy pre‑trenowanych architektur CNN, uzyskując 175. miejsce na 428 zespołów oraz maksymalną ocenę w kursie.
Projekt realizowany w ramach kursu Large Scale Data Analysis.
Technologie
Keras, CNN, transfer learning, Ubuntu w chmurze Microsoft Azure
Szczegóły techniczne
Zastosowaliśmy pełny transfer learning, łącząc cechy z dwóch architektur i używając test‑time augmentation.
Końcowy model łączył ResNet50 i DenseNet w dwóch trybach (z i bez TTA), a predykcja była ważoną średnią wyników czterech pipeline’ów.
Pracowaliśmy z Keras i GPU‑akcelerowanym Tensorflow na maszynie Ubuntu w Azure. Dużym wyzwaniem było efektywne zarządzanie danymi w chmurze.
Mój wkład
Zbudowałem podejście transfer learning, framework do ekstrakcji cech, generator danych z uwagi na pamięć, test‑time augmentation oraz ensemble końcowy.