CNN i transfer learning do rozpoznawania mebli

CNN i transfer learning do rozpoznawania mebli

Klasyfikacja obrazów w deep learningu i konkurs Kaggle

Transfer learning CNN do rozpoznawania 128 klas mebli (Kaggle).

PythonPythonAzureCNNsKerasKaggle

Opis projektu

Model zbudowano na ok. 200 tys. obrazów mebli, osiągając ponad 80% trafności dla 128 klas.

Przegląd

iMaterialist Challenge (Furniture) na FGVC5 dostarczył duży zbiór danych do klasyfikacji 128 klas. Użyliśmy pre‑trenowanych architektur CNN, uzyskując 175. miejsce na 428 zespołów oraz maksymalną ocenę w kursie.

Projekt realizowany w ramach kursu Large Scale Data Analysis.

Ranking Kaggle

Technologie

Keras, CNN, transfer learning, Ubuntu w chmurze Microsoft Azure

Szczegóły techniczne

Zastosowaliśmy pełny transfer learning, łącząc cechy z dwóch architektur i używając test‑time augmentation.

Końcowy model łączył ResNet50 i DenseNet w dwóch trybach (z i bez TTA), a predykcja była ważoną średnią wyników czterech pipeline’ów.

Pracowaliśmy z Keras i GPU‑akcelerowanym Tensorflow na maszynie Ubuntu w Azure. Dużym wyzwaniem było efektywne zarządzanie danymi w chmurze.

Mój wkład

Zbudowałem podejście transfer learning, framework do ekstrakcji cech, generator danych z uwagi na pamięć, test‑time augmentation oraz ensemble końcowy.