Note
Installation mit conda wird empfohlen. conda env create -f environment.yml
Danach git submodule update --init --recursive um submodule threadables zu laden
Im Rahmen des Moduls Big Data Engineering haben wir ein Content-Based Image Recommender System entwickelt. Ziel ist es, für ein Eingabebild die ähnlichsten Bilder aus einem Datensatz effizient zu finden.
Download des Index,
dem KMeans-Modell
sowie der Datenbank
Anpassung der Pfade in GUI.py
Drag'n'Drop Image onto GUI and enjoy! 😜
- Kombination aus:
- Farbhistogrammen
- DINO Embeddings
- BOVW mit SIFT/ORB-Descriptors
- Zusammenführung zu einem gewichteten Feature-Vektor
- FAISS für schnelle Ähnlichkeitssuche mit:
- Cosine Similarity (durch L2-Normalisierung + Inner Product Index)
- SQLite zur Verwaltung der Pfade & Metadaten
- Feature-Extraktion & Speicherung in SQLite
- Aufbau eines FAISS-Index (normalisierte Vektoren)
- Query: Extraktion → Normalisierung → Suche im Index
- Rückgabe der Top-k ähnlichen Bilder
- Anzeige in GUI

