Abin Jose M.Sc.
Wissenschaftlicher Mitarbeiter
Arbeitsgruppe Bild- und Video-Inhaltsanalyse
Kontakt
E-Mail: jose@ient.rwth-aachen.de
Tel.: +49 (0) 241 80 2 7679
Fax: +49 (0) 241 80 22 196
Sprechzeiten
Mittwoch und Donnerstag, 10:00 bis 12:00 und 14:00 bis 16:00 Uhr
Raum 33a
Anschrift
Abin Jose
Institut für Nachrichtentechnik
RWTH Aachen
D-52056 Aachen
Forschungsthema
Binarisierung von CNN-generierten Merkmalsvektoren
Die von Convolutional Neural Networks (CNNs) erzeugten Merkmalsvektoren sind im Allgemeinen Gleitkommawerte. Für einen schnellen Bildabruf ist es wichtig, Binärcodes zu generieren, die bezüglich der Hamming-Distanz zwischen den Codewörtern verglichen werden können anstelle der üblichen Berechnung der euklidischen Distanz von Vektoren in Fließkommadarstellung.
Ein beliebter Ansatz für die Binarisierung ist die Verwendung des ITQ-Ansatzes (Iterative Quantization). Ein Nachteil dieses Ansatzes ist jedoch, dass die Anzahl der in diesem Fall erzeugten Bits durch die Anzahl der Merkmalsvektordimensionen begrenzt ist. Dieses Problem könnte durch mehrstufige Quantisierungsansätze gelöst werden, bei denen jede Merkmalsdimension in verschiedene Ebenen quantisiert und entsprechende Binärcodes gelernt werden. Für den erfolgreichen Abschluss dieser Arbeit sind Vorkenntnisse in Python, Matlab und Grundkenntnisse in Deep Learning erforderlich.
Mit dem Fortschritt des Deep Learnings werden Convolutional Neural Networks (CNNs) häufig zur Klassifizierung von Bildern verwendet. Für die Klassifizierung trainierte CNNs können zur Merkmalsextraktion verwendet werden. Die Verwendung eines vorab trainierten CNN ist ein solcher Ansatz. Ein Hauptproblem bei Merkmalsvektoren besteht darin, dass sie von Natur aus hochdimensional sind, wovon jedoch die meisten Dimensionen redundante Informationen enthalten.
Die lineare discrimant analysis (LDA) ist ein herkömmliches Verfahren zur Klassifizierung in einem optimierten Merkmalsraum, das zusätzlich auch bei der Dimensionalitätsreduzierung der Merkmalsvektoren hilft. In der Masterarbeit wird untersucht, wie effektiv neuronale Netze trainiert werden können, um diesen optimierten Merkmalsraum zu erlernen. Grundkenntnisse in maschinellem Lernen und Bildverarbeitung sind von Vorteil.
Publikationen
A. Jose, D. Filbert, C. Rohlfing, and J.-R. Ohm, “Deep hashing with hash center update for efficient image retrieval,” arXiv preprint arXiv:2106.06269, 2021. [ bib ]
A. Jose, S. Yan, Z. Mi, and J.-R. Ohm, “DEEP SUBCLASS LINEAR DISCRIMINANT ANALYSIS FOR MULTIMODAL FEATURE SPACE LEARNING,” in Proc. of IEEE International Conference on Image Processing ICIP '20, IEEE, Piscataway, Oct. 2020. [ bib ]
A. Jose, E. S. Ottlik, C. Rohlfing, and J.-R. Ohm, “Optimized feature space learning for generating efficient binary codes for image retrieval,” arXiv preprint arXiv:2001.11400, 2020. [ bib ]
A. Jose, R. D. Lopez, I. Heisterklaus, and M. Wien, “Pyramid Pooling of Convolutional Feature Maps for Image Retrieval,” in Proc. of IEEE International Conference on Image Processing ICIP '18, IEEE, Piscataway, Oct. 2018. [ bib ]
A. Jose, T. Horstmann, and J.-R. Ohm, “Optimized Binary Hashing Codes Generated by Siamese Neural Networks for Image Retrieval,” in Proc. of European Signal Processing Conference EUSIPCO '18, IEEE, Piscataway, Sept. 2018. [ bib ]
A. Jose, S. Yan, and I. Heisterklaus, “Binary hashing using siamese neural networks,” in Proc. of IEEE International Conference on Image Processing ICIP '17, IEEE, Piscataway, Sept. 2017. [ bib ]
A. Jose and I. Heisterklaus, “Bag of fisher vectors representation of images by saliency-based spatial partitioning,” in Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing ICASSP '17, IEEE, Piscataway, Mar. 2017. [ bib ]
A. Jose and I. Heisterklaus, “Saliency based spatial partitioning for global image representations,” in Proc. of International Student Conference on Electrical Engineering POSTER '16, May 2016. [ bib ]
A. Jose, D. Haak, S. M. Jonas, V. Brandenburg, and T. M. Deserno, “Towards standardized wound imaging,” in Bildverarbeitung für die Medizin 2015, pp. 269–274, Springer, 2015. [ bib ]
A. Jose, D. Haak, S. Jonas, V. Brandenburg, and T. M. Deserno, “Human wound photogrammetry with low-cost hardware based on automatic calibration of geometry and color,” in Medical Imaging 2015: Computer-Aided Diagnosis, vol. 9414, p. 94143J, 2015. [ bib ]
T. M. Deserno, I. Sárándi, A. Jose, D. Haak, S. Jonas, P. Specht, and V. Brandenburg, “Towards quantitative assessment of calciphylaxis,” in Medical Imaging 2014: Computer-Aided Diagnosis, vol. 9035, p. 90353C, 2014. [ bib ]
A. Jose and C. S. Seelamantula, “Bilateral edge detectors,” in Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing ICASSP '13, pp. 1449–1453, 2013. [ bib ]
A. Jose, S. R. Krishnan, and C. S. Seelamantula, “Ridge detection using savitzky-golay filtering and steerable second-order gaussian derivatives,” in Proc. of IEEE International Conference on Image Processing ICIP '13, pp. 3059–3063, 2013. [ bib ]
NOTICE FOR IEEE PUBLICATIONS: © IEEE. Personal use of this material is permitted. However, permission to reprint/republish this material for advertising or promotional purposes or for creating new collective works for resale or redistribution to servers or lists, or to reuse any copyrighted component of this work in other works, must be obtained from the IEEE. Contact: Manager, Copyrights and Permissions / IEEE Service Center / 445 Hoes Lane / P.O. Box 1331 / Piscataway, NJ 08855-1331, USA. Telephone: + Intl. 908-562-3966.