Υπολογιστική όραση

Κωδικός μαθήματος
υπο-ορα
Μονάδες ECTS
5
Εξάμηνο
Εξάμηνο Ε
Κατηγορία μαθήματος

Μαθήματα Κατεύθυνσης

Μαθήματα Κατεύθυνσης

Κατεύθυνση
Επιλογής Κατεύθυνσης Πληροφορικής
Περιγραφή μαθήματος
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Περιεχόμενα: Το μάθημα εισάγει τους φοιτητές στις βασικές έννοιες και εφαρμογές της Υπολογιστικής Όρασης, με έμφαση στις τεχνικές βαθιάς μάθησης (Deep Learning). Εξετάζεται πώς οι υπολογιστές μπορούν να αντιλαμβάνονται και να ερμηνεύουν τον οπτικό κόσμο μέσω σύγχρονων μεθόδων, όπως τα συνελικτικά νευρωνικά δίκτυα (CNNs), τα vision transformers και τα παραγωγικά μοντέλα (VAEs, Diffusion). Ιδιαίτερη έμφαση δίνεται στην ανάπτυξη εφαρμογών που συνδυάζουν κατανόηση, δημιουργία και αλληλεπίδραση με οπτικά δεδομένα, καθώς και σε πολυτροπικές εφαρμογές που συνδυάζουν εικόνα και φυσική γλώσσα (π.χ. CLIP).

ΜΑΘΗΣΙΑΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Στο τέλος του μαθήματος ο φοιτητής θα μπορεί να:

  • Περιγράφει τις βασικές αρχές, τα προβλήματα και τις εφαρμογές της υπολογιστικής όρασης.
  • Αναλύει και υλοποιεί συνελικτικά νευρωνικά δίκτυα (CNNs) και Vision Transformers για επεξεργασία εικόνας.
  • Εφαρμόζει τεχνικές transfer learning για ταξινόμηση εικόνας, ανίχνευση αντικειμένων και segmentation
  • Αναπτύσσει και αξιολογεί βασικά generative μοντέλα, όπως Variational Autoencoders (VAEs) και Diffusion Models
  • Συνδυάζει οπτικά και γλωσσικά δεδομένα σε πολυτροπικές εφαρμογές με χρήση μοντέλων όπως το CLIP
  • Ενσωματώνει υπολογιστική όραση σε πρακτικές εφαρμογές.
ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ

Αξιολόγηση: Η αξιολόγηση του μαθήματος βασίζεται σε εργασίες μικρής έκτασης ή/και εξέταση προόδου κατά τη διάρκεια του εξαμήνου, με συνολική βαρύτητα έως 40%. Η τελική εργασία εξαμήνου (κώδικας και τεχνική αναφορά) αντιστοιχεί σε 60%. Τα ποσοστά ενδέχεται να διαφοροποιούνται (μέχρι ±10%) από έτος σε έτος. Για την επιτυχία απαιτείται προβιβάσιμος βαθμός τόσο στην τελική εργασία όσο και στον συνολικό βαθμό. Οι εργασίες ενδέχεται να συνοδεύονται από προφορική εξέταση.

Μέθοδοι αξιολόγησης: Ερωτήσεις σύντομης απάντησης, Ερωτήσεις πολλαπλής επιλογής, Επίλυση προβλημάτων, Γραπτή εργασία, Έκθεση / Αναφορά, Προφορική εξέταση, Εργαστηριακή εργασία.

URL ΜΑΘΗΜΑΤΟΣ ΣΤΟ ECLASS

-

ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ

Βιβλιογραφία:

  1. R. Szeliski, Όραση υπολογιστών, 2η έκδοση, Φούντας, 2022. ISBN: 9789603308034. Κωδικός στον Εύδοξο: 112697690
  2. I. Goodfellow, Y. Bengio, A. Courville, Βαθιά μάθηση, 1η έκδοση, Κλειδάριθμος, 2024. ISBN: 9789606454974. Κωδικός στον Εύδοξο: 122075017.
  3. P. Xiao, Προγραμματισμός Τεχνητής Νοημοσύνης με Python, 1η έκδοση, Γκιούρδας, 2024. ISBN: 9789605127633. Κωδικός στον Εύδοξο: 133025561.
  4. V. Lakshmanan, M. Görner, R. Gillard, Practical Machine Learning for Computer Vision: End-to-End Machine Learning for Images, 1η έκδοση, O’ Reilly, 2021
  5. M. Elgendy, Deep Learning for Vision Systems, 1η έκδοση, Manning, 2020
  6. V. Ayyadevara, Y. Reddy, Modern Computer Vision with PyTorch: A practical roadmap from deep learning fundamentals to advanced applications and Generative AI, 2η έκδοση, Packt Publishing, 2024.