Επεξεργασία φυσικής γλώσσας

Κωδικός μαθήματος
επε-φυσ-γλω
Μονάδες ECTS
5
Εξάμηνο
Εξάμηνο Ζ
Κατηγορία μαθήματος

Μαθήματα Κατεύθυνσης

Μαθήματα Κατεύθυνσης

Κατεύθυνση
Επιλογής Κατεύθυνσης Πληροφορικής
Περιγραφή μαθήματος
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Περιεχόμενα: Το μάθημα εστιάζει σε μεθόδους υπολογιστικής επεξεργασίας φυσικής γλώσσας (Natural Language Processing - NLP), με έμφαση στη χρήση τεχνικών μηχανικής μάθησης και βαθιάς μάθησης. Οι φοιτητές θα γνωρίσουν την πλήρη πορεία μοντελοποίησης κειμένου: από την αναπαράσταση λέξεων με word embeddings, έως την κατανόηση προτάσεων και την παραγωγή γλώσσας μέσω μετασχηματιστικών μοντέλων (Transformers) και μεγάλων γλωσσικών μοντέλων (LLMs). Το μάθημα συνδυάζει θεωρητική κατάρτιση και πρακτική εφαρμογή, παρέχοντας επίσης κριτική ανάλυση ηθικών ζητημάτων στην επεξεργασία φυσικής γλώσσας.

ΜΑΘΗΣΙΑΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Στο τέλος του μαθήματος ο φοιτητής θα μπορεί να:

  • Αναπαριστά λέξεις και φράσεις με χρήση count-based, distributed και contextual μοντέλων (π.χ. TF-IDF, Word2Vec, BERT).
  • Αναλύει και υλοποιεί βασικές τεχνικές μηχανικής μάθησης για επεξεργασία κειμένου (Naive Bayes, SVMs, νευρωνικά δίκτυα).
  • Εφαρμόζει και βελτιστοποιεί σύγχρονα μοντέλα Transformers (BERT, GPT) σε ποικιλία NLP tasks (classification, QA, summarization).
  • Αναπτύσσει εφαρμογές διαλόγου και παραγωγής κειμένου με χρήση μεγάλων γλωσσικών μοντέλων (LLMs).
  • Σχεδιάζει πολυτροπικές εφαρμογές συνδυάζοντας γλώσσα και εικόνα (π.χ. image captioning).
  • Εντοπίζει και αξιολογεί ηθικά ζητήματα που σχετίζονται με την επεξεργασία φυσικής γλώσσας και τη χρήση LLMs (προκαταλήψεις, παραπλανήσεις).
ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ

Αξιολόγηση: Η αξιολόγηση του μαθήματος βασίζεται σε εργασίες μικρής έκτασης ή/και εξέταση προόδου κατά τη διάρκεια του εξαμήνου, με συνολική βαρύτητα έως 40%. Η τελική εργασία εξαμήνου (κώδικας και τεχνική αναφορά) αντιστοιχεί σε 60%. Τα ποσοστά ενδέχεται να διαφοροποιούνται (μέχρι ±10%) από έτος σε έτος. Για την επιτυχία απαιτείται προβιβάσιμος βαθμός τόσο στην τελική εργασία όσο και στον συνολικό βαθμό. Οι εργασίες ενδέχεται να συνοδεύονται από προφορική εξέταση.

Μέθοδοι αξιολόγησης: Ερωτήσεις σύντομης απάντησης, Ερωτήσεις πολλαπλής επιλογής, Επίλυση προβλημάτων, Γραπτή εργασία, Έκθεση / Αναφορά, Προφορική εξέταση, Εργαστηριακή εργασία.

URL ΜΑΘΗΜΑΤΟΣ ΣΤΟ ECLASS

-

ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ

Βιβλιογραφία:

  1. I. Goodfellow, Y. Bengio, A. Courville, Βαθιά μάθηση, 1η έκδοση, Κλειδάριθμος, 2024. ISBN: 9789606454974. Κωδικός στον Εύδοξο: 122075017.
  2. P. Xiao, Προγραμματισμός Τεχνητής Νοημοσύνης με Python, 1η έκδοση, Γκιούρδας, 2024. ISBN: 9789605127633. Κωδικός στον Εύδοξο: 133025561.
  3. S. Russell, P. Norvig, Τεχνητή Νοημοσύνη: Μία σύγχρονη προσέγγιση, 4η έκδοση, Κλειδάριθμος, 2021. ISBN: 9789606451874. Κωδικός στον Εύδοξο: 102070469.
  4. D. Jurafsky, J. Martin, Speech and Language Processing, 3η έκδοση, Stanford University, 2024.
  5. J. Eisenstein, Natural Language Processing, MIT Press, 2019.
  6. D. Rao, B. McMahan, Natural Language Processing with PyTorch: Build Intelligent Language Applications Using Deep Learning, O’Reilly Media, 2019
  7. L. Tunstall, L. von Werra, T. Wolf, Natural Language Processing with Transformers: Building Language Applications with Hugging Face, O’Reilly Media, 2022.