Αυτόνομοι πράκτορες

Κωδικός μαθήματος
αυτ-πρα
Μονάδες ECTS
5
Εξάμηνο
Εξάμηνο Ζ
Κατηγορία μαθήματος

Μαθήματα Κατεύθυνσης

Μαθήματα Κατεύθυνσης

Κατεύθυνση
Επιλογής Κατεύθυνσης Πληροφορικής
Περιγραφή μαθήματος
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Περιεχόμενα: Το μάθημα εισάγει τους φοιτητές στην έννοια του αυτόνομου πράκτορα, μιας οντότητας που αντιλαμβάνεται το περιβάλλον της, σκέφτεται και δρα βάσει παρατηρήσεων και στόχων. Ιδιαίτερη έμφαση δίνεται στην πρακτική υλοποίηση πρακτόρων με ενισχυτική μάθηση (Reinforcement Learning) και τη χρήση σύγχρονων τεχνολογιών. Το μάθημα καλύπτει τόσο θεωρητικές αρχές όσο και πρακτικές εφαρμογές σε διάφορα περιβάλλοντα, όπως web agents, video games και ρομποτική, εξοικειώνοντας τους φοιτητές με εργαλεία ανάπτυξης και πειραματισμού.

ΜΑΘΗΣΙΑΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ

Στο τέλος του μαθήματος ο φοιτητής θα μπορεί να:

  • Περιγράφει το θεωρητικό πλαίσιο και τα βασικά στοιχεία λειτουργίας αυτόνομων πρακτόρων.
  • Αναλύει τη διαδικασία Παρατήρησης–Σκέψης–Δράσης σε διαφορετικά περιβάλλοντα.
  • Υλοποιεί πράκτορες με χρήση ενισχυτικής μάθησης και βασικών αλγορίθμων RL όπως Q-Learning και PPO.
  • Χρησιμοποιεί σύγχρονα εργαλεία και περιβάλλοντα ανάπτυξης πρακτόρων.
  • Ενσωματώνει Large Language Models (LLMs) και APIs στη λειτουργία πρακτόρων σε σύνθετα σενάρια.
ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ

Αξιολόγηση: Η αξιολόγηση του μαθήματος βασίζεται σε εργασίες μικρής έκτασης ή/και εξέταση προόδου κατά τη διάρκεια του εξαμήνου, με συνολική βαρύτητα έως 40%. Η τελική εργασία εξαμήνου (κώδικας και τεχνική αναφορά) αντιστοιχεί σε 60%. Τα ποσοστά ενδέχεται να διαφοροποιούνται (μέχρι ±10%) από έτος σε έτος. Για την επιτυχία απαιτείται προβιβάσιμος βαθμός τόσο στην τελική εργασία όσο και στον συνολικό βαθμό. Οι εργασίες ενδέχεται να συνοδεύονται από προφορική εξέταση.

Μέθοδοι αξιολόγησης: Ερωτήσεις σύντομης απάντησης, Ερωτήσεις πολλαπλής επιλογής, Επίλυση προβλημάτων, Γραπτή εργασία, Έκθεση/Αναφορά, Προφορική εξέταση, Εργαστηριακή εργασία.

URL ΜΑΘΗΜΑΤΟΣ ΣΤΟ ECLASS

-

ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ

Βιβλιογραφία: 

  1. I. Goodfellow, Y. Bengio, A. Courville, Βαθιά μάθηση, 1η έκδοση, Κλειδάριθμος, 2024. ISBN: 9789606454974. Κωδικός στον Εύδοξο: 122075017.
  2. P. Xiao, Προγραμματισμός Τεχνητής Νοημοσύνης με Python, 1η έκδοση, Γκιούρδας, 2024. ISBN: 9789605127633. Κωδικός στον Εύδοξο: 133025561.
  3. S. Russell, P. Norvig, Τεχνητή Νοημοσύνη: Μία σύγχρονη προσέγγιση, 4η έκδοση, Κλειδάριθμος, 2021. ISBN: 9789606451874. Κωδικός στον Εύδοξο: 102070469.
  4. R. Sutton, A. Barto, Reinforcement Learning: An Introduction, 2η έκδοση, MIT Press.
  5. Hugging Face – Deep Reinforcement Learning Course (https://huggingface.co/learn/deep-rl-course).
  6. Hugging Face – Agents Course (LLM-based agents) (https://huggingface.co/learn/agents-course/unit0/introduction).
  7. Περιβάλλοντα RL (https://gymnasium.farama.org/), Farama Foundation Gymnasium.
  8. Unity ML-Agents Toolkit (https://github.com/Unity-Technologies/ml-agents).