Τεχνητή Νοημοσύνη είναι ο κλάδος της επιστήμης υπολογιστών όπου προσπαθούμε
να κάνουμε τους υπολογιστές να συμπεριφερθούν σαν νοήμονα όντα.
Βασική λειτουργία των νοημόνων όντων είναι η μάθηση.
Με τον όρο μάθηση εννοούμε την βελτίωση της συμπεριφοράς με την απόκτηση πείρας.
Η μηχανική μάθηση είναι η περιοχή της τεχνητής νοημοσύνης όπου ασχολούμαστε με αλγορίθμους και μεθόδους που επιτρέπουν σε υπολογιστικά συστήματα να βελτιώνουν τη συμπεριφορά τους με
την απόκτηση γνώσης. (Mitchell, 1997).
Οι αλγόριθμοι μηχανικής μάθησης κατηγοριοποιούνται ανάλογα με το επιθυμητό αποτέλεσμα του αλγορίθμου.
- Μάθηση με Επίβλεψη (Supervised Learning): Είναι η κλασική προσέγγιση του προβλήματος της μηχανικής μάθησης. Ο αλγόριθμος κατασκευάζει μια συνάρτηση που απεικονίζει δεδομένες εισόδους σε γνωστές, επιθυμητές εξόδους (σύνολο εκπαίδευσης, υποδείγματα). Ο στόχος είναι η γενίκευση της συνάρτησης και για εισόδους με άγνωστη έξοδο.
- Μάθηση χωρίς Επίβλεψη (Unsupervised Learning). Ο αλγόριθμος κατασκευάζει ένα μοντέλο για κάποιο σύνολο εισόδων χωρίς να γνωρίζει επιθυμητές εξόδους για το σύνολο εκπαίδευσης.
- Ενισχυτική Μάθηση (Reinforcement Learning). Εδώ το σύστημα μας λειτουργεί με σκοπό να πετύχει έναν στόχο. Σαν καθοδήγηση στην αναζήτηση αυτή δεν έχει έναν άμεσο οδηγό όπως τα υποδείγματα στη μάθηση με επίβλεψη αλλά καθοδηγείται από "ανταμοιβές" και "τιμωρίες" που δέχεται ανάλογα με το αν οι ενέργειες του το φέρνουν πιο κοντά στη λύση ή όχι (Sutton & Barto, 1998). Σκοπός είναι να μεγιστοποιηθούν οι ανταμοιβές μακροπρόθεσμα. Τα αποτελέσματα των ενεργειών φαίνονται στο τέλος της διαδικασίας και γι αυτό η μέθοδος αυτή ονομάζεται και "μάθηση με καθυστέρηση" (Delayed Learning). Λειτουργεί σε καταστάσεις που ο στόχος είναι μακροπρόθεσμος σε ευμετάβλητα περιβάλλοντα και σε περιβάλλοντα για τα οποία έχουμε περιορισμένες πληροφορίες. Εφαρμογές βρίσκει στη ρομποτική, στα παιχνίδια κ.α.
Πηγή: Νικολαΐδης, Σ. (2012). Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη, 6ο Πανελλήνιο Συνέδριο «Διδακτική της Πληροφορικής»
Mitchell, T. (1997). Machine Learning, McGraw Hill.
Sutton R.S. & Barto A.G. (1998), Reinforcement Learning, MIT Press