H τεχνητή νοημοσύνη της Google κάνει σκόνη το καλύτερο πρόγραμμα σκάκι

H τεχνητή νοημοσύνη της Google κάνει σκόνη το καλύτερο πρόγραμμα σκάκι

Ολόκληρη η γνώση του ανθρώπου στο σκάκι ξεπερνιέται από το AlphaZero του DeepMind σε τέσσερις ώρες

Το DeepMind, η τεχνητή νοημοσύνη της Google με το νέο όνομα AlphaZero ισοπέδωσε στην κυριολεξία το πιο δυνατό πρόγραμμα σκακιού στον κόσμο το Stockfish 8 χωρίς τη βοήθεια της ανθρώπινης γνώσης σε έναν μαραθώνιο 100 αγώνων.

Σε ένα νέο έγγραφο, οι ερευνητές της Google αναφέρουν λεπτομερώς πώς η πρόσφατη εξέλιξη του AlphaZero, ανέπτυξε «υπεράνθρωπες επιδόσεις» στο σκάκι, λαμβάνοντας μόλις τέσσερις ώρες εκπαίδευση για να μάθει τους κανόνες.

Με άλλα λόγια, το σύνολο των γνώσεων σκακιού της ανθρωπότητας - και όχι μόνο - απορροφήθηκε και ξεπεράστηκε σε περίπου όσο χρειάζεται για να ταξιδέψεις με το αυτοκίνητο από την Αθήνα στη Θεσσαλονίκη.

Το σύστημα της DeepMind δεν έχασε μάλιστα παρτίδα, κερδίζοντας ή φέρνοντας ισοπαλία στα 100 παιχνίδια στα οποία αναμετρήθηκαν. Το AlphaZero είναι μια τροποποιημένη εκδοχή του AlphaGo Zero, της τεχνητής νοημοσύνης που είχε κερδίσει κατά κράτος τον ανθρώπινο πρωταθλητή του πανδύσκολου κινέζικου παιχνιδιού.

Το AlphaZero, πέρα από το σκάκι, έμαθε εξίσου εύκολα και καλά άλλο ένα παρόμοιο ιαπωνικό επιτραπέζιο (shogi), υποδεικνύοντας με νόημα ότι μπορεί σε μια στιγμή να αποκτήσει υπεράνθρωπες υπολογιστικές και επεξεργαστικές δυνατότητες, χωρίς να έχει φτιαχτεί μάλιστα για τέτοιους σκοπούς.

«Το σκάκι άλλαξε για πάντα σήμερα», έγραψε στο Chess.com ο Mike Klein, «και μάλλον αυτό έκανε και ο υπόλοιπος κόσμος».

Ακόμα καλύτερα, το AlphaZero απέκτησε τη δεξιοτεχνία του στο σκάκι χωρίς βοήθεια, χωρίς να το τροφοδοτήσουν δηλαδή με δεδομένα παρτίδων και συστήματα. Ουσιαστικά απέκτησε την ανθρώπινη γνώση των 1.400 ετών του σκακιού σε μερικές μόνο ώρες, αν και δεν έμεινε εκεί, αφού σκάρωσε τις δικές του στρατηγικές νίκης.

Το AlphaZero έμαθε να παίζει μόνο του σκάκι, κι αυτό είναι ο μεγάλος τεχνολογικός θρίαμβος εδώ. Δεν έμαθε βέβαια απλά να παίζει, αλλά πώς να γίνει ο καλύτερος παίκτης! Και το έκανε σε μόνο τέσσερις ώρες. Και δεν το έκανε βασιζόμενο στην ωμή υπολογιστική δύναμη, καθώς το AlphaZero μπορεί να υπολογίζει 800.000 κινήσεις το δευτερόλεπτο, εκεί που το Stockfish 8 αγγίζει τα 70 εκατομμύρια κινήσεις.