Μπορεί μια μηχανή να γνωρίζει ότι γνωρίζουμε τι γνωρίζει;

Τετάρτη, 21-Ιουν-2023 00:05

Μπορεί μια μηχανή να γνωρίζει ότι γνωρίζουμε τι γνωρίζει;

Γράφει ο Oliver Whang

Το να διαβάζεις το μυαλό του άλλου είναι κάτι που γίνεται. Όχι με τον τρόπο που λένε οι γιατροί ότι το κάνουν: αποκτώντας πρόσβαση στη ροή της συνείδησης που προκύπτει από τις εμπειρίες κάθε ατόμου – ούτε με τον τρόπο που λένε τα μέντιουμ ότι το κάνουν: απομονώνοντας από το μυαλό σας μια σκέψη που εκείνοι επιλέγουν. Το να διαβάζεις το μυαλό του άλλου στην καθημερινότητα είναι πιο ραφιναρισμένη διαδικασία: παρατηρείς τα πρόσωπα και τις κινήσεις των ανθρώπων, τους ακούς να μιλάνε και έπειτα αποφασίζεις ή διαισθάνεσαι τι μπορεί να συμβαίνει στο κεφάλι τους.

Τη διαισθητική αυτή σκέψη –η δυνατότητα, δηλαδή, να αντιληφθούμε την ψυχολογική κατάσταση ενός άλλου ανθρώπου– οι ψυχολόγοι την ονομάζουν Θεωρία του Νου. Η έλλειψή της ή η ελαττωματικότητά της έχει συνδεθεί με τον αυτισμό, τη σχιζοφρένεια και άλλες αναπτυξιακές διαταραχές. Η Θεωρία του Νου μάς βοηθά να επικοινωνούμε και να καταλαβαίνουμε ο ένας τον άλλον∙ μας επιτρέπει να απολαμβάνουμε τη λογοτεχνία και τις κινηματογραφικές ταινίες, να παίζουμε και να κατανοούμε το κοινωνικό μας περιβάλλον. Με πολλούς τρόπους, η ικανότητα αυτή είναι θεμελιώδης για την ανθρώπινη φύση.

Μπορεί, όμως, και μια μηχανή να διαβάσει τη σκέψη; Προσφάτως ο Michal Kosinski, ψυχολόγος στο Stanford Graduate School of Business, υποστήριξε ακριβώς αυτή την άποψη: ότι μεγάλα γλωσσικά μοντέλα που ανέπτυξε το ερευνητικό εργαστήριο OpenAI, όπως τo ChatGPT και το GPT-4, μηχανές που προβλέπουν την επόμενη λέξη και που έχουν εκπαιδευθεί πάνω σε τεράστιο αριθμό κειμένων στο Διαδίκτυο, εφαρμόζουν τη Θεωρία του Νου. Τις μελέτες του δεν τις έχουν αποδεχθεί οι συνάδελφοί του, ωστόσο τα συμπεράσματά τους προβληματίζουν και αποτελούν θέμα συζήτησης στην κοινότητα της γνωστικής επιστήμης, η οποία προσπαθεί να απαντήσει στο ερώτημα που ακούγεται όλο και πιο συχνά τον τελευταίο καιρό, "Μπορεί το ChatGPT να διαβάσει τη σκέψη;", και να το θέσει στον πυρήνα της επιστημονικής έρευνας. Ποιες ικανότητες διαθέτουν αυτά τα μοντέλα και πώς μπορούν να αλλάξουν την αντίληψη που έχουμε για το μυαλό μας;

Ο ψυχολόγος Michal Kosinski στο Stanford Graduate School of Business, στο Stanford της Καλιφόρνια, στις 28 Σεπτεμβρίου 2017. Ο Kosinski έχει υποστηρίξει ότι τα μεγάλα γλωσσικά μοντέλα έχουν αναπτύξει τη Θεωρία του Νου. Πολλοί ακαδημαϊκοί διαφωνούν.

Christie Hemm Klok/The New York Times

"Οι ψυχολόγοι δεν θα αποδέχονταν μια θεωρία για τις γνωστικές ικανότητες των παιδιών με βάση τις κωμικές καταστάσεις που προκύπτουν από την επικοινωνία μαζί τους – όπως συμβαίνει στην περίπτωση του ChatGPT", σημειώνει η Alison Gopnik, ψυχολόγος στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϊ και από τις πρώτες ερευνήτριες που ασχολήθηκαν με τη Θεωρία του Νου τη δεκαετία του 1980. "Πρέπει να κάνουμε λεπτομερείς και απαιτητικές δοκιμές".

Παλαιότερη έρευνα του Kosinski κατέδειξε ότι τα νευρωνικά δίκτυα που εκπαιδεύτηκαν να αναλύουν χαρακτηριστικά του προσώπου, όπως γωνίες, σχήμα μύτης και γκριμάτσες, μπορούσαν να προβλέψουν τις πολιτικές απόψεις και τον σεξουαλικό προσανατολισμό των ανθρώπων με εκπληκτική ακρίβεια (περίπου 72% στην πρώτη περίπτωση και γύρω στο 80% στη δεύτερη). Η πρόσφατη εργασία του Kosinski πάνω στα μεγάλα γλωσσικά μοντέλα χρησιμοποιεί τα κλασικά τεστ για τη Θεωρία του Νου που μετρούν την ικανότητα των παιδιών να πιστεύουν λάθος πράγματα για άλλους ανθρώπους.

Πολύ γνωστό παράδειγμα είναι το τεστ "Sally-Anne", όπου ένα κορίτσι, η Anne, παίρνει μια μπίλια από ένα καλάθι και τη βάζει σε ένα κουτί, την ώρα που το άλλο κορίτσι, η Sally, δεν κοιτάζει. Για να προβλέψει ο παρατηρητής πού θα ψάξει η Sally για την μπίλια, θα πρέπει να ασκήσει –σύμφωνα με τους ερευνητές– τη Θεωρία του Νου, δηλαδή να σκεφτεί ποια είναι η αντιληπτική ικανότητα της Sally, και να διαμορφώσει μια άποψη: η Sally δεν είδε την Anne να βάζει την μπίλια στο κουτί, επομένως εξακολουθεί να πιστεύει ότι η μπίλια βρίσκεται εκεί όπου την άφησε την τελευταία φορά: στο καλάθι.

Ο Kosinski παρουσίασε σε 10 μεγάλα γλωσσικά μοντέλα 40 διαφορετικές παραλλαγές τεστ για τη Θεωρία του Νου, όπως το "Sally-Anne", όπου ένα άτομο (η Sally) σχηματίζει μια εσφαλμένη πεποίθηση. Στη συνέχεια υπέβαλε στα μοντέλα ερωτήσεις σχετικά με αυτές τις καταστάσεις, αποσκοπώντας στο να διαπιστώσει εάν θα προέβλεπαν σωστά ή λανθασμένα τη συμπεριφορά των εμπλεκομένων. Διαπίστωσε ότι το GPT-3.5, που κυκλοφόρησε τον Νοέμβριο, εκτίμησε ορθά το 90% των περιπτώσεων και το GPT-4, που κυκλοφόρησε τον Μάρτιο, το 95%.

Συμπέρασμα; Οι μηχανές εφαρμόζουν τη Θεωρία του Νου. Όμως, λίγο μετά τη δημοσίευση αυτών των αποτελεσμάτων, ο Tomer Ullman, ψυχολόγος στο Πανεπιστήμιο του Χάρβαρντ, απάντησε με μια σειρά δικών του πειραμάτων, δείχνοντας ότι μικρές τροποποιήσεις στις ερωτήσεις μπορούσαν να αλλάξουν τελείως τις απαντήσεις που έδιναν ακόμα και τα πλέον εξελιγμένα γλωσσικά μοντέλα. Εάν ένα δοχείο περιγραφόταν ως διαφανές, οι μηχανές δεν μπορούσαν να συμπεράνουν ότι κάποιος μπορούσε να δει το περιεχόμενό του. Οι μηχανές δυσκολεύονταν να λάβουν υπόψη τη μαρτυρία των ανθρώπων σε τέτοιες καταστάσεις και μερικές φορές δεν μπορούσαν να κατανοήσουν εάν ένα αντικείμενο βρισκόταν μέσα στο δοχείο ή επάνω σε αυτό.

Ο Maarten Sap, επιστήμονας Πληροφορικής στο Πανεπιστήμιο Carnegie Mellon, πραγματοποίησε περισσότερα από 1.000 τεστ Θεωρίας του Νου σε μεγάλα γλωσσικά μοντέλα και διαπίστωσε ότι το ChatGPT και το GPT-4 εκτιμούσαν εσφαλμένα τη συμπεριφορά των ανθρώπων σε ποσοστό 70%. Το χάσμα μεταξύ αυτών των δεδομένων και των αποτελεσμάτων του Kosinski θα μπορούσε να οφείλεται σε διαφορετικές παραμέτρους των τεστ, εντούτοις ο Sap επισήμανε ότι, ακόμα και εάν τα τεστ ήταν επιτυχημένα σε ποσοστό άνω του 95%, αυτό δεν θα ήταν απόδειξη ότι οι μηχανές εφαρμόζουν τη Θεωρία του Νου. Οι μηχανές συνήθως αποτυγχάνουν με συγκεκριμένο τρόπο: αδυνατούν να λειτουργήσουν με αφηρημένη λογική και συχνά "κάνουν εσφαλμένους συσχετισμούς", είπε ο Sap.

Ο Ullman τόνισε ότι οι ερευνητές που μελετούν τη μηχανική μάθηση προσπαθούν εδώ και δύο δεκαετίες να "αποθηκεύσουν" την ευελιξία της ανθρώπινης γνώσης σε μοντέλα υπολογιστών. Αυτή η "σκιά", ανέφερε ο ίδιος χαρακτηριστικά, ακολουθεί κάθε συναρπαστική καινοτομία. Οι ερευνητές έχουν καταδείξει ότι τα γλωσσικά μοντέλα συχνά δίνουν εσφαλμένες ή άσχετες απαντήσεις όταν δέχονται περιττές πληροφορίες προτού τεθεί το ερώτημα∙ ορισμένα chatbots αποσυντονίστηκαν τόσο πολύ από εικονικούς διαλόγους για πουλιά που μιλούν, ώστε εντέλει υποστήριξαν ότι τα πουλιά έχουν την ικανότητα ομιλίας. Η συλλογιστική τους είναι ευαίσθητη σε μικρές αλλαγές κατά την εισαγωγή δεδομένων· έτσι, οι επιστήμονες  έχουν χαρακτηρίσει τη γνώση αυτών των μηχανών ως "ψαθυρή".

Η Gopnik συνέκρινε τη Θεωρία του Νου στα μεγάλα γλωσσικά μοντέλα με τη δική της αντιληπτική ικανότητα περί της σχετικότητας. "Έχω διαβάσει αρκετά ώστε να ξέρω ποιες είναι οι σωστές λέξεις", σχολίασε. "Παρ’ όλα αυτά, εάν μου ζητούσατε να κάνω μια νέα πρόβλεψη ή να εξηγήσω τι μας λέει η θεωρία του Αϊνστάιν για ένα νέο φαινόμενο, θα βρισκόμουν σε αδιέξοδο, διότι στην πραγματικότητα δεν έχω τη θεωρία στο μυαλό μου". Αντιθέτως, συνέχισε, η Θεωρία του Νου στον άνθρωπο συνδέεται με άλλους μηχανισμούς της κοινής λογικής∙ και αυτό φαίνεται σε κάθε έλεγχο.

Σε γενικές γραμμές, το έργο του Kosinski και οι αντιδράσεις που αυτό προκαλεί αποτελούν μέρος μιας γενικότερης συζήτησης σχετικά με το εάν οι δυνατότητες αυτών των μηχανών μπορούν να συγκριθούν με τις ικανότητες του ανθρώπου – συζήτηση η οποία διχάζει τους ερευνητές που ασχολούνται με την επεξεργασία της φυσικής γλώσσας. Τι είναι τελικά αυτές οι μηχανές; "Παπαγαλάκια", εξωγήινοι ή φαρσέρ; Σε μια έρευνα που πραγματοποιήθηκε το 2022, από τους 480 ερευνητές που συμμετείχαν, το 51% απάντησε ότι τα μεγάλα γλωσσικά μοντέλα θα μπορούσαν τελικά να "κατανοήσουν τη φυσική γλώσσα με κάποιον ουσιαστικό τρόπο" και το 49% ότι "δεν θα την κατανοήσουν ποτέ".

Ο Ullman δεν αποκλείει την πιθανότητα οι μηχανές να κατανοούν ή να εφαρμόζουν τη Θεωρία του Νου, ωστόσο είναι επιφυλακτικός στο να αποδώσει ανθρώπινες ιδιότητες σε μη ανθρώπινα όντα. Παραπέμπει στην περίφημη έρευνα των Fritz Heider και Marianne Simmel του 1944, όπου οι συμμετέχοντες έβλεπαν μια ταινία κινουμένων σχεδίων με δύο τρίγωνα και έναν κύκλο να "πρωταγωνιστούν". Όταν τους ζητήθηκε να γράψουν τι γινόταν στην ταινία, σχεδόν όλοι αναφέρονταν στα σχήματα σαν να ήταν άνθρωποι. "Εραστές σε έναν δισδιάστατο κόσμο, αναμφίβολα∙ το τριγωνάκι και ο καλός κύκλος", έγραψε ένας από τους συμμετέχοντες. "Ο τρίγωνος (εφεξής και "ο κακός της ιστορίας") υπονομεύει την αγάπη των νέων. Αχ!"

Είναι φυσικό και συχνά κοινωνικά αναγκαίο να ερμηνεύουμε την ανθρώπινη συμπεριφορά βάσει πεποιθήσεων, επιθυμιών, επιδιώξεων και σκέψεων. Η ροπή αυτή είναι θεμελιώδης για την ανθρώπινη φύση· τόσο θεμελιώδης, που καμιά φορά προσπαθούμε να διαβάσουμε τη σκέψη οντοτήτων που δεν έχουν εγκέφαλο – ή, έστω, που δεν έχουν ανθρώπινο εγκέφαλο. 

Το άρθρο πρωτοδημοσιεύτηκε στους "The New York Times". 

© 2023 The New York Times Company