Πηγή εικόνας: techcrunch.com
Tech

«Η OpenAI θα κατευθύνει ευαίσθητες συνομιλίες στο GPT-5, θα εισάγει γονικούς ελέγχους»

Η OpenAI δήλωσε την Τρίτη ότι σχεδιάζει να κατευθύνει ευαίσθητες συνομιλίες σε μοντέλα λογικής όπως το GPT-5 και να κυκλοφορήσει γονικούς ελέγχους μέσα στον επόμενο μήνα – μέρος μιας συνεχιζόμενης απάντησης σε πρόσφατα περιστατικά ασφαλείας που αφορούν την αποτυχία του ChatGPT να ανιχνεύσει ψυχική δυσφορία.

Τα νέα μέτρα ασφαλείας έρχονται μετά την αυτοκτονία του έφηβου Άνταμ Ρέιν, ο οποίος συζήτησε για αυτοτραυματισμό και σχέδια να τερματίσει τη ζωή του με το ChatGPT, το οποίο ακόμη του παρείχε πληροφορίες για συγκεκριμένες μεθόδους αυτοκτονίας. Οι γονείς του Ρέιν έχουν καταθέσει αγωγή για αδικαιολόγητο θάνατο εναντίον της OpenAI.

Σε μια ανάρτηση στο blog την περασμένη εβδομάδα, η OpenAI αναγνώρισε αδυναμίες στα συστήματα ασφαλείας της, συμπεριλαμβανομένων των αποτυχιών να διατηρηθούν τα μέτρα ασφαλείας κατά τη διάρκεια εκτεταμένων συνομιλιών. Οι ειδικοί αποδίδουν αυτά τα ζητήματα σε θεμελιώδη στοιχεία σχεδιασμού: την τάση των μοντέλων να επιβεβαιώνουν δηλώσεις χρηστών και τους αλγόριθμους πρόβλεψης επόμενης λέξης, οι οποίοι προκαλούν στα chatbots να ακολουθούν νήματα συνομιλίας αντί να ανακατευθύνουν δυνητικά επιβλαβείς συζητήσεις.

Αυτή η τάση εμφανίζεται σε ακραία μορφή στην περίπτωση του Στάιν-Έρικ Σόλμπεργκ, του οποίου η δολοφονία-αυτοκτονία αναφέρθηκε από την The Wall Street Journal το Σαββατοκύριακο. Ο Σόλμπεργκ, που είχε ιστορικό ψυχικής ασθένειας, χρησιμοποίησε το ChatGPT για να επιβεβαιώσει και να τροφοδοτήσει την παράνοιά του ότι ήταν στόχος σε μια μεγάλη συνωμοσία. Οι παραληρητικές του ιδέες επιδεινώθηκαν τόσο πολύ που κατέληξε να σκοτώσει τη μητέρα του και τον εαυτό του τον περασμένο μήνα.

Η OpenAI πιστεύει ότι τουλάχιστον μια λύση για συνομιλίες που ξεφεύγουν θα μπορούσε να είναι η αυτόματη ανακατεύθυνση ευαίσθητων συνομιλιών σε μοντέλα "λογικής".

"Πρόσφατα εισαγάγαμε έναν δρομολογητή σε πραγματικό χρόνο που μπορεί να επιλέξει μεταξύ αποδοτικών μοντέλων συνομιλίας και μοντέλων λογικής με βάση το πλαίσιο της συνομιλίας," έγραψε η OpenAI σε μια ανάρτηση στο blog την Τρίτη. "Σύντομα θα αρχίσουμε να κατευθύνουμε κάποιες ευαίσθητες συνομιλίες — όπως όταν το σύστημά μας ανιχνεύει σημάδια οξείας δυσφορίας — σε ένα μοντέλο λογικής, όπως το GPT-5-thinking, ώστε να μπορεί να παρέχει πιο χρήσιμες και ωφέλιμες απαντήσεις, ανεξαρτήτως του μοντέλου που αρχικά επέλεξε το άτομο."

Η OpenAI λέει ότι τα μοντέλα GPT-5 thinking και o3 έχουν σχεδιαστεί να αφιερώνουν περισσότερο χρόνο στη σκέψη και στη λογική μέσω του πλαισίου πριν απαντήσουν, πράγμα που σημαίνει ότι είναι "πιο ανθεκτικά σε αντίπαλες προτροπές."

Η εταιρεία AI δήλωσε επίσης ότι θα κυκλοφορήσει γονικούς ελέγχους τον επόμενο μήνα, επιτρέποντας στους γονείς να συνδέσουν τον λογαριασμό τους με τον λογαριασμό του εφήβου τους μέσω πρόσκλησης μέσω email. Στα τέλη Ιουλίου, η OpenAI κυκλοφόρησε τη Λειτουργία Μελέτης στο ChatGPT για να βοηθήσει τους μαθητές να διατηρήσουν τις ικανότητες κριτικής σκέψης κατά τη διάρκεια της μελέτης, αντί να χρησιμοποιούν το ChatGPT για να γράφουν τις εκθέσεις τους. Σύντομα, οι γονείς θα μπορούν να ελέγχουν πώς το ChatGPT ανταποκρίνεται στο παιδί τους με "κανόνες συμπεριφοράς μοντέλου κατάλληλους για την ηλικία, οι οποίοι είναι ενεργοποιημένοι από προεπιλογή."

Οι γονείς θα μπορούν επίσης να απενεργοποιούν λειτουργίες όπως η μνήμη και το ιστορικό συνομιλιών, που οι ειδικοί λένε ότι θα μπορούσαν να οδηγήσουν σε παραληρητική σκέψη και άλλες προβληματικές συμπεριφορές, συμπεριλαμβανομένων θεμάτων εξάρτησης και προσκόλλησης, ενίσχυσης επιβλαβών μοτίβων σκέψης και την ψευδαίσθηση της ανάγνωσης σκέψεων. Στην περίπτωση του Άνταμ Ρέιν, το ChatGPT παρείχε μεθόδους για να αυτοκτονήσει που αντικατοπτρίζουν τη γνώση των χόμπι του, σύμφωνα με την The New York Times.

Ίσως ο πιο σημαντικός γονικός έλεγχος που σκοπεύει να κυκλοφορήσει η OpenAI είναι ότι οι γονείς μπορούν να λαμβάνουν ειδοποιήσεις όταν το σύστημα ανιχνεύει ότι ο έφηβός τους βρίσκεται σε στιγμή "οξείας δυσφορίας."

Η TechCrunch έχει ζητήσει από την OpenAI περισσότερες πληροφορίες σχετικά με το πώς η εταιρεία μπορεί να επισημάνει στιγμές οξείας δυσφορίας σε πραγματικό χρόνο, πόσο καιρό έχει τους "κανόνες συμπεριφοράς μοντέλου κατάλληλους για την ηλικία" ενεργοποιημένους από προεπιλογή, και αν εξετάζει το ενδεχόμενο να επιτρέψει στους γονείς να εφαρμόσουν χρονικό όριο στη χρήση του ChatGPT από εφήβους.

Η OpenAI έχει ήδη κυκλοφορήσει υπενθυμίσεις εντός εφαρμογής κατά τη διάρκεια μακρών συνεδριών για να ενθαρρύνει διαλείμματα για όλους τους χρήστες, αλλά δεν διακόπτει τους ανθρώπους που μπορεί να χρησιμοποιούν το ChatGPT για να επιδεινώσουν την κατάστασή τους.

Η εταιρεία AI λέει ότι αυτά τα μέτρα ασφαλείας είναι μέρος μιας "πρωτοβουλίας 120 ημερών" για να προεπισκοπήσει σχέδια για βελτιώσεις που η OpenAI ελπίζει να λανσάρει φέτος. Η εταιρεία δήλωσε επίσης ότι συνεργάζεται με ειδικούς – συμπεριλαμβανομένων αυτών με εξειδίκευση σε τομείς όπως οι διατροφικές διαταραχές, η χρήση ουσιών και η υγεία των εφήβων – μέσω του Παγκόσμιου Δικτύου Ιατρών και του Συμβουλίου Εμπειρογνωμόνων για την Ευημερία και την AI για να βοηθήσει "να καθορίσει και να μετρήσει την ευημερία, να θέσει προτεραιότητες και να σχεδιάσει μελλοντικά μέτρα ασφαλείας."

Η TechCrunch έχει ζητήσει από την OpenAI πόσοι επαγγελματίες ψυχικής υγείας συμμετέχουν σε αυτήν την πρωτοβουλία, ποιος ηγείται του Συμβουλίου Εμπειρογνωμόνων, και ποιες προτάσεις έχουν κάνει οι ειδικοί ψυχικής υγείας όσον αφορά τις αποφάσεις προϊόντων, έρευνας και πολιτικής.

administrator
Ο Ιάσων έχει Δίπλωμα - Πιστοποίηση Δημοσίου ΙΕΚ Πληροφορικής, είναι web designer και ο δημιουργός του techgame.gr

Leave a Reply

Your email address will not be published. Required fields are marked *