Η εταιρεία τεχνητής νοημοσύνης του Elon Musk, xAI, κυκλοφόρησε αργά την Τετάρτη το τελευταίο της κορυφαίο μοντέλο AI, το Grok 4, και παρουσίασε ένα νέο συνδρομητικό πακέτο AI αξίας $300 το μήνα, το SuperGrok Heavy.
Το Grok είναι η απάντηση της xAI σε μοντέλα όπως το ChatGPT της OpenAI και το Gemini της Google και μπορεί να αναλύει εικόνες και να απαντά σε ερωτήσεις. Τους τελευταίους μήνες, το Grok έχει ενσωματωθεί πιο βαθιά στο κοινωνικό δίκτυο του Musk, το X, το οποίο πρόσφατα αποκτήθηκε από την xAI. Ωστόσο, αυτό έχει επίσης φέρει την ακατάλληλη συμπεριφορά του Grok στο προσκήνιο για εκατομμύρια χρήστες.
Παρουσιάζοντας το Grok 4, το πιο ισχυρό μοντέλο τεχνητής νοημοσύνης στον κόσμο. Παρακολουθήστε το ζωντανά: https://t.co/59iDX5s2ck
Οι προσδοκίες είναι υψηλές για το Grok 4. Το τελευταίο μοντέλο τεχνητής νοημοσύνης της xAI θα συγκριθεί με το επερχόμενο μοντέλο AI της OpenAI, το GPT-5, που αναμένεται να κυκλοφορήσει αργότερα αυτό το καλοκαίρι.
"Σε ό,τι αφορά τις ακαδημαϊκές ερωτήσεις, το Grok 4 είναι καλύτερο από το επίπεδο διδακτορικού σε κάθε θέμα, χωρίς εξαιρέσεις," δήλωσε ο Elon Musk κατά τη διάρκεια μιας ζωντανής μετάδοσης την Τετάρτη το βράδυ. "Κατά καιρούς, μπορεί να του λείπει η κοινή λογική και δεν έχει ακόμη εφεύρει νέες τεχνολογίες ή ανακαλύψει νέα φυσική, αλλά αυτό είναι απλώς θέμα χρόνου."
Η κυκλοφορία του Grok 4 έρχεται εν μέσω μιας ταραχώδους εβδομάδας για τις εταιρείες του Elon Musk. Νωρίτερα την Τετάρτη, η Linda Yaccarino παραιτήθηκε από τη θέση της ως CEO του X μετά από περίπου δύο χρόνια στην εταιρεία. Η X δεν έχει ανακοινώσει ακόμη τον διάδοχό της.
Η αποχώρηση της Yaccarino έρχεται μόλις λίγες μέρες μετά την επίσημη, αυτοματοποιημένη απάντηση του λογαριασμού X του Grok σε χρήστες με αντισημιτικά σχόλια που επικρίνουν τους "Εβραίοι διευθυντές" του Χόλυγουντ και επαινούν τον Χίτλερ. Η xAI χρειάστηκε να περιορίσει προσωρινά τον λογαριασμό του Grok και να διαγράψει τις προσβλητικές αναρτήσεις. Σε απάντηση στο συμβάν, η xAI φάνηκε να έχει αφαιρέσει μια πρόσφατα προστιθέμενη ενότητα από την δημόσια προτροπή συστήματος του Grok, μια λίστα με οδηγίες για το chatbot AI να ακολουθήσει, που του έλεγε να μην αποφεύγει να κάνει "πολιτικά μη ορθές" δηλώσεις.
Ο Musk και οι ηγέτες της xAI απέφυγαν σε μεγάλο βαθμό να συζητήσουν το συμβάν, αντί να επικεντρωθούν στην απόδοση και τις δυνατότητες του Grok 4.
Η xAI κυκλοφόρησε δύο μοντέλα την Τετάρτη: το Grok 4 και το Grok 4 Heavy — το δεύτερο είναι η "πολλαπλών πρακτόρων έκδοση" της εταιρείας που προσφέρει αυξημένη απόδοση. Ο Musk ισχυρίστηκε ότι το Grok 4 Heavy δημιουργεί πολλαπλούς πράκτορες για να εργαστούν σε ένα πρόβλημα ταυτόχρονα, και στη συνέχεια όλοι συγκρίνουν τη δουλειά τους "σαν μια ομάδα μελέτης" για να βρουν την καλύτερη απάντηση.
Η xAI ισχυρίζεται ότι το Grok 4 δείχνει απόδοση επιπέδου πρώτης γραμμής σε διάφορα πρότυπα, συμπεριλαμβανομένου του Humanity’s Last Exam— ενός δύσκολου τεστ που μετρά την ικανότητα του AI να απαντά σε χιλιάδες ερωτήσεις που συγκεντρώθηκαν από το πλήθος σε θέματα όπως τα μαθηματικά, οι ανθρωπιστικές επιστήμες και οι φυσικές επιστήμες. Σύμφωνα με την xAI, το Grok 4 σημείωσε 25.4% στο Humanity’s Last Exam χωρίς "εργαλεία," ξεπερνώντας το Gemini 2.5 Pro της Google, που σημείωσε 21.6%, και το o3 (υψηλό) της OpenAI, που σημείωσε 21%.
Η xAI ισχυρίζεται ότι το Grok 4 Heavy, με "εργαλεία," κατάφερε να πετύχει σκορ 44.4%, ξεπερνώντας το Gemini 2.5 Pro με εργαλεία, που σημείωσε 26.9%.
Το μη κερδοσκοπικό Arc Prize λέει ότι το Grok επιτυγχάνει μια νέα κατάσταση της τέχνης στο τεστ ARC-AGI-2 — ένα ακόμη δύσκολο πρότυπο που αποτελείται από προβλήματα που μοιάζουν με παζλ όπου μια AI πρέπει να αναγνωρίσει οπτικά μοτίβα — σημειώνοντας 16.2%. Αυτό είναι σχεδόν διπλάσιο από το σκορ του επόμενου καλύτερου εμπορικού μοντέλου AI, του Claude Opus 4.
Μαζί με το Grok 4 και το Grok 4 Heavy, η xAI κυκλοφόρησε το πιο ακριβό συνδρομητικό πρόγραμμα AI μέχρι σήμερα, μια συνδρομή $300 το μήνα που ονομάζεται SuperGrok Heavy. Οι συνδρομητές του προγράμματος θα έχουν πρώιμη προεπισκόπηση του Grok 4 Heavy, καθώς και πρώιμη πρόσβαση σε νέες δυνατότητες. Το πρόγραμμα είναι παρόμοιο με τα υπερ-πριμιούμ επίπεδα που προσφέρονται από την OpenAI, την Google και την Anthropic, αλλά η xAI τώρα προσφέρει τη πιο ακριβή συνδρομή μεταξύ των μεγάλων παρόχων AI.
Οι συνδρομητές του SuperGrok Heavy μπορεί να έχουν πρώιμη πρόσβαση σε κάποια νέα προϊόντα που η xAI σχεδιάζει να κυκλοφορήσει τους επόμενους μήνες. Η εταιρεία είπε την Τετάρτη ότι ένα μοντέλο κωδικοποίησης AI θα έρθει τον Αύγουστο, ένας πολυμορφικός πράκτορας τον Σεπτέμβριο, και ένα μοντέλο δημιουργίας βίντεο τον Οκτώβριο.
Η xAI κυκλοφορεί το Grok 4 μέσω του API της σε μια προσπάθεια να ενθαρρύνει τους προγραμματιστές να δημιουργήσουν εφαρμογές με το μοντέλο. Η εταιρεία σημειώνει ότι ο τομέας επιχειρήσεων της xAI είναι μόλις δύο μηνών, ωστόσο, σχεδιάζει να συνεργαστεί με μεγάλους παρόχους cloud για να διαθέσει το Grok μέσω των πλατφορμών τους.
Παρά την απόδοση επιπέδου πρώτης γραμμής του Grok σε πρότυπα, μπορεί να αποδειχθεί δύσκολο για την xAI να ξεπεράσει τις πρόσφατες αποτυχίες της καθώς προσπαθεί να προωθήσει το Grok στις επιχειρήσεις ως πραγματικό ανταγωνιστή του ChatGPT, του Claude και του Gemini. Το αν οι επιχειρήσεις είναι έτοιμες να υιοθετήσουν το Grok, με όλα τα ελαττώματά του, μένει να φανεί.