Η τεχνητή νοημοσύνη πηγαίνει στο DeepSeek

Μάικλ Ρόμπερτς 28 Ιανουαρίου 2025

AI going DeepSeek – Michael Roberts Blog

Οι περισσότεροι αναγνώστες θα γνωρίζουν τα νέα μέχρι τώρα. Η DeepSeek, μια κινεζική εταιρεία τεχνητής νοημοσύνης, κυκλοφόρησε ένα μοντέλο τεχνητής νοημοσύνης που ονομάζεται R1 και είναι συγκρίσιμο σε ικανότητα με τα καλύτερα μοντέλα εταιρειών όπως η OpenAI, η Anthropic και η Meta, αλλά εκπαιδεύτηκε με ριζικά χαμηλότερο κόστος και χρησιμοποιώντας λιγότερο από τα υπερσύγχρονα τσιπ GPU. Το DeepSeek δημοσιοποίησε επίσης αρκετά τις λεπτομέρειες του μοντέλου που άλλοι μπορούν να το εκτελέσουν στους δικούς τους υπολογιστές χωρίς χρέωση.

Το DeepSeek είναι μια τορπίλη που έπληξε τις Magnificent Seven αμερικανικές εταιρείες υψηλής τεχνολογίας κάτω από την ίσαλο γραμμή. Η DeepSeek δεν χρησιμοποίησε τα πιο πρόσφατα και καλύτερα τσιπ και λογισμικό της Nvidia, δεν απαιτούσε τεράστιες δαπάνες για την εκπαίδευση του μοντέλου τεχνητής νοημοσύνης σε αντίθεση με τους αμερικανούς αντιπάλους της. Και προσφέρει εξίσου πολλές χρήσιμες εφαρμογές.

Η DeepSeek κατασκεύασε το R1 της με τα παλαιότερα, πιο αργά τσιπ της Nvidia, τα οποία οι κυρώσεις των ΗΠΑ είχαν επιτρέψει να εξαχθούν στην Κίνα. Η κυβέρνηση των ΗΠΑ και οι τεχνολογικοί τιτάνες πίστευαν ότι είχαν το μονοπώλιο στην ανάπτυξη AI λόγω του τεράστιου κόστους που συνεπάγεται η κατασκευή καλύτερων τσιπ και μοντέλων AI. Αλλά τώρα το R1 της DeepSeek υποδηλώνει ότι οι εταιρείες με λιγότερα χρήματα μπορούν σύντομα να λειτουργήσουν ανταγωνιστικά μοντέλα AI. Το R1 μπορεί να χρησιμοποιηθεί με χαμηλό προϋπολογισμό και με πολύ λιγότερη υπολογιστική ισχύ. Επιπλέον, το R1 είναι εξίσου καλό με τους αντιπάλους στο «inference» (τσιπ υπολογισμών για μοντέλα AI), την ορολογία AI για όταν οι χρήστες ερωτούν το μοντέλο και λαμβάνουν απαντήσεις. Και τρέχει σε διακομιστές για όλα τα είδη εταιρειών, έτσι ώστε να μην χρειάζεται να «νοικιάζουν» σε τεράστιες τιμές από τους ομοίους του OpenAI.

Το πιο σημαντικό, το R1 του DeepSeek είναι «ανοιχτού κώδικα», δηλαδή οι μέθοδοι κωδικοποίησης και εκπαίδευσης είναι ανοιχτές σε όλους για αντιγραφή και ανάπτυξη. Αυτό είναι ένα πραγματικό πλήγμα στα «ιδιόκτητα» μυστικά που η OpenAI ή το Gemini της Google κλειδώνουν σε ένα «μαύρο κουτί» προκειμένου να μεγιστοποιήσουν τα κέρδη. Η αναλογία εδώ είναι με επώνυμα και γενόσημα φαρμακευτικά προϊόντα.

Το μεγάλο ζήτημα για τις αμερικανικές εταιρείες τεχνητής νοημοσύνης (ΑΙ) και τους επενδυτές τους είναι ότι φαίνεται ότι η κατασκευή τεράστιων κέντρων δεδομένων για τη στέγαση πολλαπλάσιων ακριβών τσιπ μπορεί να μην είναι απαραίτητη για την επίτευξη επαρκώς επιτυχημένων αποτελεσμάτων. Μέχρι τώρα, οι αμερικανικές εταιρείες έχουν επιταχύνει τεράστια σχέδια δαπανών και προσπαθούν να συγκεντρώσουν τεράστια ποσά χρηματοδότησης για να το πράξουν. Πράγματι, την ίδια τη Δευτέρα που το R1 του DeepSeek κυκλοφόρησε στις ειδήσεις, η Meta ανακοίνωσε άλλη μια επένδυση 65 δισεκατομμυρίων δολαρίων και μόλις λίγες ημέρες νωρίτερα ο πρόεδρος Trump ανακοίνωσε κυβερνητικές επιδοτήσεις ύψους 500 δισεκατομμυρίων δολαρίων στους τεχνολογικούς γίγαντες ως μέρος του λεγόμενου έργου Stargate. Κατά ειρωνικό τρόπο, ο διευθύνων σύμβουλος της Meta, Mark Zuckerberg, δήλωσε ότι επενδύει επειδή «θέλουμε οι ΗΠΑ να θέσουν το παγκόσμιο πρότυπο AI, όχι η Κίνα». Αμάν.

Τώρα οι επενδυτές ανησυχούν ότι αυτές οι δαπάνες είναι περιττές και, ακόμη περισσότερο, ότι θα πλήξουν την κερδοφορία των αμερικανικών εταιρειών εάν η DeepSeek μπορεί να προσφέρει εφαρμογές AI στο ένα δέκατο του κόστους. Πέντε από τις μεγαλύτερες μετοχές τεχνολογίας που προσανατολίζονται στην τεχνητή νοημοσύνη – η κατασκευάστρια τσιπ Nvidia και οι λεγόμενες «hyperscalers» Alphabet, Amazon, Microsoft και Meta Platforms – έχασαν συλλογικά σχεδόν 750 δισεκατομμύρια δολάρια από τη χρηματιστηριακή τους αξία σε μία ημέρα. Και η DeepSeek απειλεί τα κέρδη των εταιρειών κέντρων δεδομένων και των φορέων εκμετάλλευσης νερού και ηλεκτρικής ενέργειας που αναμένουν να επωφεληθούν από την τεράστια «κλιμάκωση» από τους Magnificent Seven. Η άνθηση του χρηματιστηρίου των ΗΠΑ συγκεντρώνεται σε μεγάλο βαθμό στο «Magnificent Seven».

Έχει λοιπόν η DeepSeek τρυπήσει την τεράστια χρηματιστηριακή φούσκα στις αμερικανικές τεχνολογικές μετοχές; Ο δισεκατομμυριούχος επενδυτής Ray Dalio το πιστεύει. Είπε στους Financial Times ότι «η τιμολόγηση έχει φτάσει σε επίπεδα που είναι υψηλά την ίδια στιγμή που υπάρχει κίνδυνος επιτοκίου και αυτός ο συνδυασμός θα μπορούσε να τρυπήσει τη φούσκα … Το πού βρισκόμαστε στον κύκλο αυτή τη στιγμή είναι πολύ παρόμοιο με το πού ήμασταν μεταξύ 1998 ή 1999. Με άλλα λόγια, υπάρχει μια σημαντική νέα τεχνολογία που σίγουρα θα αλλάξει τον κόσμο και θα είναι επιτυχής. Αλλά μερικοί άνθρωποι το συγχέουν αυτό με τις επιτυχημένες επενδύσεις».

Αλλά αυτό μπορεί να μην συμβαίνει, τουλάχιστον όχι ακόμα. Η τιμή της μετοχής της εταιρείας τσιπ AI Nvidia μπορεί να έχει βυθιστεί αυτή την εβδομάδα, αλλά η «ιδιόκτητη» γλώσσα κωδικοποίησης, Cuda, εξακολουθεί να είναι το βιομηχανικό πρότυπο των ΗΠΑ. Ενώ οι μετοχές της υποχώρησαν σχεδόν 17%, αυτό την επαναφέρει μόνο στο (πολύ, πολύ υψηλό) επίπεδο του Σεπτεμβρίου.

Πολλά θα εξαρτηθούν από άλλους παράγοντες, όπως η διατήρηση των υψηλών επιτοκίων από τη Fed λόγω της αντιστροφής της πτώσης του πληθωρισμού και από το αν ο Trump προχωρήσει σε μεγάλο βαθμό με τις απειλές του για δασμούς και μετανάστευση που θα τροφοδοτήσουν μόνο τον πληθωρισμό.

Αυτό που πρέπει να εξοργίσει τους τεχνολογικούς ολιγάρχες που απορροφούν τον Trump είναι ότι οι κυρώσεις των ΗΠΑ σε κινεζικές εταιρείες και οι απαγορεύσεις στις εξαγωγές τσιπ δεν εμπόδισαν την Κίνα να σημειώσει ακόμη μεγαλύτερη πρόοδο στον πόλεμο τεχνολογίας και τσιπ με τις ΗΠΑ. Η Κίνα καταφέρνει να κάνει τεχνολογικά άλματα στην τεχνητή νοημοσύνη παρά τους ελέγχους εξαγωγών που εισήγαγε η κυβέρνηση Μπάιντεν με σκοπό να της στερήσει τόσο τα πιο ισχυρά τσιπ όσο και τα προηγμένα εργαλεία που απαιτούνται για την κατασκευή τους.

Ο Κινέζος τεχνολογικός πρωταθλητής Huawei έχει αναδειχθεί ως ο κύριος ανταγωνιστής της Nvidia στην Κίνα για τσιπ «συμπερασμάτων». Και συνεργάζεται με εταιρείες AI, συμπεριλαμβανομένης της DeepSeek, για να προσαρμόσει μοντέλα εκπαιδευμένα σε GPU Nvidia ώστε να τρέξει inference στα τσιπ Ascend. «Η Huawei βελτιώνεται. Έχουν ένα άνοιγμα καθώς η κυβέρνηση λέει στις μεγάλες εταιρείες τεχνολογίας ότι πρέπει να αγοράσουν τα τσιπ τους και να τα χρησιμοποιήσουν για εξαγωγή συμπερασμάτων», δήλωσε ένας επενδυτής ημιαγωγών στο Πεκίνο.

Αυτή είναι μια περαιτέρω απόδειξη ότι οι κρατικές προγραμματισμένες επενδύσεις στην τεχνολογία και τις τεχνολογικές δεξιότητες από την Κίνα λειτουργούν πολύ καλύτερα από το να βασίζονται σε τεράστιους ιδιωτικούς τεχνολογικούς γίγαντες με επικεφαλής μεγιστάνες. Όπως είπε ο Ray Dallo: «Στο σύστημά μας, σε γενικές γραμμές, κινούμαστε προς μια πιο βιομηχανική-σύνθετη πολιτική στην οποία πρόκειται να υπάρξει κυβερνητική εντολή και επηρεασμένη από την κυβέρνηση δραστηριότητα, επειδή είναι τόσο σημαντική … Μόνο ο καπιταλισμός – μόνο το κίνητρο του κέρδους – δεν μπορεί να κερδίσει αυτή τη μάχη».

Παρ ‘όλα αυτά, οι τιτάνες AI δεν είναι ακόμη ο τιτανικός. Προχωρούν στην «κλιμάκωση» διοχετεύοντας όλο και περισσότερα δισεκατομμύρια σε κέντρα δεδομένων και πιο προηγμένα τσιπ. Αυτό τρώει την ισχύ του υπολογιστή εκθετικά.

Και φυσικά, δεν υπάρχει καμία μέριμνα για αυτό που οι κυρίαρχοι οικονομολόγοι ευγενικά αρέσκονται να αποκαλούν «εξωτερικές οικονομίες». Σύμφωνα με μια έκθεση της Goldman Sachs, ένα ερώτημα ChatGPT χρειάζεται σχεδόν 10 φορές περισσότερη ηλεκτρική ενέργεια από ένα ερώτημα αναζήτησης Google. Ο ερευνητής Jesse Dodge έκανε κάποια μαθηματικά σχετικά με την ποσότητα ενέργειας που χρησιμοποιούν τα chatbots AI. «Ένα ερώτημα στο ChatGPT χρησιμοποιεί περίπου τόση ηλεκτρική ενέργεια όση θα μπορούσε να ανάψει ένας λαμπτήρας για περίπου 20 λεπτά», λέει. «Έτσι, μπορείτε να φανταστείτε ότι με εκατομμύρια ανθρώπους να χρησιμοποιούν κάτι τέτοιο κάθε μέρα, αυτό προσθέτει μια πραγματικά μεγάλη ποσότητα ηλεκτρικής ενέργειας». Μεγαλύτερη κατανάλωση ηλεκτρικής ενέργειας σημαίνει μεγαλύτερη παραγωγή ενέργειας και ιδίως περισσότερες εκπομπές αερίων θερμοκηπίου από ορυκτά καύσιμα.

Η Google έχει ως στόχο την επίτευξη καθαρών μηδενικών εκπομπών έως το 2030. Από το 2007, η εταιρεία έχει δηλώσει ότι οι δραστηριότητές της ήταν ουδέτερες ως προς τον άνθρακα λόγω των αντισταθμίσεων άνθρακα που αγοράζει για να ταιριάζει με τις εκπομπές της. Όμως, από το 2023, η Google έγραψε στην έκθεση βιωσιμότητάς της ότι δεν «διατηρεί πλέον λειτουργική ουδετερότητα άνθρακα». Η εταιρεία λέει ότι εξακολουθεί να πιέζει για τον καθαρό μηδενικό στόχο της το 2030. “Το πραγματικό κίνητρο της Google εδώ είναι να δημιουργήσει τα καλύτερα συστήματα AI που μπορεί”, λέει ο Dodge . “Και είναι πρόθυμοι να ρίξουν έναν τόνο πόρων σε αυτό, συμπεριλαμβανομένων πραγμάτων όπως η εκπαίδευση συστημάτων AI σε όλο και μεγαλύτερα κέντρα δεδομένων μέχρι τους υπερυπολογιστές, οι οποίοι συνεπάγονται τεράστια κατανάλωση ηλεκτρικής ενέργειας και επομένως εκπομπές CO2”.

Μετά υπάρχει το νερό. Καθώς οι ΗΠΑ αντιμετωπίζουν ξηρασίες και πυρκαγιές, οι εταιρείες τεχνητής νοημοσύνης απορροφούν βαθιά νερά για να «ψύξουν» τα μεγάλα κέντρα δεδομένων τους για να προστατεύσουν τα τσιπ. Επιπλέον, οι εταιρείες της Silicon Valley αναλαμβάνουν όλο και περισσότερο τον έλεγχο των υποδομών ύδρευσης για να καλύψουν τις ανάγκες τους. Η έρευνα δείχνει, για παράδειγμα, ότι περίπου 700.000 λίτρα νερού θα μπορούσαν να έχουν χρησιμοποιηθεί για την ψύξη των μηχανών που εκπαίδευσαν το ChatGPT-3 στις εγκαταστάσεις δεδομένων της Microsoft.

Η εκπαίδευση μοντέλων τεχνητής νοημοσύνης καταναλώνει 6.000 φορές περισσότερη ενέργεια από μια ευρωπαϊκή πόλη. Επιπλέον, ενώ ορυκτά όπως το λίθιο και το κοβάλτιο συνδέονται συχνότερα με μπαταρίες στον τομέα της αυτοκινητοβιομηχανίας, είναι επίσης ζωτικής σημασίας για τις μπαταρίες που χρησιμοποιούνται στα κέντρα δεδομένων. Η διαδικασία εξόρυξης συχνά περιλαμβάνει σημαντική χρήση νερού και μπορεί να οδηγήσει σε ρύπανση, υπονομεύοντας την ασφάλεια των υδάτων.

Ο Sam Altman, ο προηγούμενος μη κερδοσκοπικός ήρωας της Open AI, ο οποίος τώρα προσπαθεί να μεγιστοποιήσει τα κέρδη της Microsoft, υποστηρίζει ότι ναι, δυστυχώς υπάρχουν «συμβιβασμοί» βραχυπρόθεσμα, αλλά είναι απαραίτητοι για να επιτευχθεί η λεγόμενη AGI. και η AGI θα μας βοηθήσει στη συνέχεια να λύσουμε όλα αυτά τα προβλήματα, οπότε αξίζει τον κόπο η ανταλλαγή των «εξωτερικών οικονομιών».

AGI; Τι είναι αυτό? Η τεχνητή γενικευμένη νοημοσύνη (AGI) είναι το ιερό δισκοπότηρο των προγραμματιστών AI. Αυτό σημαίνει ότι τα μοντέλα τεχνητής νοημοσύνης θα γίνουν «υπερέξυπνα» πολύ πάνω από την ανθρώπινη νοημοσύνη. Όταν επιτευχθεί αυτό, υπόσχεται ο Altman, η τεχνητή νοημοσύνη δεν θα είναι σε θέση να κάνει μόνο τη δουλειά ενός εργαζομένου, θα είναι σε θέση να κάνει όλες τις δουλειές τους: «Η τεχνητή νοημοσύνη μπορεί να κάνει τη δουλειά ενός οργανισμού». Αυτό θα ήταν το απόλυτο για τη μεγιστοποίηση της κερδοφορίας με την κατάργηση των εργαζομένων σε εταιρείες (ακόμη και εταιρείες τεχνητής νοημοσύνης;), καθώς οι μηχανές τεχνητής νοημοσύνης αναλαμβάνουν τη λειτουργία, την ανάπτυξη και την εμπορία των πάντων. Αυτό είναι το αποκαλυπτικό όνειρο για το κεφάλαιο (αλλά ένας εφιάλτης για την εργασία: χωρίς δουλειά, άρα χωρίς εισόδημα).

Αυτός είναι ο λόγος για τον οποίο ο Altman και οι άλλοι μεγιστάνες της τεχνητής νοημοσύνης δεν θα σταματήσουν να επεκτείνουν τα κέντρα δεδομένων τους και να αναπτύσσουν ακόμη πιο προηγμένα τσιπ μόνο και μόνο επειδή η DeepSeek έχει υποτιμήσει τα τρέχοντα μοντέλα τους. Η ερευνητική εταιρεία Rosenblatt προέβλεψε την αντίδραση των τεχνολογικών γιγάντων: «Σε γενικές γραμμές, αναμένουμε ότι η προτίμηση θα είναι στη βελτίωση των δυνατοτήτων, στο ταχύτερο σπριντ προς την τεχνητή γενική νοημοσύνη, περισσότερο από τις μειωμένες δαπάνες». Τίποτα δεν πρέπει να σταματήσει τον στόχο της υπερ-ευφυούς τεχνητής νοημοσύνης.

Κάποιοι βλέπουν τον αγώνα για την επίτευξη της AGI ως απειλή για την ίδια την ανθρωπότητα. Ο Stuart Russell, καθηγητής της επιστήμης των υπολογιστών στο Πανεπιστήμιο της Καλιφόρνιας, Berkeley, δήλωσε: «Ακόμη και οι διευθύνοντες σύμβουλοι που συμμετέχουν στον αγώνα έχουν δηλώσει ότι όποιος κερδίσει έχει σημαντική πιθανότητα να προκαλέσει ανθρώπινη εξαφάνιση στη διαδικασία, επειδή δεν έχουμε ιδέα πώς να ελέγξουμε συστήματα πιο έξυπνα από εμάς», είπε. «Με άλλα λόγια, ο αγώνας AGI είναι ένας αγώνας προς την άκρη ενός γκρεμού».

Ίσως, αλλά εξακολουθώ να αμφιβάλλω ότι η ανθρώπινη «νοημοσύνη» μπορεί να αντικατασταθεί από τη μηχανική νοημοσύνη, κυρίως επειδή είναι διαφορετικές. Οι μηχανές δεν μπορούν να σκεφτούν πιθανές και ποιοτικές αλλαγές. Η νέα γνώση προέρχεται από τέτοιους μετασχηματισμούς (ανθρώπινες), όχι από την επέκταση της υπάρχουσας γνώσης (μηχανές). Μόνο η ανθρώπινη νοημοσύνη είναι κοινωνική και μπορεί να δει τις δυνατότητες για αλλαγή, ιδίως κοινωνική αλλαγή, που οδηγεί σε μια καλύτερη ζωή για την ανθρωπότητα και τη φύση.

Αυτό που έδειξε η εμφάνιση του DeepSeek είναι ότι η τεχνητή νοημοσύνη μπορεί να αναπτυχθεί σε ένα επίπεδο που μπορεί να βοηθήσει την ανθρωπότητα και τις κοινωνικές της ανάγκες. Είναι δωρεάν και ανοιχτή και διαθέσιμη στον μικρότερο χρήστη και προγραμματιστή. Δεν έχει αναπτυχθεί με σκοπό το κέρδος. Όπως το έθεσε ένας σχολιαστής: «Θέλω η τεχνητή νοημοσύνη να πλένει τα ρούχα και τα πιάτα μου, ώστε να μπορώ να κάνω τέχνη και γραφή, όχι η τεχνητή νοημοσύνη να κάνει την τέχνη και τη γραφή μου, ώστε να μπορώ να πλένω τα ρούχα και τα πιάτα μου». Οι διευθυντές εισάγουν την τεχνητή νοημοσύνη για να «διευκολύνουν τα προβλήματα διαχείρισης εις βάρος των πραγμάτων για τα οποία πολλοί άνθρωποι δεν πιστεύουν ότι πρέπει να χρησιμοποιείται η τεχνητή νοημοσύνη, όπως η δημιουργική εργασία….. Εάν η τεχνητή νοημοσύνη πρόκειται να λειτουργήσει, πρέπει να προέρχεται από κάτω προς τα πάνω, διαφορετικά η τεχνητή νοημοσύνη θα είναι άχρηστη για τη συντριπτική πλειοψηφία των ανθρώπων στον χώρο εργασίας».

Αντί να αναπτύξει την τεχνητή νοημοσύνη για να αποκομίσει κέρδη, να μειώσει τις θέσεις εργασίας και τα μέσα διαβίωσης των ανθρώπων, η τεχνητή νοημοσύνη υπό κοινή ιδιοκτησία και σχεδιασμό θα μπορούσε να μειώσει τις ώρες ανθρώπινης εργασίας για όλους και να απελευθερώσει τους ανθρώπους από τον μόχθο για να επικεντρωθούν στη δημιουργική εργασία που μόνο η ανθρώπινη νοημοσύνη μπορεί να προσφέρει. Θυμηθείτε ότι το «άγιο δισκοπότηρο» ήταν μια βικτωριανή μυθοπλασία και αργότερα και ένας Dan Brown (Αμερικανός συγγραφέας που έγραφε νουβέλες θρίλερ).