από Vitaliy Katsenelson
Τρίτη, Ιαν 28, 2025
DeepSeek Breaks the AI Paradigm | ZeroHedge
Έχω λάβει μηνύματα ηλεκτρονικού ταχυδρομείου από αναγνώστες που ρωτούν τις σκέψεις μου για το DeepSeek. Πρέπει να ξεκινήσω με δύο προειδοποιήσεις. Πρώτον, το συνηθισμένο: είμαι γενικός επενδυτής αξίας, όχι ειδικός τεχνολογίας (την περασμένη εβδομάδα ανέλυα μια τράπεζα και μια πετρελαϊκή εταιρεία), οπότε οι γνώσεις μου για τα μοντέλα AI είναι επιφανειακές. Δεύτερον, και πιο ασυνήθιστο, δεν έχουμε ακόμα όλα τα στοιχεία.
Αλλά αυτή η ιστορία θα μπορούσε να αποτελέσει ένα σημαντικό βήμα αλλαγής τόσο στην τεχνητή νοημοσύνη όσο και στη γεωπολιτική. Δείτε τι γνωρίζουμε:
Η DeepSeek, μια startup στην Κίνα που δημιουργήθηκε από ένα hedge fund, έχει δημιουργήσει ένα πλήρως λειτουργικό μοντέλο μεγάλης γλώσσας (LLM) που αποδίδει στο ίδιο επίπεδο με τα τελευταία μοντέλα AI. Αυτό το μέρος της ιστορίας έχει επαληθευτεί από τη βιομηχανία: Το DeepSeek έχει δοκιμαστεί και συγκριθεί με άλλα κορυφαία LLM. Προσωπικά παίζω με το DeepSeek τις τελευταίες ημέρες και τα αποτελέσματα που απέφερε ήταν πολύ παρόμοια με αυτά που παράγονται από το ChatGPT και το Perplexity – μόνο πιο γρήγορα.
Αυτό από μόνο του είναι εντυπωσιακό, ειδικά αν ληφθεί υπόψη ότι μόλις πριν από έξι μήνες, ο Eric Schmidt (πρώην διευθύνων σύμβουλος της Google και σίγουρα όχι γενικόλογος) πρότεινε ότι η Κίνα ήταν δύο έως τρία χρόνια πίσω από τις ΗΠΑ στην τεχνητή νοημοσύνη.
Αλλά εδώ είναι το πραγματικά συγκλονιστικό – και μη επαληθευμένο – μέρος: Η DeepSeek ισχυρίζεται ότι εκπαίδευσε το μοντέλο της μόνο για 5,6 εκατομμύρια δολάρια, ενώ οι ομόλογοι των ΗΠΑ φέρεται να έχουν δαπανήσει εκατοντάδες εκατομμύρια ή ακόμα και δισεκατομμύρια δολάρια. Αυτό είναι 20 έως 200 φορές λιγότερο.
Οι επιπτώσεις, αν αληθεύουν, είναι εκπληκτικές. Παρά τους ελέγχους εξαγωγών της κυβέρνησης των ΗΠΑ σε τσιπ AI στην Κίνα, η DeepSeek φέρεται να εκπαίδευσε το LLM της σε τσιπ παλαιότερης γενιάς, χρησιμοποιώντας ένα μικρό κλάσμα της υπολογιστικής ισχύος και ηλεκτρικής ενέργειας που έχουν οι δυτικοί ανταγωνιστές της. Ενώ όλοι υπέθεσαν ότι το μέλλον της AI βρισκόταν σε ταχύτερα, καλύτερα τσιπ – όπου η μόνη πραγματική επιλογή είναι η Nvidia – αυτή η προηγουμένως άγνωστη εταιρεία έχει επιτύχει σχεδόν ισοτιμία με τους Αμερικανούς ομολόγους της που κολυμπούν σε μετρητά και κέντρα δεδομένων γεμάτα με τα τελευταία τσιπ Nvidia. Το DeepSeek (υποτίθεται) είχε τεράστιους υπολογιστικούς περιορισμούς και έτσι έπρεπε να χρησιμοποιήσει διαφορετική λογική, να γίνει πιο αποτελεσματικό με υποδεέστερο υλικό υπολογιστών για να επιτύχει παρόμοιο αποτέλεσμα. Με άλλα λόγια, αυτή η ασταθής startup, στην προσπάθειά της να δημιουργήσει έναν καλύτερο «εγκέφαλο» τεχνητής νοημοσύνης, χρησιμοποίησε εγκεφάλους εκεί όπου όλοι οι άλλοι επικεντρώνονταν στην υπολογιστική ισχύ – κυριολεκτικά δίδαξε στην τεχνητή νοημοσύνη πώς να σκέφτεται.
Λάβετε μέρος στο διαγωνισμό χοτ ντογκ
Οι Αμερικανοί αγαπούν το (πρόχειρο) φαγητό και τον αθλητισμό, οπότε επιτρέψτε μου να εξηγήσω με μια αναλογία φαγητού-αθλητισμού. Ο διάσημος διεθνής διαγωνισμός κατανάλωσης χοτ ντογκ του Nathan ισχυρίζεται ότι προέρχεται από το 1916 (αν και αυτό μπορεί να είναι εν μέρει θρύλος). Μέχρι τη δεκαετία του 1970, όταν άρχισαν τα επίσημα αρχεία, οι νικητές ανταγωνιστές είχαν κατά μέσο όρο περίπου 15 χοτ ντογκ. Αυτό σταδιακά αυξήθηκε σε περίπου 25 – μέχρι που ο Takeru Kobayashi έφτασε από την Ιαπωνία το 2001 και έσπασε το παράδειγμα καταναλώνοντας 50 χοτ ντογκ, κάτι που θεωρείται ευρέως αδύνατο. Το μυστικό του δεν ήταν μια τεράστια όρεξη, αλλά μάλλον η μοναδική μεθοδολογία του. Διαχώρισε τα χοτ ντογκ από τα ψωμάκια και βούτηξε τα ψωμάκια στο νερό, επαναπροσδιορίζοντας εντελώς την προσέγγιση.
Στη συνέχεια, λίγα χρόνια αργότερα ήρθε ο Joey Chestnut, ο οποίος βασίστηκε στην καινοτομία του Kobayashi για να ωθήσει το ρεκόρ πολύ πέρα από 70 χοτ ντογκ και μέχρι 83. Μόλις ο Kobayashi έσπασε το παράδειγμα, τα αντιληπτά όρια εξαφανίστηκαν, αναγκάζοντας όλους να επανεξετάσουν τις μεθόδους τους. Ο Joey Chestnut το αξιοποίησε.
Το DeepSeek μπορεί να είναι το Kobayashi της AI, προωθώντας ολόκληρη τη βιομηχανία σε μια εποχή καινοτομίας “Joey Chestnut”. Εάν οι ισχυρισμοί σχετικά με τη χρήση παλαιότερων τσιπ και τη δραστική μείωση των δαπανών είναι ακριβείς, μπορεί να δούμε τις εταιρείες τεχνητής νοημοσύνης να απομακρύνονται από το να κυνηγούν μονομερώς μεγαλύτερη υπολογιστική ικανότητα και να στρέφονται προς βελτιωμένο σχεδιασμό μοντέλων.
Ποτέ δεν πίστευα ότι θα παρέθετα τα λόγια των Stoics για να εξηγήσω τη μελλοντική ζήτηση τσιπ GPU, αλλά ο Επίκτητος είπε: «Η ευτυχία δεν προέρχεται από το να θέλεις περισσότερα, αλλά από το να θέλεις αυτό που έχεις». Πριν από δύο χιλιετίες, σίγουρα δεν μιλούσε για GPU, αλλά μπορεί κάλλιστα να ήταν. Το ChatGPT, το Perplexity και το Gemini της Google θα πρέπει να επανεξετάσουν την πείνα τους για περισσότερους υπολογιστές και να δουν αν μπορούν να επιτύχουν περισσότερα με το να θέλουν (χρησιμοποιώντας) αυτό που έχουν.
Εάν δεν το κάνουν, θα φαγωθούν από εκατοντάδες νέες νεοσύστατες επιχειρήσεις, εταιρείες και πιθανές κυβερνήσεις που εισέρχονται στο χώρο. Όταν αρχίζετε να γράφετε δισεκατομμύρια με ένα “M”, μειώνετε δραματικά τα εμπόδια εισόδου.
Μέχρι το DeepSeek, η τεχνητή νοημοσύνη υποτίθεται ότι ήταν προσβάσιμη μόνο για λίγες εξαιρετικά καλά χρηματοδοτούμενες εταιρείες (τις “Magnificent Ones”) οπλισμένες με τα τελευταία τσιπ Nvidia. Το DeepSeek μπορεί να έχει σπάσει και αυτό το παράδειγμα.
Το αίνιγμα της Nvidia
Ο αντίκτυπος στην Nvidia είναι ασαφής. Από τη μία πλευρά, η επιτυχία της DeepSeek θα μπορούσε να μειώσει τη ζήτηση για τα τσιπ της και να επαναφέρει τα περιθώριά της στη γη, καθώς οι εταιρείες συνειδητοποιούν ότι ένα λαμπρότερο μέλλον AI μπορεί να μην έγκειται απλώς στη σύνδεση περισσότερων επεξεργαστών Nvidia, αλλά στην αποτελεσματικότερη λειτουργία των μοντέλων. Το DeepSeek μπορεί να έχει μειώσει την επείγουσα ανάγκη δημιουργίας περισσότερων κέντρων δεδομένων και έτσι να μειώσει τη ζήτηση για τσιπ Nvidia.
Από την άλλη (είμαι διπλά οπλισμένος οικονομολόγος εδώ), τα χαμηλότερα εμπόδια εισόδου θα οδηγήσουν σε περισσότερους νεοεισερχόμενους και υψηλότερη συνολική ζήτηση για GPU. Επίσης, η DeepSeek ισχυρίζεται ότι επειδή το μοντέλο της είναι πιο αποτελεσματικό, το κόστος συμπερασμάτων (εκτέλεση του μοντέλου) είναι ένα κλάσμα του κόστους λειτουργίας του ChatGPT και απαιτεί πολύ λιγότερη μνήμη – ενδεχομένως επιταχύνοντας την υιοθέτηση της τεχνητής νοημοσύνης (AI) και οδηγώντας έτσι σε μεγαλύτερη ζήτηση για GPU. Έτσι, αυτό θα μπορούσε να είναι καλά νέα για την Nvidia, ανάλογα με το πώς θα ξεφύγει.
Η σκέψη μου για την Nvidia δεν έχει αλλάξει ουσιαστικά – είναι μόνο θέμα χρόνου πριν η Meta, η Google, η Tesla, η Microsoft και μια σειρά από νεοσύστατες επιχειρήσεις εμπορευματοποιήσουν τις GPU και μειώσουν τις τιμές.
Ομοίως, περισσότερος ανταγωνισμός σημαίνει ότι τα ίδια τα LLM είναι πιθανό να εμπορευματοποιηθούν – αυτό κάνει ο ανταγωνισμός – και η αποτίμηση του ChatGPT θα μπορούσε να είναι ένα προφανές θύμα.
Γεωπολιτικά κύματα σοκ
Οι γεωπολιτικές συνέπειες είναι τεράστιες. Οι έλεγχοι των εξαγωγών μπορεί να έχουν ωθήσει ακούσια νέες καινοτομίες και μπορεί να μην είναι τόσο αποτελεσματικοί στο μέλλον. Οι ΗΠΑ μπορεί να μην έχουν τον έλεγχο της τεχνητής νοημοσύνης που πολλοί πίστευαν ότι είχαν και οι χώρες που δεν μας συμπαθούν πολύ θα έχουν τη δική τους τεχνητή νοημοσύνη.
Εδώ και καιρό παρηγορούμε τους εαυτούς μας, μετά τη μετεγκατάσταση της παραγωγής στην Κίνα, λέγοντας ότι είμαστε το λίκνο της καινοτομίας – αλλά η τεχνητή νοημοσύνη θα μπορούσε να γείρει την πλάστιγγα προς μια κατεύθυνση που δεν μας ευνοεί.
Επιτρέψτε μου να σας δώσω ένα παράδειγμα. Σε πρόσφατη συνέντευξή του στη Wall Street Journal, ο επικεφαλής προϊόντων της OpenAI αποκάλυψε ότι διάφορες εκδόσεις του ChatGPT συμμετείχαν σε διαγωνισμούς προγραμματισμού ανώνυμα. Από περίπου 28 εκατομμύρια προγραμματιστές παγκοσμίως, αυτά τα πρώιμα μοντέλα κατατάχθηκαν στο κορυφαίο 2-3%. Το ChatGPT-o1 (η τελευταία δημόσια κυκλοφορία) τοποθετείται μεταξύ των κορυφαίων 1.000 και το ChatGPT-o3 (αναμένεται να κυκλοφορήσει σε λίγους μήνες) είναι στο top 175. Αυτό είναι το κορυφαίο 0.000625%! Αν ήταν συνθέτης, το ChatGPT-o3 θα ήταν ο Μότσαρτ.
Έχω ακούσει ότι ένας εξαιρετικός προγραμματιστής είναι 10 φορές πιο πολύτιμος από έναν καλό – ίσως ακόμη και 100 φορές πιο πολύτιμος από έναν μέσο όρο. Σκοπεύω να είμαι περίπου εδώ. Ένας 19χρονος στο Μπανγκαλόρ ή την Αϊόβα που ανακάλυψε τον προγραμματισμό πριν από λίγους μήνες μπορεί τώρα να κωδικοποιήσει όπως ο Μότσαρτ χρησιμοποιώντας το πιο πρόσφατο ChatGPT. Φανταστείτε κάθε μικρό παιδί, μετά από μερικά βίντεο στο YouTube, να κωδικοποιεί σε αυτό το επίπεδο. Το χάσμα γνώσης και εμπειρίας ισοπεδώνεται γρήγορα.
Γνωρίζω πολύ καλά ότι γενικεύω δραστικά (δεν μπορώ να το τονίσω αρκετά), αλλά το θέμα παραμένει: Το ταξίδι από την εκμάθηση της κωδικοποίησης μέχρι να γίνει κανείς ο «Μότσαρτ του προγραμματισμού» έχει συρρικνωθεί από δεκαετίες σε μήνες και η δεξαμενή των Μότσαρτ έχει αυξηθεί εκθετικά. Αν είχα εταιρείες λογισμικού, θα γινόμουν λίγο πιο νευρικός – η τάφρος για πολλές από αυτές έχει γεμίσει με AI.
Η προσαρμογή, η αλλαγή γνώμης και η διατήρηση ιδεών ως διατριβών που πρέπει να επικυρωθούν ή να ακυρωθούν – όχι ως μέρος της ταυτότητάς σας – είναι εξαιρετικά σημαντικές για την επένδυση (και στη ζωή γενικότερα). Γίνονται ακόμη πιο κρίσιμες σε μια εποχή τεχνητής νοημοσύνης, καθώς βρισκόμαστε να μπαίνουμε σε μια πραγματικότητα επιστημονικής φαντασίας πιο γρήγορα από ό, τι φανταζόμασταν ποτέ. Το DeepSeek μπορεί να είναι αυτός ο καταλύτης, αναγκάζοντας τους επενδυτές και τους τεχνολόγους να αμφισβητήσουν μακροχρόνιες υποθέσεις και να επανεκτιμήσουν το ανταγωνιστικό τοπίο σε πραγματικό χρόνο.
Ο Vitaliy Katsenelson είναι ο Διευθύνων Σύμβουλος της IMA, μιας εταιρείας επενδύσεων αξίας στο Ντένβερ. Έχει γράψει δύο βιβλία για τις επενδύσεις, τα οποία εκδόθηκαν από τον John Wiley &; Sons και έχουν μεταφραστεί σε οκτώ γλώσσες. Το Soul in the Game: The Art of a Meaningful Life (Harriman House, 2022) είναι το πρώτο του μη επενδυτικό βιβλίο.