Τεχνολογία

Η DeepSeek ξαναχτυπά: δύο νέα μοντέλα, μεγάλη αυτοπεποίθηση και πίεση σε Google–OpenAI

Η DeepSeek ξαναχτυπά: δύο νέα μοντέλα, μεγάλη αυτοπεποίθηση και πίεση σε Google–OpenAI

Πηγή Φωτογραφίας: Reuters

Μόλις έναν χρόνο αφότου αναστάτωσε την αγορά με ένα μοντέλο που προκάλεσε μέχρι και «τρισεκατομμύρια» αναταράξεις στα χρηματιστήρια, η κινεζική DeepSeek επιστρέφει με δύο νέες κυκλοφορίες – και με ακόμη πιο φιλόδοξες δηλώσεις.

Η εταιρεία ανακοίνωσε επίσημα το DeepSeek-V3.2, ένα νέο «ψηφιακό» μοντέλο τεχνητής νοημοσύνης γενικής χρήσης, αλλά και την έκδοση DeepSeek-V3.2-Speciale, σχεδιασμένη ειδικά για χρήση σε προσωπικούς υπολογιστές και edge συστήματα. Σύμφωνα με την ίδια τη DeepSeek, τα νέα αυτά μοντέλα μπορούν να φτάσουν –ή και να ξεπεράσουν– κορυφαία συστήματα όπως το GPT-5 της OpenAI και το Gemini 3 Pro της Google, τουλάχιστον σε μια σειρά από benchmarks και σενάρια χρήσης.

Αποτελεσματικότητα αντί για «ωμή» κλίμακα

Η DeepSeek δεν προσπαθεί να κερδίσει τον αγώνα με την κλασική αμερικανική συνταγή «ρίχνω όσο περισσότερα GPU μπορώ». Από την ίδρυσή της, έχει χτίσει το αφήγημά της γύρω από ένα διαφορετικό μοντέλο:
να πλησιάζει την κορυφαία νοημοσύνη με πολύ μικρότερο κόστος εκπαίδευσης και πιο προσβάσιμο hardware. es.wikipedia.org

Στην περίπτωση του V3.2, η εταιρεία μιλά για:

  • «Δυναμικό πρωτόκολλο μάθησης»: μηχανισμούς που ενεργοποιούν διαφορετικά κομμάτια του μοντέλου ανάλογα με τη δυσκολία της εκάστοτε εργασίας (σκεφτείτε το σαν «έξυπνο turbo» που δεν δουλεύει στο φουλ αν δεν χρειάζεται).

  • Κλιμακωτή χρήση υπολογιστικών πόρων: πιο «σφιχτή» διαχείριση των GPU, ώστε η εκπαίδευση να γίνεται σε μικρότερα clusters σε σχέση με αυτά που χρησιμοποιούν τα μεγάλα αμερικανικά εργαστήρια.

Η στρατηγική είναι ξεκάθαρη:
αν η OpenAI και η Google παίζουν το παιχνίδι της απόλυτης ισχύος, η DeepSeek προσπαθεί να αποδείξει ότι μπορείς να φτάσεις σε αντίστοιχα επίπεδα απόδοσης με πολύ χαμηλότερο budget – κάτι που έχει ήδη κάνει με το προηγούμενο μοντέλο της, DeepSeek-R1, το οποίο εκπαιδεύτηκε με κλάσμα του κόστους που απαιτήθηκε για τα πρώτα GPT-4-class μοντέλα. es.wikipedia.org

Τι υπόσχονται τα V3.2 και V3.2-Speciale

Με βάση όσα έκανε γνωστά η εταιρεία:

  • Το DeepSeek-V3.2 στοχεύει να είναι ένα πλήρες μοντέλο γενικής χρήσης – συνομιλία, κώδικας, ανάλυση δεδομένων, λογική συλλογιστική. Η DeepSeek υποστηρίζει ότι σε πολλές μετρήσεις «κάθεται δίπλα» στο GPT-5 και στο Gemini 3 Pro.

  • Το V3.2-Speciale είναι μια έκδοση βελτιστοποιημένη για τοπική χρήση (PC, εταιρικά workstations), με μικρότερο αποτύπωμα και χαμηλότερες απαιτήσεις σε υπολογιστική ισχύ, ώστε να μπορεί να τρέχει χωρίς τεράστια clusters.

Αν επιβεβαιωθούν οι ισχυρισμοί της εταιρείας, μιλάμε για ένα κρίσιμο βήμα:
μοντέλα επιπέδου «top tier» που δεν προϋποθέτουν υποδομές τύπου hyperscaler. Αυτό σημαίνει πιο φθηνό inference, περισσότερη αυτονομία για επιχειρήσεις και κράτη, και λιγότερη εξάρτηση από δύο-τρεις αμερικανικούς παρόχους cloud.

Φυσικά, προς το παρόν, πολλά από αυτά βασίζονται σε μετρήσεις της ίδιας της DeepSeek· άρα η πραγματική σύγκριση με GPT-5 και Gemini 3 Pro θα κριθεί στα χέρια των ανεξάρτητων χρηστών, των developers και των εταιρειών που θα το δοκιμάσουν στην πράξη.

Η πολιτική και τεχνολογική διάσταση: Κίνα vs ΗΠΑ

Η DeepSeek δεν είναι απλώς μια «ακόμη startup». Εδρεύει στην Χανγκζού, χρηματοδοτείται από το κινεζικό hedge fund High-Flyer και ο ιδρυτής της, Liang Wenfeng, έχει ήδη αναδειχθεί σε μία από τις πιο χαρακτηριστικές φιγούρες της κινεζικής ΤΝ, μπαίνοντας μάλιστα σε λίστες όπως το «TIME 100 AI» και τις κατατάξεις των πλουσιότερων επιχειρηματιών της χώρας. en.wikipedia.org

Το timing δεν είναι τυχαίο:

  • Οι ΗΠΑ έχουν επιβάλει περιορισμούς στις εξαγωγές προηγμένων Nvidia chips προς την Κίνα, ακριβώς για να περιορίσουν την ικανότητά της να εκπαιδεύει πολύ μεγάλα μοντέλα. en.wikipedia.org

  • Μέσα σε αυτό το πλαίσιο, η DeepSeek προβάλλεται –και εντός Κίνας– ως το παράδειγμα ότι μπορείς να χτίσεις ανταγωνιστική τεχνητή νοημοσύνη με περιορισμένους πόρους, αρκεί να αλλάξεις τον τρόπο που εκπαιδεύεις τα μοντέλα. es.wikipedia.org

Το αφήγημα αυτό έχει και γεωπολιτική βαρύτητα:
αν μια κινεζική εταιρεία μπορεί να προσφέρει LLMs που στέκονται δίπλα (ή απέναντι) σε GPT-5 και Gemini 3 Pro, τότε η τεχνολογική «μονοκρατορία» της Δύσης στην ΤΝ αρχίζει να αμφισβητείται πιο ουσιαστικά.

Πίεση σε τιμές, άδειες, στρατηγικές

Εκεί όπου η DeepSeek «πονάει» περισσότερο τους ανταγωνιστές της δεν είναι μόνο στην τεχνολογική σύγκριση, αλλά στο μήνυμα που στέλνει για την τιμολόγηση και την προσβασιμότητα:

  • Αν όντως μπορείς να έχεις μοντέλο αντίστοιχης ισχύος σε πολύ χαμηλότερο κόστος hardware, τότε αναγκάζεις ολόκληρο τον κλάδο να ξανασκεφτεί πόσο πρέπει να κοστίζει η πρόσβαση σε ένα κορυφαίο LLM.

  • Ειδικά για χώρες και εταιρείες που δεν θέλουν ή δεν μπορούν να εξαρτώνται από αμερικανικά clouds, η ύπαρξη ενός τόσο ισχυρού –και εν δυνάμει φθηνότερου– κινεζικού παρόχου είναι πολιτικά και οικονομικά δελεαστική.

Παράλληλα, η DeepSeek έχει ήδη χτίσει δυνατή παρουσία και στην open source/ημι-open προσέγγιση, με μοντέλα όπως το DeepSeek-R1 να διατίθενται με τρόπο που επιτρέπει εκτεταμένη χρήση και προσαρμογή από τρίτους. es.wikipedia.org
Αυτό έρχεται σε αντίθεση με την πιο κλειστή στρατηγική της OpenAI και σε μικρότερο βαθμό της Google, και δημιουργεί ένα εναλλακτικό οικοσύστημα γύρω από τα κινεζικά μοντέλα.

Πού μένουμε επιφυλακτικοί

Παρότι οι ανακοινώσεις της DeepSeek είναι εντυπωσιακές, υπάρχουν μερικά σημεία που χρειάζονται ψύχραιμη ματιά:

  • Οι άμεσες συγκρίσεις με GPT-5 και Gemini 3 Pro γίνονται, προς το παρόν, κυρίως με βάση benchmarks που επιλέγει η ίδια η εταιρεία. Μένει να δούμε πώς θα αποδώσουν τα νέα μοντέλα σε πραγματική χρήση, σε διαφορετικές γλώσσες, σε edge cases και σε μεγάλης κλίμακας εταιρικά συστήματα.

  • Το οικοσύστημα γύρω από ένα μοντέλο (εργαλεία, integrations, υποστήριξη, privacy/compliance frameworks) είναι εξίσου σημαντικό με το ίδιο το LLM – και εκεί OpenAI, Google και Microsoft έχουν ακόμη τεράστιο προβάδισμα στη Δύση.

  • Τέλος, οι ρυθμιστικοί και γεωπολιτικοί περιορισμοί μπορεί να κρατήσουν τα μοντέλα της DeepSeek εκτός αρκετών αγορών ή να τα «σπρώξουν» κυρίως σε χώρες πιο κοντά στην κινεζική σφαίρα επιρροής.

Τι σημαίνουν όλα αυτά για τον κλάδο

Ανεξάρτητα από το αν το DeepSeek-V3.2 είναι όντως «καλύτερο» από το GPT-5 ή το Gemini 3 Pro, ένα πράγμα είναι ξεκάθαρο:

  • Η εποχή που δύο-τρεις αμερικανικές εταιρείες έμοιαζαν να έχουν το μονοπώλιο στα κορυφαία μοντέλα ΤΝ τελειώνει γρήγορα.

  • Ο ανταγωνισμός πλέον δεν είναι μόνο ποιος έχει το πιο μεγάλο ή το πιο έξυπνο μοντέλο, αλλά και ποιος μπορεί να προσφέρει υψηλή απόδοση με λογικό κόστος, σε πιο ελεύθερους και ευέλικτους όρους χρήσης.

Η DeepSeek ποντάρει ακριβώς εκεί: στην ιδέα ότι «η κορυφαία ΤΝ δεν χρειάζεται να συνοδεύεται από κορυφαία τιμή».
Ακόμη κι αν κάποια από τα claims της αποδειχθούν υπερβολικά, έχει ήδη πετύχει κάτι κρίσιμο:

  • να πιέσει την OpenAI, τη Google και γενικά τη δυτική βιομηχανία να ξανασκεφτούν κόστος, αποδοτικότητα και μοντέλα διάθεσης,

  • και να δείξει ότι η επόμενη φάση της κούρσας στην τεχνητή νοημοσύνη δεν θα κριθεί μόνο στην «ωμή δύναμη», αλλά και στην ευφυΐα με την οποία χρησιμοποιείς τους περιορισμένους πόρους σου.

Αυτό από μόνο του είναι αρκετό για να κάνει τα νέα μοντέλα της DeepSeek ένα από τα πιο ενδιαφέροντα κεφάλαια της ΤΝ για το 2026 – και ίσως για πολλά χρόνια μετά.

Πηγή: Pagenews.gr

Διαβάστε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο

ΚΑΤΕΒΑΣΤΕ ΤΟ APP ΤΟΥ PAGENEWS PAGENEWS.gr - App Store PAGENEWS.gr - Google Play

Το σχόλιο σας

Loading Comments