Τεχνολογία

H DeepSeek καθυστερεί το καινούργιο μοντέλο AI, μετά την προσπάθεια για απεξάρτηση από τα τσιπ της Nvidia

H DeepSeek καθυστερεί το καινούργιο μοντέλο AI, μετά την προσπάθεια για απεξάρτηση από τα τσιπ της Nvidia

Πηγή Φωτογραφίας: Just Think AI, Unlocking DeepSeek: The Power of Conversational AI

Η κινεζική εταιρεία επιχείρησε να εκπαιδεύσει το σύστημα χρησιμοποιώντας τσιπ της επίσης κινεζικής Huawei, όμως απέτυχε

Η κινεζική εταιρεία Τεχνητής Νοημοσύνης DeepSeek ανέβαλε την κυκλοφορία του νέου της μοντέλου R2, καθώς απέτυχε να το εκπαιδεύσει χρησιμοποιώντας τους επεξεργαστές Ascend της Huawei – εξέλιξη που υπογραμμίζει τα όρια της προσπάθειας του Πεκίνου να υποκαταστήσει την αμερικανική τεχνολογία.

Σύμφωνα με τρεις πηγές με γνώση του θέματος, οι κινεζικές αρχές ενθάρρυναν την εταιρεία να υιοθετήσει τα τσιπ της Huawei αντί για αυτά της Nvidia, μετά την κυκλοφορία του προηγούμενου μοντέλου R1 τον Ιανουάριο. Ωστόσο, η DeepSeek αντιμετώπισε επίμονα τεχνικά προβλήματα κατά την εκπαίδευση του R2 με τα Ascend, με αποτέλεσμα να στραφεί σε τσιπ Nvidia για το στάδιο της εκπαίδευσης και να χρησιμοποιήσει τα Huawei μόνο για την εξαγωγή συμπερασμάτων (inference).

Η εκπαίδευση -κατά την οποία το μοντέλο «μαθαίνει» από μεγάλα σύνολα δεδομένων- είναι κρίσιμη για την απόδοσή του. Αντίθετα, η εξαγωγή συμπερασμάτων αφορά τη χρήση του ήδη εκπαιδευμένου μοντέλου για προβλέψεις ή δημιουργία απαντήσεων, όπως σε ερωτήματα chatbot.

Τα τεχνικά εμπόδια καθυστέρησαν την Deepseek

Τα τεχνικά εμπόδια ήταν ο βασικός λόγος που η κυκλοφορία του R2, αρχικά προγραμματισμένη για τον Μάιο, αναβλήθηκε, με την εταιρεία να χάνει έδαφος έναντι ανταγωνιστών. Παράλληλα, η διαδικασία επισήμανσης δεδομένων για το νέο μοντέλο αποδείχθηκε πιο χρονοβόρα από το αναμενόμενο. Κινεζικά μέσα ενημέρωσης αναφέρουν ότι η κυκλοφορία ενδέχεται να γίνει μέσα στις επόμενες εβδομάδες.

Η Deepseek και τα κινεζικά τσιπ «περιορισμένων δυνατοτήτων»

Η υπόθεση αναδεικνύει πώς τα κινεζικά τσιπ εξακολουθούν να υστερούν έναντι των αμερικανικών σε σταθερότητα, ταχύτητα διασύνδεσης και λογισμικό. Οι Financial Times αποκάλυψαν ότι το Πεκίνο έχει ζητήσει από κινεζικές τεχνολογικές εταιρείες να δικαιολογήσουν τις παραγγελίες τους για τους επεξεργαστές H20 της Nvidia, σε μια προσπάθεια να προωθήσει εναλλακτικές λύσεις από Huawei και Cambricon.

Ο Ritwik Gupta, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο της Καλιφόρνια, σημείωσε ότι το Qwen3 της Alibaba έχει υιοθετήσει βασικές αρχές του DeepSeek, όπως τον αλγόριθμο εκπαίδευσης για βελτιωμένο συλλογισμό, αλλά με μεγαλύτερη αποδοτικότητα. Ο ίδιος πρόσθεσε ότι η Huawei αντιμετωπίζει «αυξανόμενες δυσκολίες» στην εκπαίδευση με το Ascend, αλλά εκτιμά ότι «είναι θέμα χρόνου» να φτάσει σε ανταγωνιστικό επίπεδο.

Σύμφωνα με πηγές, η Huawei έστειλε ομάδα μηχανικών στα γραφεία της DeepSeek για να βοηθήσει στη χρήση του Ascend. Ωστόσο, παρά την επιτόπια υποστήριξη, δεν κατέστη δυνατή η ολοκλήρωση επιτυχούς εκπαιδευτικής περιόδου με τα κινεζικά τσιπ.

Η DeepSeek εξακολουθεί να συνεργάζεται με τη Huawei για να καταστήσει το μοντέλο συμβατό με το Ascend στο στάδιο της εξαγωγής συμπερασμάτων.

Πηγή: Pagenews.gr

Διαβάστε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο

ΚΑΤΕΒΑΣΤΕ ΤΟ APP ΤΟΥ PAGENEWS PAGENEWS.gr - App Store PAGENEWS.gr - Google Play

Το σχόλιο σας

Loading Comments