06
Fri, Jun
558 New Articles

TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

ΤΕΧΝΟΛΟΓΙΑ
TechCrunch - Νέο AI μοντέλο από τη DeepSeek που λειτουργεί με μία μόνο κάρτα γραφικών

Το ενημερωμένο μοντέλο τεκμηρίωσης (reasoning) R1 της DeepSeek συγκεντρώνει το μεγαλύτερο ενδιαφέρον της κοινότητας της Τεχνητής Νοημοσύνης αυτή την εβδομάδα.

Ωστόσο, το κινεζικό εργαστήριο AI παρουσίασε επίσης μια μικρότερη, «αποσταγμένη» εκδοχή του νέου R1: το DeepSeek-R1-0528-Qwen3-8B, το οποίο –σύμφωνα με την εταιρεία– ξεπερνά σε επιδόσεις άλλα μοντέλα παρόμοιου μεγέθους σε ορισμένα benchmarks.

Το DeepSeek-R1-0528-Qwen3-8B, που βασίζεται στο μοντέλο Qwen3-8B της Alibaba (λανσαρίστηκε τον Μάιο), αποδίδει καλύτερα από το Gemini 2.5 Flash της Google στο AIME 2025, ένα σύνολο απαιτητικών μαθηματικών ερωτήσεων.

Παράλληλα, πλησιάζει τις επιδόσεις του Phi-4 reasoning plus της Microsoft σε άλλο τεστ μαθηματικών δεξιοτήτων, το HMMT.

Τα λεγόμενα distilled models όπως το DeepSeek-R1-0528-Qwen3-8B είναι γενικά λιγότερο ισχυρά από τις πλήρεις εκδόσεις τους, αλλά έχουν το πλεονέκτημα ότι καταναλώνουν σημαντικά λιγότερους πόρους. Σύμφωνα με την πλατφόρμα cloud NodeShift, το Qwen3-8B μπορεί να τρέξει σε μία GPU με 40–80GB RAM (όπως η Nvidia H100), σε αντίθεση με το πλήρες R1 που απαιτεί περίπου δώδεκα GPUs των 80GB.

Η DeepSeek εκπαίδευσε το DeepSeek-R1-0528-Qwen3-8B χρησιμοποιώντας παραγόμενο κείμενο από το νέο R1, το οποίο στη συνέχεια χρησιμοποιήθηκε για τη βελτίωση (fine-tuning) του Qwen3-8B.

Σε αφιερωμένη σελίδα του μοντέλου στην πλατφόρμα Hugging Face, η DeepSeek περιγράφει το μοντέλο ως κατάλληλο «τόσο για ακαδημαϊκή έρευνα πάνω στα μοντέλα τεκμηρίωσης όσο και για βιομηχανική ανάπτυξη που επικεντρώνεται σε μοντέλα μικρής κλίμακας».

Το μοντέλο διατίθεται με την ελεύθερη άδεια MIT, πράγμα που σημαίνει ότι μπορεί να χρησιμοποιηθεί εμπορικά χωρίς περιορισμούς. Ήδη αρκετοί πάροχοι, όπως το LM Studio, προσφέρουν πρόσβαση στο μοντέλο μέσω API.

Content Original Link:

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

" target="_blank">

ΠΕΡΙΣΣΟΤΕΡΑ ΤΕΧΝΟΛΟΓΙΑ Liberal.gr

Top Stories

Grid List

Κυριάκος Μητσοτάκης για θάνατο Βασίλη Παπαβασιλείου: Η τέχνη και η σκέψη στην Ελλάδα έχασαν έναν σπάνιο σκαπανέα τους

Πολιτικη

Κυριάκος Μητσοτάκης για θάνατο Βασίλη Παπαβασιλείου: Η τέχνη και η σκέψη στην Ελλάδα έχασαν έναν σπάνιο σκαπανέα τους

Ξανθόπουλος για Τέμπη: Για λόγους λαϊκισμού και εντυπώσεων κάποιοι επινοούν ένα αδίκημα

Πολιτικη

Ξανθόπουλος για Τέμπη: Για λόγους λαϊκισμού και εντυπώσεων κάποιοι επινοούν ένα αδίκημα

ΣΥΡΙΖΑ: Αναταράξεις λίγο πριν το συνέδριο προκαλούν Πολάκης και Ραγκούσης - Η πλατφόρμα των 53 και η παρέμβαση για την "ηθική επανάσταση"

Πολιτικη

ΣΥΡΙΖΑ: Αναταράξεις λίγο πριν το συνέδριο προκαλούν Πολάκης και Ραγκούσης - Η πλατφόρμα των 53 και η παρέμβαση για την "ηθική επανάσταση"

Μητσοτάκης για Παπαβασιλείου: Κορυφαίος σκηνοθέτης και σπάνιος σκαπανέας του θεάτρου

ΟΙΚΟΝΟΜΙΑ

Μητσοτάκης για Παπαβασιλείου: Κορυφαίος σκηνοθέτης και σπάνιος σκαπανέας του θεάτρου

Επιτροπή Ανταγωνισμού: Ενημερώθηκε για την εξαγορά της Άκτωρ Παραχωρήσεις από την Aktor Special Concessions and PPA Projects

ΟΙΚΟΝΟΜΙΑ

Επιτροπή Ανταγωνισμού: Ενημερώθηκε για την εξαγορά της Άκτωρ Παραχωρήσεις από την Aktor Special Concessions and PPA Projects

Ποια είναι η διαδικασία επιστροφής ενός ενοικίου στους δικαιούχους

ΟΙΚΟΝΟΜΙΑ

Ποια είναι η διαδικασία επιστροφής ενός ενοικίου στους δικαιούχους

Άβαξ: Συνεργασία με τη MillerKnoll στους επαγγελματικούς χώρους

ΕΠΙΧEIΡΗΣΕΙΣ

Άβαξ: Συνεργασία με τη MillerKnoll στους επαγγελματικούς χώρους

«Έκθεση που χλευάζει την πίστη μας»: Αγωγή κατά της Εθνικής Πινακοθήκης από τη Λατινοπούλου

ΕΠΙΧEIΡΗΣΕΙΣ

«Έκθεση που χλευάζει την πίστη μας»: Αγωγή κατά της Εθνικής Πινακοθήκης από τη Λατινοπούλου

Elbisco: Τι απαντά για την κατάθεση αίτησης για λύση και εκκαθάριση

ΕΠΙΧEIΡΗΣΕΙΣ

Elbisco: Τι απαντά για την κατάθεση αίτησης για λύση και εκκαθάριση

Ακόμη δύο ανεξάρτητοι βουλευτές στηρίζουν την πρόταση Καρυστιανού που θέτει στο κάδρο Μητσοτάκη, Καραμανλή

ΚΟΙΝΩΝΙΚΑ

Ακόμη δύο ανεξάρτητοι βουλευτές στηρίζουν την πρόταση Καρυστιανού που θέτει στο κάδρο Μητσοτάκη, Καραμανλή

Ύδρα: Το ελληνικό νησί που προτείνει η Daily Mail για καλοκαιρινές αποδράσεις

ΚΟΙΝΩΝΙΚΑ

Ύδρα: Το ελληνικό νησί που προτείνει η Daily Mail για καλοκαιρινές αποδράσεις

Δήμαρχος Αλίμου για τροχαίο στην Ποσειδώνος: «Εξαιρετική γυναίκα, υποδειγματική εργαζόμενη, βρήκε φριχτό θάνατο»

ΚΟΙΝΩΝΙΚΑ

Δήμαρχος Αλίμου για τροχαίο στην Ποσειδώνος: «Εξαιρετική γυναίκα, υποδειγματική εργαζόμενη, βρήκε φριχτό θάνατο»

Τραμπ για Μασκ: ''Έχει χάσει το μυαλό του, δεν με ενδιαφέρει να μιλήσουμε'', πουλάει το Tesla του

Διεθνη

Τραμπ για Μασκ: ''Έχει χάσει το μυαλό του, δεν με ενδιαφέρει να μιλήσουμε'', πουλάει το Tesla του

ΕΕ: Τα δικαιώματα των επιβατών για χειραποσκευές και ακύρωση πτήσης

Διεθνη

ΕΕ: Τα δικαιώματα των επιβατών για χειραποσκευές και ακύρωση πτήσης

Ευρωζώνη: Στο 1,5 η ανάπτυξη το α' τρίμηνο

Διεθνη

Ευρωζώνη: Στο 1,5 η ανάπτυξη το α' τρίμηνο

Wall Street: Ράλι 300 μονάδων για Dow λόγω απασχόλησης στις ΗΠΑ

Αγορες Χρημα

Wall Street: Ράλι 300 μονάδων για Dow λόγω απασχόλησης στις ΗΠΑ

Χρηματιστήριο: Ανοδική η πρώτη εβδομάδα του Ιουνίου

Αγορες Χρημα

Χρηματιστήριο: Ανοδική η πρώτη εβδομάδα του Ιουνίου

Μεικτά πρόσημα στις ευρωαγορές, ελαφρώς ενισχυμένος ο FTSE

Αγορες Χρημα

Μεικτά πρόσημα στις ευρωαγορές, ελαφρώς ενισχυμένος ο FTSE

Anti-Scam Month: Η καμπάνια της Bitget κατά της κυβερνοαπάτης

Καθημερινα

Anti-Scam Month: Η καμπάνια της Bitget κατά της κυβερνοαπάτης

Νάξος: Με χαμηλή ταχύτητα πλέει το Super Jet 2, ταλαιπωρία για 67 επιβάτες

Καθημερινα

Νάξος: Με χαμηλή ταχύτητα πλέει το Super Jet 2, ταλαιπωρία για 67 επιβάτες

Ολλανδία: Ανακαλούνται γρανίτες με άρωμα...αμμωνίας

Καθημερινα

Ολλανδία: Ανακαλούνται γρανίτες με άρωμα...αμμωνίας