Η OpenAI λανσάρει το AI μοντέλο GPT-4.5 με περισσότερες γνώσεις και βελτιώσεις

Η OpenAI λανσάρει το AI μοντέλο GPT-4.5 με περισσότερες γνώσεις και βελτιώσεις

Η OpenAI ανακοίνωσε το νέο της non-reasoning μοντέλο, το GPT-4.5, το οποίο είναι το μεγαλύτερο και πιο ενημερωμένο μοντέλο μέχρι σήμερα. Όπως υποδηλώνει και το όνομα, το GPT-4.5 βασίζεται στο GPT-4o με περαιτέρω κλιμάκωση κατά τη διάρκεια της διαδικασίας προ-εκπαίδευσης. Η OpenAI επιβεβαίωσε ότι το GPT-4.5 είναι το μεγαλύτερο LLM τους, το οποίο διαθέτει περισσότερες γνώσεις του κόσμου, βελτιωμένες δεξιότητες γραφής και μια εκλεπτυσμένη προσωπικότητα σε σύγκριση με το GPT-4o.

Τα δεδομένα συγκριτικής αξιολόγησης δείχνουν ότι το GPT-4.5 είναι μια μέτρια αναβάθμιση από το GPT-4o. Στο SWE-bench Verified benchmark, ο GPT-4.5 πέτυχε 38%, μια αναβάθμιση 2-7% σε σχέση με τον GPT-4o και 30% κάτω από το Deep Research του OpenAI με βάση το o3. Συγκριτικά, το Claude 3.7 Sonnet της Anthropic πέτυχε κορυφαία επίδοση 62,3% στο SWE-bench Verified. Στο μέτρο σύγκρισης SimpleQA Accuracy, το GPT-4.5 σημείωσε 62,5%, έναντι 38,2% για το GPT-4o. Στο σημείο αναφοράς SimpleQA Hallucination Rate, το GPT-4.5 σημείωσε τη χαμηλότερη βαθμολογία μεταξύ όλων των μεγάλων γλωσσικών μοντέλων του OpenAI.

Πρόσφατα, η ομάδα προετοιμασίας της OpenAI ανέπτυξε ένα νέο benchmark που ονομάζεται SWE-Lancer, το οποίο αξιολογεί την απόδοση των LLM σε πραγματικές εργασίες μηχανικής λογισμικού, όπως ανάπτυξη χαρακτηριστικών, σχεδίαση, διόρθωση σφαλμάτων και άλλα. Σε αυτό το νέο benchmark, το μοντέλο GPT-4.5 μπόρεσε να επιλύσει το 20% των εργασιών IC SWE και το 44% των εργασιών SWE Manager, μια μικρή βελτίωση σε σχέση με το μοντέλο o1 της OpenAI.

Όσον αφορά την ασφάλεια, με βάση τα αποτελέσματα των αξιολογήσεων ετοιμότητας, η Advisory Group Safety της OpenAI έχει κατατάξει το νέο μοντέλο GPT-4.5 ως μεσαίου κινδύνου συνολικά. Έχει επίσης χαμηλή βαθμολογία για την ασφάλεια στον κυβερνοχώρο και την αυτονομία του μοντέλου.

Η ερευνητική preview του νέου μοντέλου GPT-4.5 είναι τώρα διαθέσιμη για τους χρήστες του ChatGPT Pro μέσω του επιλογέα μοντέλων σε web, mobile και desktop. Υποστηρίζει αναζήτηση, μεταφόρτωση αρχείων και εικόνων και λειτουργίες καμβά στο ChatGPT. Στο μέλλον θα υποστηρίζονται πολυτροπικά χαρακτηριστικά όπως η λειτουργία φωνής, το βίντεο και η κοινή χρήση οθόνης. Το GPT-4.5 θα είναι διαθέσιμο την επόμενη εβδομάδα στους χρήστες του ChatGPT Plus και του Teams.

Το GPT-4.5 είναι επίσης διαθέσιμο για όλους τους προγραμματιστές επί πληρωμή μέσω του Chat Completions API, του Assistants API και του Batch API. Υποστηρίζει βασικά χαρακτηριστικά όπως κλήση συναρτήσεων, δομημένες εξόδους, ροή και μηνύματα συστήματος.

Leave a Reply

Your email address will not be published.

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.

Κατασκευή Ιστοσελίδων WEBTEC