- Η OpenAI ανακοίνωσε το GPT-4 την περασμένη εβδομάδα, το οποίο λέει ότι «ξεπερνά το ChatGPT σκοράροντας σε υψηλότερα κατά προσέγγιση εκατοστημόρια μεταξύ των υποψηφίων».
- Το OpenAI σημείωσε επίσης ότι το GPT-4 "ξεπερνά το ChatGPT στις προηγμένες δυνατότητες συλλογιστικής του".
- Ο Insider στρογγυλοποίησε μια λίστα με τις εργασίες, τα κουίζ και τις δοκιμές που έχουν περάσει και τα δύο μοντέλα.
Πηγή: Insider
Η Ενιαία Δικηγορική Εξέταση
Ενώ το GPT-3.5, το οποίο εξουσιοδοτεί το ChatGPT, σημείωσε μόνο το 10ο εκατοστημόριο της εξέτασης bar, το GPT-4 βαθμολογήθηκε στο 90ο εκατοστημόριο με βαθμολογία 298 στα 400, σύμφωνα με το OpenAI .
Το όριο για το πέρασμα της γραμμής διαφέρει από πολιτεία σε πολιτεία. Στη Νέα Υόρκη, ωστόσο, οι συμμετέχοντες στις εξετάσεις χρειάζονται βαθμολογία 266, περίπου το 50ο εκατοστημόριο , για να περάσουν, σύμφωνα με το Συμβούλιο Εξεταστών Νομικής της Πολιτείας της Νέας Υόρκης.Το SAT
Οι βαθμολογίες του GPT-4 στις εξετάσεις Graduate Record Examination, ή GRE, διέφεραν ευρέως ανάλογα με τις ενότητες.
Το GPT-4 έχει περάσει μια σειρά από εξετάσεις Προχωρημένης Κατάταξης , εξετάσεις για μαθήματα επιπέδου κολεγίου που λαμβάνονται από μαθητές γυμνασίου και τα οποία διαχειρίζονται το Συμβούλιο του Κολλεγίου.
Τα AMC 10 και 12 είναι εξετάσεις 25 ερωτήσεων και 75 λεπτών που χορηγούνται σε μαθητές γυμνασίου και καλύπτουν μαθηματικά θέματα όπως άλγεβρα, γεωμετρία, τριγωνομετρία, σύμφωνα με τον ιστότοπο της Μαθηματικής Ένωσης της Αμερικής .
Το φθινόπωρο του 2022, η μέση βαθμολογία από τους 150 συνολικούς πόντους στο AMC 10 ήταν 58,33 και 59,9 στο AMC 12 , σύμφωνα με τον ιστότοπο του MAA. Το GPT-4 σημείωσε 30 και 60, αντίστοιχα, τοποθετώντας το μεταξύ του 6ου έως 12ου εκατοστημόριου του AMC 10 και του 45ου έως 66ου εκατοστημόριου του AMC 12, σύμφωνα με το OpenAI.
Εξετάσεις σομελιέ
Αν και είναι εμφανώς δύσκολο να κερδίσετε τα διαπιστευτήριά σας ως διαχειριστής κρασιού, το GPT-4 έχει επίσης περάσει τις εξετάσεις Εισαγωγικού Sommelier, Certified Sommelier και Advanced Sommelier με αντίστοιχα ποσοστά 92%, 86% και 77%, σύμφωνα με το OpenAI .
Το GPT-3.5 ήρθε στο 80%, 58% και 46% για αυτές τις ίδιες εξετάσεις, είπε το OpenAI .
Το OpenAI κυκλοφόρησε το ChatGPT τον Νοέμβριο, το οποίο υποστηρίζεται από το GPT-3.5.
Από τότε, το chatbot έχει χρησιμοποιηθεί για τη δημιουργία εκθέσεων και τη σύνταξη εξετάσεων, συχνά περνώντας, αλλά κάνοντας και λάθη.
Ο καθηγητής του Wharton, Christian Terwiesch, δοκίμασε πρόσφατα την τεχνολογία με ερωτήσεις από την τελική του εξέταση στη διαχείριση λειτουργιών - που κάποτε ήταν υποχρεωτικό μάθημα για όλους τους φοιτητές MBA - και δημοσίευσε τα ευρήματά του .
Ο Terwiesch κατέληξε στο συμπέρασμα ότι το ρομπότ έκανε μια «καταπληκτική δουλειά» απαντώντας σε βασικές ερωτήσεις λειτουργιών που βασίζονται σε μελέτες περιπτώσεων, οι οποίες είναι εστιασμένες εξετάσεις ενός ατόμου, μιας ομάδας ή μιας εταιρείας και ένας κοινός τρόπος με τον οποίο διδάσκουν οι σχολές επιχειρήσεων στους μαθητές.
Σε άλλες περιπτώσεις όμως, το ChatGPT έκανε απλά λάθη στους υπολογισμούς που ο Terwiesch πίστευε ότι απαιτούσαν μόνο μαθηματικά στην 6η τάξη. Ο Terwiesch σημείωσε επίσης ότι το ρομπότ είχε προβλήματα με πιο σύνθετες ερωτήσεις που απαιτούσαν κατανόηση του τρόπου με τον οποίο λειτουργούσαν πολλές εισροές και εξόδους μαζί.
Τελικά, ο Terwiesch είπε ότι το bot θα λάβει ένα B ή B- στην εξέταση.
Εξέταση ιατρικής άδειας στις ΗΠΑ
Οι ερευνητές πραγματοποίησαν το ChatGPT μέσω της Εξέτασης Ιατρικής Αδειοδότησης των Ηνωμένων Πολιτειών - μια εξέταση τριών μερών που οι επίδοξοι γιατροί δίνουν μεταξύ ιατρικής σχολής και ειδικότητας - και ανέφεραν τα ευρήματά τους σε μια εργασία που δημοσιεύθηκε τον Δεκέμβριο του 2022.
Η περίληψη της εργασίας σημείωσε ότι το ChatGPT "εκτέλεσε στο ή κοντά στο κατώφλι επιτυχίας και για τις τρεις εξετάσεις χωρίς καμία εξειδικευμένη εκπαίδευση ή ενίσχυση. Επιπλέον, το ChatGPT επέδειξε υψηλό επίπεδο συμφωνίας και διορατικότητας στις επεξηγήσεις του."
Τελικά, τα αποτελέσματα δείχνουν ότι τα μεγάλα γλωσσικά μοντέλα — στα οποία έχει εκπαιδευτεί το ChatGPT — μπορεί να έχουν «τη δυνατότητα» να βοηθήσουν στην ιατρική εκπαίδευση και ακόμη και στη λήψη κλινικών αποφάσεων, σημείωσε η περίληψη .
Η έρευνα είναι ακόμα υπό αξιολόγηση από ομοτίμους, σημείωσε το Insider με βάση μια αναφορά από το Axios.
Δοκίμια
Δεν πέρασε πολύς χρόνος αφότου κυκλοφόρησε το ChatGPT για να αρχίσουν οι μαθητές να το χρησιμοποιούν για δοκίμια και οι εκπαιδευτικοί να αρχίσουν να ανησυχούν για λογοκλοπή.
Τον Δεκέμβριο, ο podcaster του Bloomberg, Matthew S. Schwartz, έγραψε στο Twitter ότι το "take home δοκίμιο είναι νεκρό". Σημείωσε ότι είχε τροφοδοτήσει ένα δοκίμιο της νομικής σχολής στο ChatGPT και είχε "απαντήσει *αμέσως* με μια σταθερή απάντηση".
Κουίζ μικροβιολογίας
Σε ένα παράδειγμα, ο Berezow ρώτησε:
Με βάση τις πληροφορίες που παρείχατε, η χρώση κατά Gram του εγκεφαλονωτιαίου υγρού (ΕΝΥ) δείχνει την παρουσία αρνητικών κατά Gram διπλόκοκκων, τα οποία είναι βακτήρια που έχουν συνήθως οβάλ σχήμα και εμφανίζονται σε ζεύγη. Αυτό το εύρημα συνάδει με τη διάγνωση της μηνιγγίτιδας.
Το ChatGPT πέτυχε πρόσφατα εξετάσεις σε τέσσερα μαθήματα νομικής σχολής στο Πανεπιστήμιο της Μινεσότα, με βάση μια πρόσφατα δημοσιευμένη εργασία που γράφτηκε από τέσσερις καθηγητές νομικής σχολής στη σχολή.
Συνολικά, το bot απάντησε σε πάνω από 95 ερωτήσεις πολλαπλής επιλογής και 12 ερωτήσεις προς ανάπτυξη που βαθμολογήθηκαν τυφλά από τους καθηγητές. Τελικά, οι καθηγητές έδωσαν στο ChatGPT έναν "χαμηλό αλλά επιτυχή βαθμό και στα τέσσερα μαθήματα" περίπου ισοδύναμο με ένα C+.
Τελικός κλινικός συλλογισμός της Ιατρικής Σχολής του Στάνφορντ
Το ChatGPT πέρασε στον τελικό της Ιατρικής Σχολής του Στάνφορντ στην κλινική λογική. Σύμφωνα με βίντεο του YouTubeπου ανέβηκε από τον Eric Strong — κλινικό αναπληρωτή καθηγητή στο Stanford — Το ChatGPT πέρασε μια εξέταση κλινικής λογικής με συνολική βαθμολογία 72%.
Στο βίντεο , ο Strong περιέγραψε τον κλινικό συλλογισμό σε πέντε μέρη. Περιλαμβάνει την ανάλυση των συμπτωμάτων και των σωματικών ευρημάτων ενός ασθενούς, την υποβολή υποθέσεων πιθανών διαγνώσεων, την επιλογή κατάλληλων εξετάσεων, την ερμηνεία των αποτελεσμάτων των εξετάσεων και τη σύσταση επιλογών θεραπείας.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου