Πολύ νερό έχει κυλήσει στο αυλάκι της Τεχνητής Νοημοσύνης (AI) στα τελευταία 30 χρόνια. Τέλη της δεκαετίας ‘80 - αρχές του ‘90 το hot spot της τεχνητής νοημοσύνης ήταν το machine vision και τα decision support expert systems.
Θυμάμαι στο Cranfield το ‘90 ένας Πορτογάλος διδακτορικός συμφοιτητής μου έφτιαξε ένα σταρτ-απ για όραση μηχανών, παρατώντας το διδακτορικό του στη μέση και αφιερώνοντας όλο το χρόνο του για να δουλέψει σε ένα σύστημα που θα αναγνώριζε οπτικά ανταλλακτικά πεσμένα ακανόνιστα μέσα σε ένα κουτί, από τα οποία θα έπρεπε να επιλέξει ένα βιομηχανικό ρομπότ τα σωστά για να συναρμολογήσει ένα εξάρτημα. Παιδευόταν με τις σκιές, τις αποστάσεις την προοπτική και το μέγεθος της εικόνας σε σύγκριση με το πραγματικό μέγεθος του φυσικού αντικειμένου.
33 χρόνια μετά, αυτοκίνητα Tesla οδηγούν σχεδόν μόνα τους στον αυτοκινητόδρομο με βάση εικόνες που παίρνουν από τις κάμερες που έχουν περιμετρικά για να αντιλαμβάνονται το δρόμο, τα άλλα οχήματα, τους πεζούς και τα εμπόδια, με στόχευση να γίνουν ασφαλέστεροι οδηγοί απ' όσο οι άνθρωποι και να εξαλειφθούν τα ατυχήματα από ανθρώπινο λάθος. Αυτό βέβαια θα εξαλείψει τη χρηματιστηριακή αξία των εταιρειών ασφάλισης αυτοκινήτων, καθώς και θα αυξήσει το μέσο όρο ζωής των ανθρώπων, καθώς δεν θα υπάρχουν θύματα αυτοκινητιστικών ατυχημάτων. Πιθανό να έχουν αρκετό δρόμο ακόμα. Ή και όχι.
Το Conversational Intelligence στη διάρκεια αυτών των 30 ετών έκανε τεράστια βήματα με τα convolutional neural networks (CNN - που όμως είναι πιο κατάλληλα για machine vision) και κατόπιν με τα Recurrent Neural Networks (RNN) και τα BRNN (bidirectional) για αναγνώριση λόγου (από ηχητικά σε κείμενο) και για NLP, δηλαδή natural language processing ή επεξεργασία φυσικής γλώσσας.
Μια εταιρεία όπου ήταν ένας από τους αρχικούς επενδυτές ο Έλον Μασκ, η OpenAI, τον Νοέμβριο του 2022 άνοιξε στο κοινό το τελευταίο της προϊόν τεχνητής νοημοσύνης, το chatGPT, το οποίο είναι ένα chatbot με τεράστιο όγκο δεδομένων (175 δισεκατομμύρια παραμέτρους) που χρησιμοποιήθηκε για την εκπαίδευση του και χτίστηκε με την αρχιτεκτονική GPT (Generative Pre-trained Transformer) και βασίζεται στο GPT-3 που είναι το προηγούμενο προϊόν της ίδιας εταιρείας.
Εντός 5 ημερών από την αρχική διάθεσή του το chatGPT είχε τους πρώτους 1.000.000 καταχωρημένους χρήστες, η ταχύτερη αύξηση χρηστών σε ένα εκατομμύριο από οτιδήποτε στο παρελθόν (η Angry Birds έκανε 34 ημέρες για να φτάσει 1.000.000 χρήστες κρατώντας το προηγούμενο ρεκόρ υιοθέτησης νέου προϊόντος), ενώ η Google τρομοκρατήθηκε ότι θα χάσει την πρωτοκαθεδρία στο χώρο των αναζητήσεων γιατί απλά δίνει απαντήσεις ως προτεινόμενους συνδέσμους και όχι ουσιώδεις απαντήσεις σε ερωτήματα και μπήκε σε code-red, δηλαδή κόκκινη επιφυλακή.
Ο πρώτος ΑΙ War ξεκίνησε με την Google να σχεδιάζει απάντηση στην απειλή του chatGPT με την διαθεσιμότητα του δικού της Apprentice, βασισμένου στο μοντέλο Lamda, το οποίο έχει λειτουργία Adaptive AI, με δυνατότητες real time πληροφόρησης σε αντίθεση με το chatGPT που για τις απαντήσεις του χρησιμοποιεί πληροφορίες ως το 2021. Επίσης η Google εξετάζει να διαθέσει το Bard ΑΙ της που μοιάζει στη χρήση με το chatGPT.
Ένας ερευνητής του μοντέλου Lamda προ ολίγων μηνών υποστήριξε ότι (το ΑΙ) έχει επιτύχει συνειδητότητα και αυτο-επίγνωση - και τον απέλυσαν.
Η Microsoft δήλωσε ότι θα χρηματοδοτήσει την OpenAI με ακόμη $10 δισεκατομμύρια πέραν του αρχικού $1 δισ. που έχει ήδη βάλει, με τον όρο ότι θα πάρει τα λεφτά της πίσω, λαμβάνοντας το 75% της κερδοφορίας της OpenAI ώσπου να τα πάρει, και μετά θα έχει το 49% της εταιρείας. Η Microsoft σκοπεύει να διαθέτει πρόσβαση στο chatGPT μέσω της δικής της μηχανής αναζήτησης, της Bing, ενώ πρόσβαση στο chatGPT θα προσφέρει και μέσω των πακέτων της του MS Office.
Επίσης αυτές τις μέρες έγινε διαθέσιμο μόνο στις ΗΠΑ το chatGPT Plus επί πληρωμή 20 USD ανά μήνα, ενώ θα συνεχίσει μια λιγότερο ισχυρή βερσιόν του chatGPT ως δωρεάν υπηρεσία, πιθανόν και με τους περιορισμούς διαθεσιμότητας που εμφανίζει σήμερα.
Το chatGPT επίσης δεν τα πάει καλά ακόμα στις υπόλοιπες γλώσσες πλην αγγλικών, καθώς το μεγαλύτερο μέρος της εκπαίδευσης του συστήματος έγινε στα αγγλικά.
Στην Κίνα η εταιρεία Baidu πριν από λιγότερο από μια βδομάδα ξεκίνησε την διάθεση του ERNIE που προσομοιάζει τη λειτουργία του chatGPT, βλέποντας τις μετοχές της να εκτοξεύονται.
Σε μια αναμέτρηση ανάμεσα στο GPT-3 και το chatGPT, το state-of-the-art language model της OpenAI, ενάντια στους δυο κυρίαρχους ανταγωνιστές της το Open Pre-Trained Transformer (OPT) της εταιρείας Meta που είναι και ιδιοκτήτης της Facebook, και το BLOOM της Big Science Group, στα μέσα Ιανουαρίου επικράτησε το chatGPT. Ο βασικός λόγος είναι ότι το chatGPT χρησιμοποιεί ανθρώπινο feedback για να βελτιώνεται και να μαθαίνει πότε κάνει λάθος.
Όλα αυτά τα μοντέλα έχουν μέγεθος περί τις 175 δισεκατομμύρια παραμέτρους και χρειάζονται τουλάχιστον 8 κάρτες Nvidia Η100 των 14.500 επεξεργαστικών πυρήνων και 80 gigabyte μνήμης η καθεμιά να τρέχουν παράλληλα για να λειτουργήσουν.
Τόσο η Nvidia όσο και η Meta παρέχουν open source εργαλεία για την εκπαίδευση μοντέλων ΤΝ σε υπολογιστές γραφείων αντί για τους υπερυπολογιστές του cloud που χρειάζονται τα μεγάλα μοντέλα που προαναφέραμε. Η Meta παρέχει δωρεάν μοντέλα από 125 εκατ. παραμέτρους ως 30 δισ. παραμέτρους χωρίς πρότερη συνεννόηση, ενώ κατόπιν συνεννόησης παρέχουν ως και το μεγαλύτερο μοντέλο τους το OPT των 175 δισ. παραμέτρων.
Δεδομένου ότι η υπολογιστική ισχύς του ΑΙ διπλασιάζεται κάθε 6 μήνες, και δεδομένου ότι η Microsoft βλέπει το συγκεκριμένο πρότζεκτ ως καμ-μπακ στην επικράτηση της Google στα τελευταία χρόνια στα browser με το Chrome έναντι του Internet Explorer και την αναζήτηση με το google search έναντι του Bing, η Google είναι βέβαιο ότι δεν θα καθίσει με σταυρωμένα τα χέρια.
Άλλοι ως σήμερα άγνωστοι παίκτες από οπουδήποτε στον κόσμο μπορεί να αλλάξουν ολοκληρωτικά την εικόνα των υπηρεσιών Τεχνητής Νοημοσύνης, αν καταφέρουν να εφεύρουν μια νέα αρχιτεκτονική νευρωνικών δικτύων η οποία να έχει χαμηλότερο κόστος εκπαίδευσης από τα $12 εκατ. που λέγεται ότι χρειάζεται ένας γύρος εκπαίδευσης του chatGPT ή των $6 εκατ. που λέγεται ότι χρειάζεται το OPT.
Και δεν κοιτάξαμε καν τα μοντέλα ΑΙ μηχανικής όρασης και δημιουργίας εικόνων από περιγραφή με λέξεις όπως το Dall-e της OpenAI, το TorToiSe TTS για αντιγραφή μιας ανθρώπινης φωνής, το Hugging Face για δημιουργία Automatic Speech Recognition, το Rasa για δημιουργία chatbot και πολλά-πολλά άλλα για διαφορετικές λειτουργίες.
Ίσως σε ένα χρόνο να μιλάμε για επίπεδο τεχνητής νοημοσύνης που θα ανταγωνίζεται ή και θα ξεπερνάει εκείνο του μέσου ανθρώπου (Artificial General Intelligence - AGI).
Οι επόμενοι αρκετοί μήνες υπόσχονται να είναι τουλάχιστον δραματικοί στο μέτωπο της Τεχνητής Νοημοσύνης.
Ανησυχεί κανείς ή όλα καλά;
0 Σχόλια