Google prezintă cel mai mare și „cel mai capabil” model AI al său, Gemini

CEO-ul Google, Sundar Pichai, discută cu Emily Chang în timpul summitului CEO-ului APEC de la Moscone West, pe 16 noiembrie 2023, în San Francisco, California. Summitul APEC va avea loc la San Francisco până pe 17 noiembrie.

Justin Sullivan | Știri Getty Images | Poze bune

Pe măsură ce presiunea crește asupra companiei pentru a răspunde cum să monetizeze inteligența artificială, Google va dezvălui miercuri cel mai mare și cel mai eficient model de inteligență artificială.

Modelul de limbaj mare Gemini va include un set de trei dimensiuni diferite: Gemini Ultra, varianta sa cea mai mare, cea mai eficienta; Gemini Pro, care îndeplinește o gamă largă de sarcini; și Gemini Nano, folosit pentru sarcini specifice și dispozitive mobile.

Deocamdată, compania plănuiește să licențieze Gemini prin Google Cloud pentru ca clienții să le folosească în propriile aplicații. Începând cu 13 decembrie, dezvoltatorii și clienții întreprinderilor pot accesa Gemini Pro prin API-ul Gemini în Google AI Studio sau Google Cloud Vertex AI. Dezvoltatorii Android pot construi și cu Gemini Nano. Gemini va fi, de asemenea, folosit pentru a alimenta produsele Google, cum ar fi chatbot-ul Bard și Search Generative Experience, care încearcă să răspundă la interogări de căutare cu text în stil conversațional (SGE nu este încă disponibil pe scară largă).

Gemini Ultra este primul model care depășește experții umani MMLU (Glossary Multitasking Language Comprehension), care testează atât cunoștințele lumii, cât și abilitățile de rezolvare a problemelor folosind o combinație de 57 de materii precum matematică, fizică, istorie, drept, medicină și etică, a declarat institutul într-o postare pe blog miercuri. Poate înțelege nuanța și raționamentul la subiecte complexe.

READ  Sonda documentelor Trump provoacă confruntare la curtea de apel

„Gemenii este rezultatul unui efort de colaborare la scară largă din partea echipelor de pe Google, inclusiv a colegilor noștri de la Google Research”, a scris CEO-ul Sundar Pichai într-o postare pe blog miercuri. „A fost construit de la zero pentru a fi multimodal, ceea ce înseamnă că poate generaliza, înțelege fără probleme, poate acționa asupra și poate integra diferite tipuri de informații, inclusiv text, cod, audio, imagine și video.”

Începând de astăzi, chatbot-ul Google Bart va folosi Gemini Pro pentru a ajuta cu raționament avansat, planificare, înțelegere și alte abilități. La începutul anului viitor, va lansa o „parte avansată” care folosește Gemini Ultra, au spus directorii la un apel cu reporterii marți. Aceasta marchează cea mai mare actualizare pentru Bard, chatbot-ul său asemănător ChatGPT.

Actualizarea vine la opt luni după ce gigantul de căutare Bard a fost introdus pentru prima dată și la un an după ce OpenAI a introdus ChatGPT în GPT-3.5. În martie a acestui an, startup-ul condus de Sam Altman a lansat GPT-4. Directorii au declarat marți că Gemini Pro a depășit performanța GPT-3.5, dar a evitat întrebările despre cum s-a comparat cu GPT-4.

Când a fost întrebat dacă Google intenționează să taxeze pentru accesul la „Bart Advanced”, directorul general Google pentru Bard, Sissy Hsiao, a spus că se concentrează pe crearea unei experiențe bune și fără detalii de monetizare încă.

Când a fost întrebat la o conferință de presă dacă Gemenii aveau capabilități inovatoare în comparație cu generația actuală de LLM, Eli Collins, vicepreședinte de produs la Google DeepMind, a răspuns: „Mă îndoiesc de asta”.

a spus Google Amânat Lansarea Gemini amintește de momentul în care compania și-a lansat instrumentele AI la începutul acestui an, deoarece nu era gata.

READ  Un cutremur puternic a declanșat o avertizare de tsunami în largul coastei de vest a Japoniei

Mai mulți reporteri au întrebat despre întârziere, la care Collins a răspuns că va dura mai mult timp pentru a testa modele mai avansate. Collins a spus că Gemeni este cel mai testat model AI pe care compania l-a construit vreodată și are „cele mai cuprinzătoare evaluări de siguranță” dintre orice model Google.

În ciuda faptului că este cel mai mare model al său, Gemini Ultra este semnificativ mai ieftin de întreținut, a spus Collins. „Nu numai că este mai eficient, ci și mai eficient”, a spus el. „Încă avem nevoie de calcule semnificative pentru a antrena Gemeni, dar suntem foarte eficienți în capacitatea noastră de a antrena aceste modele”.

Collins a spus că compania va lansa o carte tehnică albă cu mai multe detalii despre model miercuri, dar a spus că nu va dezvălui cifrele circumferinței. La începutul acestui an, CNBC a descoperit că modelul de limbă mare PalM 2 de la Google, cel mai recent model AI la acea vreme, folosea pentru antrenament de aproape cinci ori mai multe date text decât predecesorul său, LLM.

Miercuri, Google a prezentat unitatea sa de procesare a tensorilor de ultimă generație pentru antrenarea modelelor AI. Cipul TPU v5p, pe care Salesforce și startup-ul Litrix au început să-l folosească, oferă performanțe mai bune decât TPU v4 anunțat în 2021, potrivit Google. Dar compania nu a oferit informații despre performanță în comparație cu liderul de piață Nvidia.

Anunțul despre cip vine la câteva săptămâni după ce rivalii din cloud Amazon și Microsoft au prezentat siliciu personalizat pentru AI.

În timpul conferinței telefonice Google privind veniturile din trimestrul al treilea din octombrie, investitorii au adresat directorilor mai multe întrebări despre cum vor transforma AI în profituri reale.

READ  Consumatorii americani sunt mai puțin optimiști cu privire la economie pentru prima dată în această vară

În august, Google a lansat ceea ce a numit un „experiment timpuriu”. Experiență în crearea căutării, sau SGE, care le permite utilizatorilor să vadă cum ar putea arăta o experiență generativă de inteligență artificială atunci când folosesc un motor de căutare – căutarea este încă un centru de profit major pentru companie. Rezultatul este mai multă conversație, ceea ce reflectă vârsta chatbot-urilor. Cu toate acestea, este încă considerat un experiment și nu a fost încă prezentat publicului.

Investitorii au cerut o cronologie pentru SGE încă din luna mai, când compania a anunțat pentru prima dată experimentul la Google I/O, conferința anuală pentru dezvoltatori. Anunțul lui Gemeni de miercuri nu a menționat SGE, iar directorii au fost vagi cu privire la planurile sale de a-și lansa publicul, spunând că Gemeni va fi încorporat „în anul următor”.

„Această eră a modelelor noi este unul dintre cele mai mari eforturi de știință și inginerie pe care le-am întreprins ca companie”, a spus Pichai într-o postare pe blog miercuri. „Sunt foarte încântat de ceea ce urmează și de oportunitățile pe care Gemenii le vor deschide oamenilor de pretutindeni”.

— Jordan Novette de la CNBC a contribuit la acest raport.

Nu ratați aceste povești de la CNBC PRO:

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *