Google lanseaza miercuri Gemini, pe care îl considera cel mai mare si mai capabil model al sau de inteligenta artificiala, deoarece presiunea creste asupra companiei pentru a raspunde cum va monetiza AI, transmite CNBC. Modelul de limbaj mare Gemini va include o suita de trei dimensiuni diferite: Gemini Ultra, categoria sa cea mai mare si cea mai capabila; Gemini Pro, care se extinde într-o gama larga de sarcini; si Gemini Nano, pe care îl va folosi pentru anumite sarcini si dispozitive mobile. Deocamdata, compania planuieste sa licentieze Gemini clientilor prin Google Cloud, pentru ca acestia sa le poata utiliza în propriile aplicatii. Începând cu 13 decembrie, dezvoltatorii si clientii întreprinderilor pot accesa Gemini Pro prin API-ul Gemini în Google AI Studio sau Google Cloud Vertex AI. Dezvoltatorii Android vor putea construi si cu Gemini Nano. Gemini va fi, de asemenea, folosit pentru a alimenta produsele Google, cum ar fi chatbot-ul Bard si Search Generative Experience, care încearca sa raspunda la interogari de cautare cu text în stil conversational (SGE nu este înca disponibil pe scara larga). Gemini Ultra este primul model care depaseste expertii umani în MMLU (întelegerea masiva a limbajului multitask), care utilizeaza o combinatie de 57 de subiecte precum matematica, fizica, istorie, drept, medicina si etica pentru a testa atât cunostintele lumii, cât si abilitatile de rezolvare a problemelor, a spus compania într-o postare pe blog, miercuri. Se presupune ca poate întelege nuanta si rationamentul în subiecte complexe. ”Gemini este rezultatul eforturilor de colaborare pe scara larga ale echipelor Google, inclusiv ale colegilor nostri de la Google Research. A fost construit de la zero pentru a fi multimodal, ceea ce înseamna ca poate generaliza si întelege fara probleme, poate opera si combina diferite tipuri de informatii, inclusiv text, cod, audio, imagine si video”, a scris CEO-ul Sundar Pichai într-o postare pe blog de miercuri. Începând de astazi, chatbot-ul Google Bard va folosi Gemini Pro pentru a ajuta cu rationament avansat, planificare, întelegere si alte capacitati. La începutul anului viitor, Google va lansa ”Bard Advanced”, care va folosi Gemini Ultra, au spus directorii marti, într-un un apel cu reporteri. Lansarea reprezinta cea mai mare actualizare pentru Bard, chatbot-ul sau asemanator ChatGPT. Actualizarea vine la opt luni dupa ce gigantul serviciilor de cautare a lansat pentru prima data Bard si la un an dupa ce OpenAI a lansat ChatGPT pe GPT-3.5. În luns martie a acestui an, startup-ul condus de Sam Altman a lansat GPT-4. Directorii Google au spus marti ca Gemini Pro a depasit performanta GPT-3.5, dar a evitat întrebarile despre cum s-a comparat cu GPT-4. Când a fost întrebat daca Google intentioneaza sa taxeze pentru accesul la ”Bard Advanced”, directorul general al Google pentru Bard, Sissie Hsiao, a spus ca se concentreaza pe crearea unei experiente bune si nu are înca detalii de monetizare. Când a fost întrebat la un briefing de presa daca Gemini are capacitati noi în comparatie cu LLM-urile din generatia actuala, Eli Collins, vicepresedinte de produs la Google DeepMind, a raspuns: ”Banuiesc ca are”, dar ca înca functioneaza pentru a întelege capacitatile noi ale Gemini Ultra. Se pare ca Google a amânat lansarea Gemini pentru ca nu era gata, aducând în minte amintiri despre lansarea de catre companie a instrumentelor sale AI la începutul anului. Mai multi reporteri au întrebat despre întârziere, la care Collins a raspuns ca testarea modelelor mai avansate dureaza mai mult. Collins a spus ca Gemeni este cel mai bine testat model AI construit de companie si ca are ”cele mai cuprinzatoare evaluari de siguranta” dintre orice modele Google. Collins a spus ca, în ciuda faptului ca este cel mai mare model al sau, Gemini Ultra este semnificativ mai ieftin de servit. ”Nu este doar mai capabil, ci si mai eficient. Înca avem nevoie de un calcul semnificativ pentru a antrena Gemini, dar devenim mult mai eficienti în ceea ce priveste capacitatea noastra de a antrena aceste modele”, a spus el. Collins a spus ca compania va lansa o carte tehnica cu mai multe detalii despre model miercuri. La începutul acestui an, CNBC a descoperit ca modelul de limbaj mare PaLM 2 al Google, cel mai recent model AI la acea vreme, folosea de aproape cinci ori mai mult decât cantitatea de date text pentru antrenament ca predecesorul sau LLM. Tot miercuri, Google a prezentat unitatea sa de procesare a tensorilor de ultima generatie pentru antrenarea modelelor AI. Cipul TPU v5p, pe care Salesforce si startup-ul Lightricks au început sa îl foloseasca, ofera o performanta mai buna la pret decât TPU v4 anuntat în 2021, a spus Google. Dar compania nu a furnizat informatii despre performanta în comparatie cu liderul de piata Nvidia.
Google lansează Gemini, pe care îl consideră cel mai mare şi mai capabil model al său de inteligenţă artificială
- de Ziarul de Iasi
- 2023/12/06 08:38
