Tech

Gjithçka që duhet të dini për Gemini 1.0, konkurrenti i ChatGPT!

Është fillimi i një epoke të re të Inteligjencës Artificiale në Google, epoka e Gemini. Gemini është produkti më i fundit i Google, të cilin Pichai e prezantoi për herë të parë në konferencën e zhvilluesve I/O në qershor dhe tani po lançohet për publikun. Bëhet fjalë për një platformë që thuhet se u testua për zgjidhjen e shumë problemeve në disa fusha, përfshirë matematikën dhe shkencat humane.

Sipas mediave të huaja, Gemini është një model i ri dhe i fuqishëm i inteligjencës artificiale nga Google që mund të kuptojë jo vetëm tekstin, por edhe imazhet, videot dhe audion. Si një model multimodal, Gemini përshkruhet si i aftë për të kryer detyra komplekse në matematikë, fizikë dhe fusha të tjera, si dhe për të kuptuar dhe gjeneruar kode me cilësi të lartë në gjuhë të ndryshme programimi. Aktualisht është i disponueshëm përmes integrimeve me Google Bard dhe Google Pixel 8 dhe gradualisht do të shpaloset në shërbime të tjera të Google.

“Gemini është rezultat i përpjekjeve bashkëpunuese në shkallë të gjerë nga ekipet në të gjithë Google, duke përfshirë kolegët tanë në Google Research”,-ka thënë Dennis Hassabis, CEO dhe bashkëthemelues i Google DeepMind.

Ai u ndërtua nga themeli për të qenë multimodal, që do të thotë se mund të përgjithësojë dhe të kuptojë pa probleme, të funksionojë dhe të kombinojë lloje të ndryshme informacioni duke përfshirë tekstin, kodin, audion, imazhin dhe videon.

Gemini u krijua nga Google dhe Alphabet, kompania mëmë e Google, dhe u lançua si modeli më i avancuar i kompanisë deri më sot. Google DeepMind dha gjithashtu një kontribut të rëndësishëm në zhvillimin e Gemini. Google e përshkruan Gemini si një model fleksibël që është i aftë të funksionojë në çdo gjë, nga qendrat e të dhënave të Google deri te pajisjet celulare. Për të arritur këtë shkallë, Gemini po lançdohet në tri modalitete: Gemini Nano, Gemini Pro dhe Gemini Ultra.

Gemini Nano

Versioni Gemini Nano është krijuar për t’u ekzekutuar në telefonat inteligjentë, veçanërisht në Google Pixel 8. Ai është krijuar për të kryer detyra në pajisje që kërkojnë përpunim efikas të AI pa u lidhur me serverë të jashtëm, si për shembull, sugjerimi i përgjigjeve brenda aplikacioneve të bisedës ose përmbledhja e tekstit.

Gemini Pro

Duke funksionuar në qendrat e të dhënave të Google, Gemini Pro është krijuar për të fuqizuar versionin më të fundit të chatbotit të AI të kompanisë, Bard. Ky version është i aftë të japë përgjigje të shpejta dhe të kuptojë pyetje komplekse.

Gemini Ultra

Megjithëse ende i padisponueshëm për përdorim të gjerë, Google e përshkruan Gemini Ultra si modelin e tij më të aftë, duke tejkaluar rezultatet aktuale të nivelit të lartë në 30 nga 32 standardet akademike të përdorura gjerësisht në kërkimin e modelit L.L.M. Ai thuhet se është projektuar për detyra shumë komplekse dhe është vendosur të dalë pas përfundimit të fazës aktuale të testimit.

Gemini tani është i disponueshëm në produktet e Google në versionet e tij Nano dhe Pro, si telefoni Pixel 8 dhe chatbot Bard. Google planifikon të integrojë Gemini me kalimin e kohës në Search, Ads, Chrome dhe shërbime të tjera. Zhvilluesit dhe klientët e ndërmarrjeve do të jenë në gjendje të hyjnë në Gemini Pro nëpërmjet Gemini API në AI Studio të Google dhe Google Cloud Vertex AI duke filluar nga 13 dhjetori.

Modeli i ri Gemini i Google duket të jetë një nga modelet më të mëdha, më të avancuara të AI deri më sot, megjithëse lançimi i modelit Ultra do të jetë ai që do ta përcaktojë me siguri këtë. Megjithatë, krahasuar me modelet e tjera të njohura që fuqizojnë chatbot me AI tani, Gemini dallohet për shkak të karakteristikës së tij multimodale, ndërsa modelet e tjera, si GPT-4, mbështeten në shtojcat dhe integrimet për të qenë vërtet multimodale.

Modeli më i fuqishëm i OpenAI, GPT-4, shihet si standardi i artë i industrisë. Ndërsa Google mburrej se Gemini tejkalon modelin e mëparshëm të OpenAI, GPT 3.5, drejtuesit e kompanisë shmangën pyetjet se sa larg modeli e kalon GPT-4. Por firma thekson një pikë referimi në veçanti, të quajtur MMLU (kuptim masiv i gjuhës me shumë detyra). Ky është një grup testesh të krijuara për të matur performancën e modeleve në detyrat që përfshijnë tekst dhe imazhe, duke përfshirë kuptimin e leximit, matematikën dhe kuize me zgjedhje të shumëfishta në fizikë, ekonomi dhe shkenca sociale.

Në pyetjet vetëm me tekst, Gemini thuhet se “godet” 90% dhe ekspertët njerëzorë shënojnë afërsisht 89%. GPT-4 shënon 86% në këto lloj pyetjesh. Ndërsa në pyetjet multimodale, Gemini arrin 59%, GPT-4 57%. “Është modeli i parë që e kapërcen atë prag”, pretendon Pichai. Veç tij, një mendim të mirë ka edhe ekspertja Melanie Mitchell.

Performanca e Gemini ndaj grupeve të të dhënave standarde është shumë mbresëlënëse. Është e qartë se Gemini është një sistem shumë i sofistikuar i AI. Por nuk është e qartë për mua që është në fakt shumë më i aftë se GPT-4.