Tech

Google DeepMind prezanton Gemini Robotics

Google DeepMind ka prezantuar Gemini Robotics, një model i avancuar i inteligjencës artificiale i bazuar në teknologjinë Gemini 2.0, i krijuar posaçërisht për aplikime në robotikë.

Kjo shënon një hap të rëndësishëm drejt integrimit të AI në botën fizike përmes të ashtuquajturit “AI i mishëruar” — aftësisë për të kuptuar dhe ndërvepruar me mjedisin në mënyrë të ngjashme me njerëzit.

Deri tani, modelet Gemini janë testuar kryesisht në sfera digjitale si analiza e tekstit, imazhit, audios dhe videos. Por për të qenë realisht të dobishme në jetën e përditshme, këto teknologji duhet të ndërveprojnë edhe me botën reale.

Në këtë kontekst, DeepMind prezantoi dy modele të reja:

Gemini Robotics – një model Vision-Language-Action (VLA) që, përveç të kuptuarit vizual dhe gjuhësor, përfshin edhe veprime fizike, duke i mundësuar kontrollin direkt të robotëve.

Gemini Robotics-ER – një model i ndërtuar për të ofruar arsyetim të mishëruar (Embodied Reasoning) dhe kuptim të avancuar hapësinor, i cili u jep robotistëve mundësinë të zhvillojnë programe të personalizuara për aplikime në jetën reale.

Të dy modelet synojnë të rrisin ndjeshëm kapacitetet e robotëve për të përmbushur detyra komplekse në mjedise reale.

Për këtë qëllim, Google DeepMind ka nisur bashkëpunimin me kompaninë Apptronik për të ndërtuar robotë humanoidë të gjeneratës së ardhshme bazuar në Gemini 2.0, si dhe me një grup të përzgjedhur testuesish për zhvillimin e mëtejshëm të Gemini Robotics-ER.