Google DeepMind dezvoltă un cursor AI capabil să înțeleagă intenția utilizatorului

Google DeepMind dezvoltă un cursor AI capabil să înțeleagă intenția utilizatoruluiGemini Nano / sursa foto: dreamstime.com

Google DeepMind lucrează la o nouă tehnologie bazată pe platforma Gemini, care ar putea schimba modul în care utilizatorii interacționează cu computerul, prin transformarea cursorului într-un instrument asistat de inteligență artificială capabil să înțeleagă contextul de pe ecran.

Compania susține că noul sistem urmărește eliminarea nevoii de a întrerupe activitatea pentru a deschide separat un chatbot AI și pentru a explica manual conținutul afișat.

În schimb, utilizatorul ar putea indica direct un element de pe ecran și formula o comandă scurtă, în limbaj natural.

DeepMind vrea o interacțiune AI integrată direct în fluxul de lucru

Potrivit cercetătorilor DeepMind, proiectul are ca obiectiv dezvoltarea unei inteligențe artificiale „intuitive”, care să funcționeze în fundal și să ofere ajutor contextual fără a întrerupe activitatea utilizatorului.

„Vrem exact opusul: o inteligență artificială intuitivă, care le oferă utilizatorilor toate instrumentele necesare, fără să le întrerupă fluxul de lucru”, au transmis reprezentanții DeepMind într-o postare publicată pe blogul oficial al companiei.

Noua tehnologie utilizează contextul vizual și semantic din jurul cursorului pentru a interpreta intenția utilizatorului și pentru a reduce necesitatea unor prompturi lungi sau complexe.

Cum ar putea funcționa noul sistem bazat pe Gemini

În exemplele prezentate de Google, cursorul poate fi plasat peste un tabel pentru generarea automată a unui grafic, peste o rețetă pentru recalcularea ingredientelor sau peste un document PDF pentru obținerea unui rezumat scurt care poate fi introdus într-un e-mail.

Compania a prezentat și un scenariu în care un cadru extras dintr-un videoclip de călătorie este analizat instantaneu, iar utilizatorul primește direct un link de rezervare pentru restaurantul identificat în imagine.

google chrome

google chrome / Sursa foto. dreamstime.com

DeepMind afirmă că tehnologia este construită pe modelele Gemini și poate interpreta simultan elemente vizuale, text și contextul aplicației folosite.

Integrare în Google Chrome și viitoarele laptopuri Googlebook

Google a anunțat că funcția va fi integrată și în browserul Chrome. Utilizatorii vor putea selecta produse, imagini sau texte de pe o pagină web și vor putea adresa întrebări către Gemini fără a deschide o interfață separată.

Printre exemplele oferite se numără compararea automată a unor produse selectate pe un site sau simularea modului în care o piesă de mobilier s-ar integra într-o fotografie a propriei locuințe.

În paralel, compania pregătește integrarea tehnologiei și în „Googlebook”, o nouă gamă de laptopuri bazate pe Gemini, unde inteligența artificială ar urma să fie integrată direct la nivelul sistemului de operare.

Cursorul computerului, reconsiderat după aproape 50 de ani

Cercetătorii DeepMind susțin că proiectul urmărește redefinirea modului în care oamenii folosesc dispozitivele digitale, într-un context în care cursorul mouse-ului a rămas aproape neschimbat de mai multe decenii.

„Construirea unei tehnologii care se adaptează comportamentului uman – și nu invers – deschide drumul către un viitor în care colaborarea cu inteligența artificială va părea intuitivă, fluidă și naturală”, au transmis reprezentanții companiei.

Google a prezentat deja două demonstrații experimentale în Google AI Studio, dedicate editării imaginilor și căutării pe hartă, însă compania nu a anunțat încă o dată oficială pentru lansarea publică a noii funcții.