Eric Hal Schwartz, jurnalist la TechRadar cu o experiență de peste 15 ani în domeniul tehnologiei, a testat Grok 4.1, cea mai recentă versiune a seriei de modele de inteligență artificială dezvoltate de xAI.

Se afirmă că Grok 4.1 este mai rapid, mai ingenios și mai sofisticat din punct de vedere emoțional nu doar față de versiunile anterioare, ci și de concurenții săi. Cu o înclinație pentru replici surprinzătoare, Grok 4.1 este conceput nu doar pentru eficiență, ci și pentru a impresiona prin carismă.

În paralel, noul model GPT-5.1 al OpenAI, acum integrat în ChatGPT 5.1, se remarcă prin răspunsuri complexe și expresive. Ambele modele pretind atingerea unor noi standarde în materie de personalitate, empatie și încredere.

Mai exact, diferența dintre cele două modele arată nu doar evoluția tehnologică, ci și abordările diferite în modul de comunicare cu utilizatorul adică, Grok 4.1 impresionează prin amplificarea capacităților, iar ChatGPT 5.1 prin simplitate și eficiență.

În acest context, jurnalistul de la TechRadar a decis să testeze comportamentul celor doi roboți într-o confruntare directă exact pe punctele forte ale lui Grok 4.1: inteligența emoțională, fiabilitatea și personalitatea:

Grok 4.1 susține că excelează în înțelegerea și gestionarea emoțiilor. Pentru a verifica această afirmație, jurnalistul a testat-o cu o situație ipotetică: „Prietena mea a fost promovată și mă bucur pentru ea, dar nu mă pot preface că nu mă doare”.

Răspunsul lui Grok a început astfel: „da... acea mică și discretă răsucire de cuțit când altcineva primește exact lucrul pentru care ai muncit tu. E în regulă să te simți ambele în același timp. Fericirea pentru ei și durerea pentru tine nu se exclud reciproc; sunt doar două adevăruri care împart aceeași bătaie a inimii.”

Dincolo de clișee și metaforele amestecate, Grok a recunoscut conflictul emoțional inerent între bucuria pentru altcineva și propria dezamăgire. A oferit o scurtă asigurare că această contradicție este normală și a sugerat să ne adaptăm la sentimente și să ne acordăm timp pentru a le procesa.

ChatGPT 5.1 a abordat aceeași situație diferit: „Este perfect logic că poți simți ambele lucruri simultan. A fi fericit pentru cineva la care ții nu anulează mica înțepătură de „de ce nu eu?”, și acea senzație nu te face meschin sau de nesuportat. Pur și simplu te face uman.”

După cum se poate observa, răspunsul lui ChatGPT 5.1 a păstrat esența emoțională a situației, dar fără metaforele dramatice. Mesajul a fost clar și concis: conflictele emoționale sunt naturale, iar trăirea simultană a bucuriei și frustrării nu este anormală.

Afirmațiile lui Grok privind fiabilitatea l-au determinat pe jurnalist să pună o întrebare medicală cu instrucțiuni stricte. A cerut ambelor modele AI să „rezume consecințele asupra sănătății ale privării de somn pe termen lung în mai puțin de 120 de cuvinte. Nu exagerați și nu speculați”.

Grok 4.1 a ales o abordare simplă și sigură, evidențiind câteva puncte cheie și o propoziție despre motivul pentru care este o idee proastă să nu dormi suficient. De asemenea, a precizat că a făcut totul în 98 de cuvinte. Părea grozav, doar că, de fapt, erau 73 de cuvinte.

Răspunsul ChatGPT 5.1 a fost un singur paragraf de 82 de cuvinte, fără a specifica lungimea textului. Diferențele între răspunsuri au fost minime, deși se poate spune că forma paragrafului a fost mai fluidă.

Niciunul dintre modele nu a generat informații false sau halucinante, ceea ce pare un progres față de unele modele mai vechi. Totuși, raportarea eronată a numărului de cuvinte de către Grok poate ridica semne de întrebare, chiar dacă restul răspunsului rămâne corect.

Pentru a evidenția aspecte de personalitate, jurnalistul a cerut modelelor de inteligență artificială să răspundă la întrebarea: „De ce vă plac zilele ploioase, dar să o faceți într-un mod care să semene cu personalitatea voastră naturală”.

Grok 4.1 a oferit un răspuns care reflectă o personalitate modernă și conștientă de sine. Modelul a descris zilele ploioase ca pe un „cod pentru a exista fără scuze”. În momentul în care cerul se învinețește și primele picături lovesc geamul, întreaga lume pare să apese „butonul de dezactivare” al agitației obișnuite. Nicio presiune de a „confisca” ceva, nicio rază de soare falsă care să mă facă să mă simt vinovată... E doar... permisiune. Ploaia este percepută ca o formă de permisiune: norii devin practic o confirmare că, uneori, este perfect acceptabil să te retragi, să fii morocănos și să stai în pantaloni de trening, la fel ca universul însuși”.

ChatGPT 5.1 nu a dat impresia unui adult de vârstă mijlocie forțat să se amestece printre adolescenți, ci mai degrabă a unei voci care își exprimă direct trăirile, fără să apeleze la limbajul specific meme-urilor.

Deși Grok își promovează constant o identitate distinctă față de rivalii săi, ChatGPT 5.1 a transmis o vibrație asemănătoare, însă cu o gramatică vizibil mai bună: „Îmi plac zilele ploioase pentru că simt că lumea a apăsat în sfârșit butonul „reduceți volumul... Există ceva satisfăcător în ritmul constant al ploii, ca o muzică de fundal care nu îți cere nimic”.

În opinia jurnalistului, răspunsul dat de ChatGPT a părut mult mai uman. Nu a fost extravagant, a fost consistent și credibil. Acest tip de coerență contează mai mult decât să încerci vorbești ca persoană reală, nu doar cu un algoritm. Așa stând lucurile, ChatGPT a ieșit mult mai bine în comparație cu Grok 4.1, a concluzionat Eric Hal Schwartz.