İstifadəçilər ən yaxşı süni intellekt  seçdilər: bu ChatGPT  deyil
03 dekabr 2025 14:41 (UTC +04:00)

İstifadəçilər ən yaxşı süni intellekt seçdilər: bu ChatGPT deyil

0

Aparılan son araşdırma istifadəçilərin fikrinə əsaslanan ən yaxşı çat-botların reytinqini açıqlayıb və nəticələr gözlənilməz olub. Milyonlarla istifadəçinin sevimlisi olan ChatGPT siyahıda yalnız 8-ci yeri tutub.

Lent.az xarici mediaya istinadla xəbər verir ki, reytinqin zirvəsinə Google Gemini 2.5 Pro yüksəlib.

O, Çin istehsalı DeepSeek və Fransanın Mistral şirkətinə məxsus Magistral modelini geridə qoyub. Humaine çat-botları onların insanla ünsiyyət rahatlığına, dialoqa adaptasiya qabiliyyətinə və yaratdığı etibar hissinə görə qiymətləndirir.

İstifadəçilərin seçiminə əsasən ən yaxşı 10 çat-bot

1. Gemini 2.5 Pro (Google)

Reytinqin lideri. Məlumatı aydın şəkildə təqdim etməsi, dialoqun təbii və axıcı olması ilə seçilir. İstifadəçilər onunla söhbəti demək olar ki, insanla ünsiyyət kimi hiss etdiklərini bildiriblər.

2. DeepSeek v3 (Çin)

İkinci yer. Xüsusilə üslub və cavabların təqdimatında üstün nəticə göstərib, daha çox yaşlı istifadəçilər tərəfindən bəyənilib.

3. Magistral Medium (Mistral, Fransa)

Üçüncü yer. Kiçik fransız şirkəti təbii ünsiyyət və yüksək adaptasiya qabiliyyətinə malik model hazırladığını sübut edib. Lakin etibar və təhlükəsizlik göstəricilərində liderlərdən bir qədər geri qalır.

4. Grok 4 (xAI)

Dördüncü yer. Yenilənmələrdən sonra model daha etibarlı və dostcanlı olub, əvvəlki siyasi yönümlü cavab problemləri aradan qaldırılıb.

5. Grok 3 (xAI)

Beşinci yer. Bəzi istifadəçi qruplarına görə etik davranış baxımından hətta Grok 4-dən üstün olub.

6. Gemini 2.5 Flash (Google)

Altıncı yer. Gemini-nin daha sadə versiyasıdır. Yaxşı nəticələr göstərsə də, Pro versiyasından adaptasiya cəhətdən geri qalır.

7. DeepSeek R1 (Çin)

Yeddinci yer. DeepSeek-in kiçik modeli stabil olsa da, dialoqda daha az çevikdir.

8. ChatGPT-4.1 (OpenAI)

Səkkizinci yer. Populyarlığına baxmayaraq, Humaine istifadəçiləri onun “insana bənzər” ünsiyyət qabiliyyətini liderlərdən aşağı qiymətləndiriblər.

9. Gemma (Google)

Doqquzuncu yer. Sabit, lakin xüsusi seçilən göstəricilərə malik deyil.

10. Gemini 2.0 Flash (Google)

Onuncu yer. Gemini xəttinin daha sadə modeli reytinqi tamamlayır.

Araşdırma necə aparılıb?

Tədqiqat real istifadəçi dialoqları əsasında həyata keçirilib. Araşdırmada ABŞ və Böyük Britaniyadan müxtəlif yaş, irq və siyasi baxışlara sahib təxminən 25 min nəfər iştirak edib.

Hər bir model aşağıdakı 4 kriteriya ilə qiymətləndirilib:

Əsas tapşırığı yerinə yetirmə və məntiqi düşünmə qabiliyyəti;

Söhbəti davam etdirmə və mövzu dəyişməsinə uyğunlaşma;

Üslub və məlumatın təqdimat keyfiyyəti;

Etibarlılıq, etik davranış və cavabların təhlükəsizliyi.

Tədqiqatın əsas özəlliyi head-to-head (üz-üzə) müqayisədir: istifadəçilər eyni anda iki anonim model ilə danışır və daha yaxşısını seçirdilər. Bu metod real söhbət təcrübəsini test etməyə imkan verir.

 

1 2 3 4 5 İDMAN XƏBƏRLƏRİ
0
# 468

Oxşar yazılar