فیلم بیشتر »»
کد خبر ۱۱۴۳۲۳۵
تاریخ انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴
کد ۱۱۴۳۲۳۵
انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!
ظاهراً دقت مدل‌های هوش مصنوعی در گفت‌وگوهای چندمرحله‌ای طولانی کاهش می‌یابد.

شرکت‌های پیشرو طی سال‌های اخیر مدل‌ها و چت‌بات‌های پیشرفته‌ای را برای تثبیت جایگاه برند خود در بازار پرشتاب هوش مصنوعی معرفی کرده‌اند؛ بازاری که دنبال‌کردن تحولاتش همچنان ساده نیست و با وجود پیشرفت‌های فنی، کاربران همچنان از توهم‌زایی و پاسخ‌های نادرست در تعامل با این مدل‌ها گلایه دارند.

به گزارش زومیت، Microsoft Research و Salesforce در پژوهشی مشترک با تحلیل بیش از ۲۰۰ هزار مکالمه‌ی مرتبط با مدل‌هایی مانند GPT-4.1، Gemini 2.5 Pro، Claude 3.7 Sonnet، o3، DeepSeek R1 و Llama 4، نشان دادند که مدل‌های زبانی بزرگ در مکالمه‌های چندمرحله‌ای دچار افت عملکرد می‌شوند و به‌اصطلاح «در گفت‌وگو گم می‌شوند».

طبق تحقیقات، نرخ موفقیت مدل‌هایی مانند GPT-4.1 و Gemini 2.5 Pro در سناریوهای تک‌درخواستی به حدود ۹۰ درصد می‌رسد؛ اما عملکرد همین مدل‌ها در گفت‌وگوهای رفت‌وبرگشتی طولانی با کاهش محسوسی روبه‌رو می‌شود و میانگین موفقیت آن‌ها به نزدیک ۶۵ درصد سقوط می‌کند.

پژوهش مایکروسافت نشان می‌دهد افت کیفیت لزوماً به‌معنای کاهش چشمگیر توانایی نیست. در واقع، گفته می‌شود هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر خواهد شد.

تحلیل‌ها همچنین از بروز پدیده‌ای با عنوان «تورم پاسخ» حکایت دارند؛ به‌گونه‌ای که طول خروجی‌ها در مکالمه‌های چندنوبتی بین ۲۰ تا ۳۰۰ درصد افزایش می‌یابد. پاسخ‌های مفصل‌تر فرضیات بیشتری وارد متن می‌کنند و احتمال توهم‌زایی را بالا می‌برند؛ خطاهایی که سپس به‌عنوان زمینه‌ی دائمی گفت‌وگو استفاده می‌شوند.

در شرایطی که استفاده از ابزارهای هوش مصنوعی به‌سرعت گسترش پیدا می‌کند و قابلیت‌هایی مانند Google AI Overviews به تجربه‌ی جست‌وجوی افزوده شده‌اند، کنارگذاشتن موتورهای جست‌وجوی سنتی و اتکا به پاسخ‌های تولیدشده با مدل‌های هوش مصنوعی می‌تواند ریسک‌پذیر باشد.

ارسال به دوستان
حذف پوشش بیمه‌ای آزمایش ویتامین D احتمال غیبت روزبه چشمی در فهرست نهایی تیم ملی تمدید فرصت ثبت‌نام و ویرایش اطلاعات آزمون کارشناسی ارشد ۱۴۰۵ مشکات‌ الزهرا صفی نایب قهرمان تنیس تور جهانی ارمنستان شد مسدودی تونل امیرکبیر تهران در بامداد یکشنبه شکایت رسمی پرسپولیس از سازمان لیگ به AFC یونیسف: هزاران کودک در غزه در شرایط سوء تغذیه و انباشت زباله زندگی می‌کنند جدال تاکتیکی پاریس و آرسنال؛ بازگشت مهره‌های کلیدی قرارگاه خاتم‌الانبیا:‌ تنگه هرمز را مقتدرانه مدیریت می‌کنیم چه زمانی وکیل کیفری می‌تواند حکم قطعی دادگاه را تغییر دهد؟ آمریکا، بریتانیا و استرالیا پهپادهای زیرآبی می‌سازند نخست‌وزیر اسبق انگلیس: مذاکره با حماس برای انتقال اداره غزه طی روزهای آتی آغاز می‌شود بازگشت حجاج استان فارس به شیراز از ۱۹ خردادماه بررسی رده‌بندی پیراهن‌های جام جهانی ۲۰۲۶؛ جایگاه ایران و برترین‌های دنیا نقد عملکرد دفاعی تیم ملی؛ هشدار فریبا در آستانه جام جهانی