کد خبر ۱۱۴۳۲۳۵
تاریخ انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴
کد ۱۱۴۳۲۳۵
انتشار: ۰۵:۰۰ - ۰۳-۱۲-۱۴۰۴

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!

هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر می‌شود!
ظاهراً دقت مدل‌های هوش مصنوعی در گفت‌وگوهای چندمرحله‌ای طولانی کاهش می‌یابد.

شرکت‌های پیشرو طی سال‌های اخیر مدل‌ها و چت‌بات‌های پیشرفته‌ای را برای تثبیت جایگاه برند خود در بازار پرشتاب هوش مصنوعی معرفی کرده‌اند؛ بازاری که دنبال‌کردن تحولاتش همچنان ساده نیست و با وجود پیشرفت‌های فنی، کاربران همچنان از توهم‌زایی و پاسخ‌های نادرست در تعامل با این مدل‌ها گلایه دارند.

به گزارش زومیت، Microsoft Research و Salesforce در پژوهشی مشترک با تحلیل بیش از ۲۰۰ هزار مکالمه‌ی مرتبط با مدل‌هایی مانند GPT-4.1، Gemini 2.5 Pro، Claude 3.7 Sonnet، o3، DeepSeek R1 و Llama 4، نشان دادند که مدل‌های زبانی بزرگ در مکالمه‌های چندمرحله‌ای دچار افت عملکرد می‌شوند و به‌اصطلاح «در گفت‌وگو گم می‌شوند».

طبق تحقیقات، نرخ موفقیت مدل‌هایی مانند GPT-4.1 و Gemini 2.5 Pro در سناریوهای تک‌درخواستی به حدود ۹۰ درصد می‌رسد؛ اما عملکرد همین مدل‌ها در گفت‌وگوهای رفت‌وبرگشتی طولانی با کاهش محسوسی روبه‌رو می‌شود و میانگین موفقیت آن‌ها به نزدیک ۶۵ درصد سقوط می‌کند.

پژوهش مایکروسافت نشان می‌دهد افت کیفیت لزوماً به‌معنای کاهش چشمگیر توانایی نیست. در واقع، گفته می‌شود هرچه بیشتر با چت‌بات‌ها صحبت کنید، دقت‌شان کمتر خواهد شد.

تحلیل‌ها همچنین از بروز پدیده‌ای با عنوان «تورم پاسخ» حکایت دارند؛ به‌گونه‌ای که طول خروجی‌ها در مکالمه‌های چندنوبتی بین ۲۰ تا ۳۰۰ درصد افزایش می‌یابد. پاسخ‌های مفصل‌تر فرضیات بیشتری وارد متن می‌کنند و احتمال توهم‌زایی را بالا می‌برند؛ خطاهایی که سپس به‌عنوان زمینه‌ی دائمی گفت‌وگو استفاده می‌شوند.

در شرایطی که استفاده از ابزارهای هوش مصنوعی به‌سرعت گسترش پیدا می‌کند و قابلیت‌هایی مانند Google AI Overviews به تجربه‌ی جست‌وجوی افزوده شده‌اند، کنارگذاشتن موتورهای جست‌وجوی سنتی و اتکا به پاسخ‌های تولیدشده با مدل‌های هوش مصنوعی می‌تواند ریسک‌پذیر باشد.

پربیننده ترین پست همین یک ساعت اخیر
ارسال به دوستان
بهترین شهرهای جهان برای گردشگری سیاه در سال ۲۰۲۶ این غذاها سیستم ایمنی و خلق‌وخوی زنان را تقویت می‌کنند ترامپ مکان نشست مربوط به ایران را تغییر داد ساخت گوی آتشین مینیاتوری در آزمایشگاه برای درک چگونگی شکل‌گیری بارش رادیواکتیو آیا یک خودکار در فضا می‌تواند مثل ماه به دور بدن انسان بچرخد؟ چشم‌انداز زیبای خانۀ ظل‌السلطان (پسر ناصرالدین شاه) در تهران دوران قاجار (عکس) آیا هنوز در هواپیما باید حالت پرواز گوشی را فعال کنیم؟ دلیل اینکه انگشتان ما در آب چروک می‌شوند، چیست؟ کاهش خطر فشار خون بالا با خوردن حبوبات و سویا شاه‌کلید کنترل فشار خون و سلامت قلب را بشناسید اگر زمان بایستد، جهان چه می‌شود؟ فیزیک کابوس‌وار توقف زمان رقابت جهانی برای ساخت بلندترین آسمانخراش جهان در یک قرن گذشته (+ اینفوگرافیک) آموزش زبان انگلیسی به سبک عصر ایران / درس چهل و پنجم چین: توافق پایان جنگ ایران و آمریکا برای تأیید به شورای امنیت ارائه خواهد شد دستور پزشکیان درباره خانوادۀ شهدای جنگ رمضان: به صورت ویژه رسیدگی شود