فیلم بیشتر »»
کد خبر ۱۱۲۳۰۹۴
تاریخ انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴
کد ۱۱۲۳۰۹۴
انتشار: ۰۷:۴۷ - ۲۳-۰۹-۱۴۰۴

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها

هوش مصنوعی همه‌چیزدان نیست؛ دقت ۶۹ درصدی پیشرفته‌ترین مدل‌ها
آمار جدید محققان گوگل نشان می‌دهد که حتی پیشرفته‌ترین مدل هوش مصنوعی موجود دقت ۶۹ درصدی دارد.

گوگل تصویری نگران‌کننده از میزان دقت هوش مصنوعی در بیان حقایق به دست آورد. گوگل دیپ‌مایند هفته‌ی گذشته از مجموعه‌ی بنچمارک FACTS رونمایی کرد؛ ابزاری برای سنجش اعتبار و درستی پاسخ‌های مدل‌های AI.

به گزارش زومیت، این بنچمارک مدل‌ها را در چهار حوزه‌ی کلیدی به چالش می‌کشد: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده‌ی مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر. در این آزمون، جمنای ۳ پرو گوگل با کسب امتیاز ۶۹ درصد، بهترین عملکرد را به ثبت رساند؛ درحالی‌که سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر از این سطح قرار گرفتند.

آمار مذکور باید زنگ خطری جدی برای کسب‌وکارهایی باشد که روی هوش مصنوعی شرط بسته‌اند. اگرچه مدل‌ها در سرعت و شیوایی کلام بی‌نظیرند؛ اما قابلیت اطمینان آن‌ها در بیان حقایق همچنان فرسنگ‌ها با انتظارات انسانی فاصله دارد؛ به‌ویژه در وظایفی که نیازمند دانش تخصصی، استدلال پیچیده یا استناد دقیق به منابع هستند.

حتی خطاهای واقعی کوچک در صنایعی مانند امور مالی، بهداشت و درمان و حقوق می‌توانند پیامدهای ویرانگری به‌همراه داشته باشند. یکی از خبرنگاران روایت می‌کند که چگونه یک شرکت حقوقی، کارمندش را به دلیل استفاده از ChatGPT در تنظیم لایحه‌ای که مملو از پرونده‌های ساختگی بود، اخراج کرد.

بنچمارک FACTS هم هشدار است و هم نقشه‌ی راه؛ گوگل امید دارد با کاهش نقاط شکست و نحوه‌ی خطای مدل‌ها، پیشرفت در این حوزه را شتاب ببخشد. اما فعلاً پیام روشن است: هوش مصنوعی بهتر می‌شود؛ اما همچنان در حدود یک‌سوم موارد اشتباه می‌کند.

پربیننده ترین پست همین یک ساعت اخیر
ارسال به دوستان
عضو تیم مذاکره کننده آمریکا: ایران در جنگ پیروز شد اما ممکن است صلح را از دست بدهد چشمان عنکبوت الهام‌بخش کم‌مصرف‌ترین دوربین جهان دیدنی های امروز؛ از حملات اسرائیل به لبنان تا کارگران ربات چینی حق‌الناس در نظریات کارشناسی و قضاوت خبرنگار الجزیره: خط اعتباری برای استفاده ایران از پول هایش طبق توافق، هنوز فعال نشده پایان سرقت‌های سریالی منازل در غرب تهران / دو سارق حرفه‌ای دستگیر شدند رتبه‌بندی ۴۸ تیم جام جهانی ۲۰۲۶ بر اساس قد بازیکنان؛ جایگاه متفاوت ایران و عربستان عکس معروف تشییع شهدای میناب جایزه بهترین عکس خبری سال را بُرد تفاهم امضا شد؛ حالا نوبت اصلاحات است کشف تازه در هگمتانه میزان درآمدهای مالیاتی کشور در دو ماهه نخست امسال ۱۵۲.۱ همت اعلام شد تهران فقیرترین استان ایران از نظر سرانه منابع آب تجدیدپذیر است خشخاش؛ گل زیبای پرحاشیه نرخ سود بین بانکی مشخص شد اگر کل منابع زیرزمینی ایران را بین مردم تقسیم کنیم به هر ایرانی چند دلار می‌رسد؟