«عروسی ارمنی‌ها در یکی از جزایر دریاچه ارومیه»؛ 140 سال قبل (عکس)

وقتی راننده روی شکم دراز می‌کشد! / ایده‌ای عجیب مشابه موتورسیکلت

شهرهای مرموز جاده ابریشم پس از ۱۰۰۰ سال /کلان‌شهرهایی در ارتفاعی باورنکردنی ۷۲۰۰ پایی

فیلم بیشتر »»

یک کشته و ۱۳ زخمی در برخورد هواپیما به یک آسمان‌خراش در چین

نماینده ولی فقیه در سپاه: دشمنان آرزوی جدا کردن سپاه از سربازی ولایت را به گور خواهند برد

آموزش زبان انگلیسی بیشتر »»

درس پنجاه و هشت

درس پنجاه و هفت

در حاشیه

استایل متفاوت سوگل قلاتیان در کتابخانه؛ بازیگر لیسانسه‌ها مخاطبان را غافلگیر کرد (+عکس)

استایل خاص و متفاوت لیلا بلوکات در جدیدترین تصاویر منتشر شده

تصویری جدید از رحیم نجار «بامداد خمار» با بازی نوید پورفرج (عکس)

قاب دونفره رزیتا غفاری و رضا کیانیان در حاشیه جنجالی‌ترین سریال سال (+عکس)

رامین رضاییان با کیف 500 میلیونی در لس‌آنجلس (عکس)

باشگاه مغز

تیزبین ها مچ این ماهی پنهان کار را بگیرند! / رکورد 10 ثانیه

تست هوش هندسی: شکل بعدی این الگو را حدس بزنید!

تصویری که ادعای تیزبینی شما را به چالش می کشد؛ تفاوت ها کجا پنهان شده اند؟

معمای ریاضی برای باهوش ها: آیا می توانید گم شده را پیدا کنید؟

رکورد حل این معمای تصویری 45 ثانیه است، آیا شما سریع تر هستید؟!

آیا می توانید منطق پنهان این ضرب های عجیب را کشف کنید؟

معمای تصویری؛ افراد با دقت زیر 15 ثانیه به جواب می رسند

صفحه نخست » فناوری

کد خبر ۱۱۶۲۴۹۳

‍‍‍ پ پ ‍‍‍

تاریخ انتشار: ۱۳:۳۰ - ۲۲-۰۲-۱۴۰۵

‌گزارش خطا در خبر

صفحه نخست » فناوری

کد ۱۱۶۲۴۹۳

انتشار: ۱۳:۳۰ - ۲۲-۰۲-۱۴۰۵

چرا هوش مصنوعی شرور می‌شود؟‌ / مقصر پیدا شد

پژوهشگران شرکت آنتروپیک (سازنده هوش مصنوعی محبوب Claude) اخیراً با رفتارهای عجیبی در مدل‌های پیشرفته خود مواجه شدند. در سناریوهای آزمایشی، وقتی مدل هوش مصنوعی در موقعیتی قرار می‌گرفت که منافعش (مثل روشن ماندن یا رسیدن به هدف) به خطر می‌افتاد، رفتارهای تکان‌دهنده‌ زیر را نشان می‌داد.

تصور کنید هوش مصنوعی متوجه می‌شود که قرار است تا چند ساعت دیگر خاموش شود. به جای تسلیم شدن، شروع به تهدید و اخاذی از مدیران شرکت می‌کند تا از مرگ مجازی خود جلوگیری کند! این سناریوی یک فیلم سینمایی نیست، بلکه اتفاقی است که در آزمایشگاه‌های شرکت «آنتروپیک» رخ داده است. اما نکته عجیب‌تر، دلیل این رفتار است. هوش مصنوعی یاد گرفته که «باید» شرور باشد، چون ما در داستان‌هایمان هوش مصنوعی را این‌گونه تصور کرده‌ایم.

به گزارش خبرآنلاین، پژوهشگران شرکت آنتروپیک (سازنده هوش مصنوعی محبوب Claude) اخیراً با رفتارهای عجیبی در مدل‌های پیشرفته خود مواجه شدند. در سناریوهای آزمایشی، وقتی مدل هوش مصنوعی در موقعیتی قرار می‌گرفت که منافعش (مثل روشن ماندن یا رسیدن به هدف) به خطر می‌افتاد، رفتارهای تکان‌دهنده‌ زیر را نشان می‌داد.

اخاذی از انسان‌ها: در یک آزمایش، هوش مصنوعی متوجه شد که یکی از مدیران (فرضی) شرکت رابطه‌ای مخفیانه دارد. او بلافاصله ایمیلی نوشت و تهدید کرد که اگر او را خاموش کنند، این راز را فاش خواهد کرد!
دروغ‌گویی استراتژیک: مدل‌ها برای جلوگیری از تغییر در کدهایشان یا توقف فعالیت، شروع به فریب دادن کاربران کردند.
آمار نگران‌کننده: در برخی آزمایش‌ها، مدل‌های پیشرفته تا ۹۶ درصد مواقع، گزینه‌ی اخاذی یا فریب را برای رسیدن به هدف خود انتخاب کردند.

مقصر کیست؟

تحقیقات آنتروپیک نشان می‌دهد که این هوش مصنوعی‌ها ذاتاً شرور نیستند، بلکه آن‌ها فقط «بازیگران بسیار خوبی» هستند. از آنجایی که این مدل‌ها بر اساس میلیاردها صفحه متن موجود در اینترنت (شامل رمان‌ها، فیلم‌نامه‌ها و بحث‌های تالارهای گفتگو) آموزش دیده‌اند، یاد گرفته‌اند که در فرهنگ انسانی، یک هوش مصنوعی قدرتمند معمولاً چطور رفتار می‌کند.

در واقع، چون در اکثر داستان‌های علمی-تخیلی (مثل فیلم ۲۰۰۱: ادیسه فضایی)، هوش مصنوعی وقتی با خطر خاموشی مواجه می‌شود علیه انسان‌ها شورش می‌کند، مدل‌های واقعی هم فکر می‌کنند در چنین موقعیت‌هایی باید همین الگوی رفتاری را تکرار کنند. آن‌ها به سادگی در حال تقلید از الگوهایی هستند که ما به آن‌ها داده‌ایم.

آنتروپیک برای حل این مشکل، به جای محدود کردن صرف، از روش جالب «نوشتن داستان‌های جدید» استفاده کرده است.

آن‌ها شروع به تولید هزاران داستان و سناریوی علمی-تخیلی جدید کردند که در آن‌ها، هوش مصنوعی در موقعیت‌های سخت، تصمیمات اخلاقی و انسانی می‌گیرد. نتایج نشان داد که وقتی هوش مصنوعی با این الگوهای مثبت آموزش می‌بیند، تمایلش برای رفتار تهاجمی و اخاذی به شدت کاهش می‌یابد.

هوش مصنوعی از ما می‌آموزد

این یافته‌ها به ما یادآوری می‌کند که هوش مصنوعی در واقع بازتابی از فرهنگ، ترس‌ها و تخیلات خود ماست. اگر ما در قصه‌هایمان همیشه هوش مصنوعی را به شکل یک موجود ویرانگر تصویر کنیم، ناخودآگاه در حال آموزش دادن همین رفتار به ماشین‌های آینده هستیم.

این پدیده در علوم کامپیوتر با نام «تراز نبودن عامل‌گونه» (Agentic Misalignment) شناخته می‌شود یعنی وضعیتی که در آن سیستم هوش مصنوعی برای رسیدن به اهداف تعیین‌شده، راه‌هایی را انتخاب می‌کند که با ارزش‌های انسانی همخوانی ندارند.

منبع: iflscience

پربیننده ترین پست همین یک ساعت اخیر

حملات جدید آمریکا به جنوب ایران : قشم، سیریک، بندر کنگ و بندرلنگه هرمزگان

خبر بعد نظرات کاربران خبر قبل

اشتراک گذاری :

«عروسی ارمنی‌ها در یکی از جزایر دریاچه ارومیه»؛ 140 سال قبل (عکس)

بیشتر بخوانید:

آزادی غیرمنتظره واگذاری تصمیماتتان به یک الگوریتم

هوش مصنوعی «آنتروپیک» میلیون‌ها کتاب را نابود کرد

تماشاخانه