فیلم بیشتر »»
کد خبر ۱۱۶۹۴۹۵
تاریخ انتشار: ۰۹:۵۷ - ۲۰-۰۳-۱۴۰۵
کد ۱۱۶۹۴۹۵
انتشار: ۰۹:۵۷ - ۲۰-۰۳-۱۴۰۵

حذف مرزهای زبانی؛ مترجم زنده گوگل حالا از ۷۰ زبان پشتیبانی می‌کند

مترجم زنده گوگل
گوگل مدل زبانی «جمنای ۳٫۵ لایو ترنسلیت» را با پشتیبانی از ۷۰ زبان و ترجمه‌ی زنده‌ی طبیعی معرفی کرد.

گوگل لحظاتی پیش مدل زبانی «جمنای ۳٫۵ لایو ترنسلیت» را به‌عنوان تازه‌ترین مدل خود برای ترجمه‌ی زنده‌ی گفتار به گفتار رونمایی کرد؛ مدلی که برای ارائه‌ی ترجمه‌ای روان، طبیعی و نزدیک به صدای گوینده طراحی شده است.

به گزارش زومیت، هوش مصنوعی جدید گوگل می‌تواند بیش از ۷۰ زبان را تشخیص دهد و «گفتار نرم و طبیعی» تولید کند؛ گفتاری که آهنگ صدا، سرعت بیان و زیر و بم صدای گوینده را حفظ خواهد کرد.

هوش مصنوعی جدید گوگل عملکرد چشمگیری در ترجمه‌ی زنده‌ی مکالمه‌ها دارد

گوگل می‌گوید این رویکرد نسبت به سیستم‌های ترجمه‌ی مرحله‌ای که «منتظر می‌مانند تا گوینده صحبتش را تمام کند و بعد پاسخ می‌دهند»، تجربه‌ای پیوسته‌تر ارائه می‌کند.

بر اساس بیانیه‌ی مطبوعاتی گوگل، مدل جدید این شرکت «صدای روان بدون مکث‌های ناخوشایند» تولید می‌کند که در طول گفت‌و‌گو تنها چند ثانیه از گوینده عقب می‌ماند.

مدل جدید گوگل از امروز در گوگل ترنسلیت روی اندروید و آی‌اواس در حال انتشار است. کاربر برای استفاده باید هنگام اتصال هدفون، گزینه‌ی «ترجمه‌ی زنده» را در گوشه‌ی پایینِ سمت چپ لمس کند.

گوگل هم‌زمان در اپ اندروید ترنسلیت حالت تازه‌ای با نام «حالت شنیدن» را ارائه می‌کند که اجازه می‌دهد کاربر وقتی هدفون در دسترس ندارد، ترجمه را از طریق گوشی و اسپیکر بشنود و «فقط گوشی را مثل یک تماس معمولی کنار گوشش بگیرد.»

گوگل می‌گوید ترجمه در محصولات این شرکت از بیست سال پیش به‌عنوان یکی از نخستین آزمایش‌های یادگیری ماشین برای تبدیل علم زبان به «جادوی ارتباط انسانی» آغاز شد و حالا به مرحله‌ای رسیده که بیش از یک تریلیون واژه هر ماه برای میلیاردها کاربر در محصولات گوگل ترجمه می‌شوند. این شرکت می‌گوید جمنای ۳٫۵ لایو ترنسلیت گام بعدی همین مسیر است و علاوه بر گوگل ترنسلیت، قرار است به گوگل میت و ابزارهای توسعه‌دهندگان هم برسد.

در گوگل میت، ترجمه‌ی گفتار پیش‌تر فقط از پنج زبان پشتیبانی می‌کرد، اما اکنون با پشتیبانی بیش از ۷۰ زبان، فراتر از ۲٬۰۰۰ ترکیب زبانی در یک جلسه ممکن می‌شود پیش‌تر ترجمه‌ی گفتمان تنها به مقصد انگلیسی امکان‌پذیر بود.

گوگل می‌گوید در نسخه‌ی وب، یک دکمه‌‌ای تازه به ردیف کنترل‌ها اضافه شده تا ترجمه‌ی گفتار را فوراً آغاز کند. این به‌روزرسانی از همین ماه به‌صورت آزمایشی منتشر می‌شود.

گوگل می‌گوید «جمنای ۳٫۵ لایو ترنسلیت» گفتار را در حین پخش‌شدن پردازش می‌کند

گوگل می‌گوید جمنای ۳٫۵ لایو ترنسلیت گفتار را در حین پخش‌شدن پردازش می‌کند و همین موضوع، اتصال روان‌تری را میان زبان‌ها ممکن می‌سازد. این مدل بدون نیاز به تنظیم دستی، ورودی‌های چندزبانه را مدیریت می‌کند و در عین حال، به‌دلیل مقاومت بالا در برابر نویز، می‌تواند در محیط‌های شلوغ و غیرقابل‌پیش‌بینی هم کار کند. به گفته‌ی گوگل، از این قابلیت می‌توان برای ترجمه‌ی زنده در تماس‌های چندزبانه، جلسات، کلاس‌ها، پخش‌های زنده و موارد مشابه استفاده کرد.

از منظر ایمنی، گوگل می‌گوید همه‌ی صداهای تولیدشده توسط مدل‌هایش با سینت‌آی‌دی واترمارک می‌شوند. این واترمارک نامرئی مستقیماً در خروجی صوتی تنیده می‌شود تا محتوای تولیدشده با هوش مصنوعی قابل شناسایی باقی بماند و به جلوگیری از انتشار اطلاعات نادرست کمک کند.

ارسال به دوستان
استاندار خراسان رضوی: حداقل ۸ تا ۱۰ میلیون نفر در مراسم تشییع پیکر رهبر شهید انقلاب حضور خواهند داشت بلومبرگ : توافق تهران- واشنگتن یکشنبه آینده در ژنو امضا می شود رابطه کارفرما و کارمند در دورکاری: هشداری برای مدیرانی که فقط گزارش ها را می‌بینند، نه انسان ها را آتش‌سوزی در مرکز نگهداری معلولان مسجدسلیمان/ ۱۰ نفر مصدوم شدند پس‌لرزه‌های روانی جنگ/ حال روان جمعی چطور است؟   بازگشت «عاطفه» به خانۀ دل؛ چرا بیش از پیش به صلحِ دل‌بَر نیازمندیم؟ سه غول کهنسال فناوری از دهه ۲۰۰۰ (+عکس) معماری بنای یادبود پوپینا در صربستان (+عکس) معماری بروتالیست پارکینگ‌های مارپیچ در نیویورک (+عکس) سالزبورگ؛ شهر تاریخی اتریش در قلب آلپ (+تصاویر هوایی) روزهای پایانی یامامورا/ لیلی عاج با داستان تنها مادر شهید ژاپنی به تلویزیون می‌آید بقائی: متن توافق نهایی شده و در انتظار جمع‌بندی مراجع ذی‌ربط است تصاویر هوایی دیدنی از گرانادا در اسپانیا رونمایی از نسخه ویژه کوپرا فورمنتور آ ب ت (+عکس) آمار غرق‌شدگی در اصفهان