احتمالا در ویدئویی که پیش از این برای نمایش این قابلیت توسط مایکروسافت منتشر شده، حاصل تحقیقات چندین ساله محققان و کارشناسان مایکروسافت روی این تکنولوژی که هم اکنون در قالب اسکایپ عرضه شده را دیده اید.
مایکروسافت در حال حاضر از تکنولوژی هایی اختصاصی برای ترجمه متون استفاده می کند که مترجم اسکایپ نیز کمی از سیستم ترجمه متن بینگ بهره می برد. در حال حاضر سرویس ترجمه متنی مایکروسافت برای ترجمه زبان های خارجی برای محصولات، راهنماها و صدها صفحه پشتیبانی مورد استفاده قرار می گیرد.
به گفته Viram Dendi از بخش تحقیق و توسعه مایکروسافت: مرکز پشتیبانی مایکروسافت یکی از بزرگترین و بهترین سرویس های منابع اینترنتی در این حوزه به حساب می آید.
اما هوش ماشین ترجمه مایکروسافت اصل داستان است. Skype Translator واژه هایی که شما می گویید را درک می کند، به متن تبدیل می کند، آنها را -به زبان مخاطب- ترجمه می کند و سپس به صورت صوتی برای آن سوی مکالمه بیانشان می کند. و مهمترین بخش این پروسه، دریافت صوت و تبدیل آن به متن است.
اما شاید با خود بگویید شناسایی صوت و تبدیل آن به متن که تکنولوژی جدیدی نیست و سال هاست که مورد استفاده قرار می گیرد. اما در این مورد خاص، مایکروسافت از حوزه خاصی از هوش مصنوعی برای شناسایی صدا بهره برده که به شبکه های عصبی شناخته می شود.
بحث شبکه های عصبی از سال ۱۹۸۰ مطرح شده است. مهمترین استفاده از این تکنولوژی حدود دو سال پیش و در ۲۰۱۲ بود که گوگل اعلام کرد از این طریق در حال تشخیص ویدئوهایی است که در آنها یک ‘گربه’ دیده می شود. آن تجربه به گوگل کمک شایانی در موتور تشخیص صدای اندروید کرد. اما در پشت صحنه مایکروسافت نیز برنامه های خودش را روی پروژه ترجمه همزمان اسکایپ پیش می برد.
به گفته John Platt، مایکروسافت حدود یک دهه پیش از اینکه گوگل به فکر استفاده از این تکنولوژی در شناسایی گربه های یوتوبش باشد، در حال استفاده از آن برای شناسایی دستخط ها روی تبلت ها بود. اما استفاده از آن در چیزی مثل مترجم همزمان اسکایپ بحثی کاملا متفاوت است. این به معنی قدرت شناخت صحبت های هر فردی است.
این مساله از زمانی پیش از کریسمس سال ۲۰۰۹ شروع شد که مایکروسافت اسپانسر یک نشست کوچک دانشگاهی در بریتیش کلمبیا بود. سخنران دعوت شده -Geoff Hinton از دانشگاه تورنتو- بر روی ماشینی کار کرده بود که قابلیت بازشناسی میمیک های عصبی انسانی را داشت و می توانست به تدریج به درکی عمیق تر و عمیق تر از زبان انگلیسی برسد.
مایکروسافت به سرعت بر روی این ایده سرمایه گذاری کرد تا ایده هینتون بتواند به مرحله آزمایش برسد. نتایج خیره کننده بودند. قدرت تشخیص صدا تا ۲۵ درصد بهبود یافت. Peter Lee -رئیس بخش تحقیق مایکروسافت- در این باره به وایرد می گوید: «ما آن نتایج را منتشر کردیم و دنیا عوض شد.»
حالا مایکروسافت آماده تغییر دنیا در آینده نزدیک است. امکان گفتگوی چهره به چهرهٔ دو فرد با زبان و فرهنگ متفاوت چیزی است که می تواند ارتباطات را نسبت به چیزی که تا به حال درک می کردیم، کاملا متحول کند. مثل فیلم های علمی و تخیلی به نظر می رسد.
ویکرام دندی می گوید: با وجود اینکه ما اعلام کردیم عرضه نسخه آزمایشی عمومی اسکایپ تا انتهای سال به انجام می رسد، تا پیش از روز دوشنبه -در میانه دسامبر ۲۰۱۴- پنجاه هزار نفر برای دسترسی به نسخه بتای اسکایپ -که قابلیت ترجمه همزمان دارد- ثبت نام کرده اند. تنها یک روز بعد تعداد درخواست ها دو برابر شد و این نشان می دهد مردم به شدت نسبت به معنی این تغییر در ارتباطات هیجان زده هستند.