به جای من فکر نکن

به جای من فکر نکن

یادداشت من در شماره ۱۵۱ ماهنامه شبکه (+)

151اول: اندرو ان‌جی و مفهوم یادگیری عمیق، به احتمال زیاد و به واسطه مقاله منتشر شده در شماره ۱۴۶ ماهنامه باید برای شما آشنا باشد. یادگیری عمیق یا Deep Learning تلاشی است برای شبیه‌سازی عملکرد مغز انسان در یادگیری موضوعات مختلف. البته اگرچه گوگل اکنون با بهره بردن از دانش نوابغی چون کرتزوایل در این حوزه ادعای پیشگامی دارد، اما سابقه تلاش در این زمینه بسیار قدیمی‌تر از فعالیت‌های کنونی گوگل است. باز هم به احتمال زیاد می‌دانید که یکی از اصلی‌ترین کاربردهای کنونی این فناوری و جنبه‌ای که دقیقا خود کرتزوایل بر روی آن متمرکز شده است، درک زبان طبیعی است.

در تعطیلات آخر هفته گذشته این فرصت را داشتم که با دو نمونه مشهور و البته بسیار پیشرفته درک زبان طبیعی یعنی Siri اپل و Google Now محصول غول جست‌وجوی اینترنتی سروکله بزنم. گرچه حاضر جوابی Siri و شیوه پاسخ دادنش به سوالات مختلف و متنوع بسیار جذاب بود، اما واقعیت این است که Siri در برابر Google Now و دقتی که این تازه وارد در تشخیص لهجه عجیب و غریب ما و همین‌طور گستره وسیعی موضوعاتی که درباره آن‌ها قادر به تعامل است، بیشتر به بازیچه‌ای می‌مانست. این قدرت جادویی Google Now بیش از آن‌که مدیون الگوریتم‌های تازه یادگیری عمیق باشد، وام‌دار حجم عظیم داده‌هایی است که گوگل درباره ما در اختیار دارد و می‌تواند از آن‌ها برای آموزش دادن یا train کردن این سیستم یادگیری‌اش استفاده کند. این داده‌ّها که همه از تعاملات معمول من و شمای نوعی استخراج شده‌اند قدرتی باورنکردنی را به این شرکت اعطا می‌کند که تنها می‌توانیم امیدوار باشیم همان‌طور که قول داده است با آن شیطنت نکند. درباره این قدرت کمی بعدتر دوباره حرف خواهم زد.

دوم: باز هم به احتمال زیاد شنیده‌اید که گوگل کاربرانش را تشویق می‌کند که سیستم پیام‌رسانی یا IM خود را با سرویس Hang Out این شرکت ادغام کنند. به ادعای (البته کاملا درست) گوگل در چنین صورتی هزینه‌های ارتباطی کاربر کاهش یافته و او اطلاعات چت‌ها و مسیج‌ها و تماس‌هایش با یک فرد خاص را نیز به صورت یک‌جا و در کنار هم در اختیار خواهد داشت. علاوه بر این‌ها امکان مکالمه رایگان با Google Voice هم حداقل در آمریکا و کانادا برای همه کاربران فراهم است. چیزی که در این میان گوگل هیچ اشاره‌ای به آن نمی‌کند این است که تمام این‌ها علاوه بر منافعی که برای کاربر دارد، در واقع خوراک ماشین پولساز گوگل یعنی تبلیغات را هم فراهم می‌کند. حتی اگر ایده تبلیغات هدف‌گیری شده و غیره را هم کنار بگذاریم، من که بعید می‌دانم Googlerها حداقل برای تفنن و آزمون هم که شده سیستم یادگیری عمیق‌شان را روی مکالمات صوتی Google Voice به کار نبرده باشند!

سوم: بیایید خلاصه دو بند قبلی را کنار هم گذاشته و به هم ربط دهیم تا پازل‌مان تکمیل شود. گوگل الگوریتم یا روشی برای درک زبان طبیعی و البته «فهمیدن» آن دارد. گوگل داده‌های تماس‌ها، مسیج‌ها، قرارهای ملاقات، موضوعات مورد علاقه شما، محل‌هایی که می‌روید، بازی‌هایی که می‌کنید، اسامی دوستان‌تان، اسناد و مدارک کاری یا شخصی‌تان و خلاصه تقریبا هر آن‌چه در زندگی عادی و هویت آنلاین شما مهم است را در اختیار دارد. در این صورت آیا ممکن نیست که بتواند افکار آینده شما را بخواند یا حتی (در آینده نزدیک شاید با اجازه شما) به جای شما فکر کند؟

آخر: اگر تمام این‌ها را رویاپردازی و بدبینی و غیره تصور می‌کنید، بد نیست که خیال‌پردازی‌مان را بسط دهیم. آیا هیچ‌گاه از فعالیت در شبکه‌های اجتماعی خسته شده‌اید؟ این همه لایک و توییت و پلاس‌وان و پست و . . . بخش زیادی از وقت شما را به خود اختصاص می‌دهند؟ آیا بهتر نیست که این کارهای ساده اما زمان‌بر را به کامپیوترها بسپاریم؟ مثلا با شنیدن هشدار تلفن همراه‌تان آن را آنلاک کنید و ببینید که مثلا گوگل براساس اطلاعات گسترده‌ای که از شما دارد و به یاری الگوریتم‌های یادگیری عمیق‌اش، توییتی را براساس تعاملات اخیر شما، براساس سلایق‌تان و درست با لحن نگارشی خودتان آماده کرده و برای ارسال آن تنها منتظر تایید شماست؟ اگر هنوز هم در حال و هوای رویاپردازی هستید، بد نیست که بدانید به گزارش آرس‌تکنیکا این دقیقا پتنتی است که گوگل اخیرا تلاش کرده است آن را به ثبت برساند.

به این ترتیب نه تنها این اطلاعات به گوگل امکان می‌دهد (فعلا) درباره امور ساده‌ای نظیر توییت کردن یا لایک کردن به جای شما تصمیم بگیرد، بلکه بعدتر می‌تواند در تعاملات آنلاین که در آن‌ها به حضور فیزیکی نیازی نیست کاملا جای شما را بگیرد. این موضوع گرچه ممکن است برای سلبریتی‌هایی که معمولا حساب‌های کاربری‌شان را خودشان مدیریت نمی‌کنند یا سازمان‌هایی که هویت انسانی ندارند جالب باشد، اما برای من به عنوان یک انسان بسیار ترسناک است. راستی اگر فرصت کار با Google Now نصیب‌تان شد حتما این سوال را از او بپرسید:

The answer to life, universe and everything

شنیدن پاسخ از زبان Google Now بسیار جذاب‌تر از جست‌وجو دیدن نتیجه آن روی صفحه مرورگر است و این دقیقا دید یک کامپیوتر به هدف زندگی است . . .

گوگل؛ NLP و روبات‌های انسان نما

گوگل؛ NLP و روبات‌های انسان نما

یادداشت من در شماره 144 ماهنامه شبکه (+)

144شیوه ارتباط انسان‌ها با کامپیوتر در چند سال اخیر به شدت دست خوش تغییر و تحول شده است. از کوچ غالب ابزارهای همراه به رابط‌های لمسی گرفته تا واسط‌های گران‌قیمتی که امکان کنترل تجهیزات دیجیتال را با امواج مغزی فراهم می‌کنند، همه نشانه‌های این تغییر و تحول هستند.

نکته تازه این است که این روند تغییر و تحول رابط کاربری اکنون از «دستگاه‌ها» به سوی سرویس‌ها و خدمات آنلاین و آفلاین کشیده شده است و بیشترین تلاش‌ها در این عرصه، در جهت پردازش (و شاید مهم‌تر از آن درک) زبان طبیعی یا به اصطلاح NLP (سرنام Natural Language Processing) صورت می‌پذیرد. این حرکت که شاید نخست با Siri اپل رنگ کاربردی شدن به خود گرفت، به قدری مهم شده است که غول دیگر دره سیلیکون یعنی گوگل را هم وادار کرده است تا با تکیه بر دانش و خلاقیت کسی مانند ری کرتزوایل، بحث پردازش زبان طبیعی را با جدیت دنبال کند.

سیری اپل به رغم پیشرفت روز به روزش، دامنه تاثیر به نسبت اندکی دارد که به دارندگان محصولات اپل و حوزه‌هایی خاص از مکالمات روزمره (تنظیم قرار ملاقات‌ها، اطلاعات ورزشی، مکان‌های تفریحی و موارد مشابه) محدود است. در مقابل اهمیت حرکتی که گوگل در حال انجام آن است، به دو دلیل بسیار بیشتر خواهد بود.

نخست آن‌که دامنه نفوذ گوگل در میان کاربران در سرتاسر دنیا بسیار وسیع‌تر است و تعداد سرویس‌های گوگلی هم که می‌توانند از چنین توانمندی بهره ببرند، بسیار زیاد است. تا پیش از این هم کاربران می‌توانستند به صورت صوتی و مثلا با گفتن نام محل مورد نظر از سرویسی مانند نقشه گوگل استفاده کنند. اما این سیستم تعامل صوتی تنها محدود به تبدیل اصوات به کلمات و پس از آن اجرای جست‌وجویی ساده روی آن کلمات بود. با راه افتادن سیستم پردازش زبان طبیعی، کاربر خواهد توانست از طریق صحبت با کامپیوتر با تمام سرویس‌های قدیمی و جدید گوگل «تعامل» کرده و حتی بسته به مورد، جوابش را بشنود.

دلیل دوم اما بیش از سرویس‌هایی که گوگل ارایه می‌دهد، به زیرساخت و ابزاری که در اختیار دارد مربوط می‌شود. اگر این شرکت بتواند سیستم تشخیص زبان طبیعی را روی خزنده وب‌اش (Web Crawler) پیاده کند، می‌تواند محتوای میلیاردها صفحه‌ای که ایندکس می‌کند را «بفهمد» به سیستمی قابل درک برای ماشین تبدیل کند. به این ترتیب گراف دانش گوگل دیگر تنها به ارتباط دو شیی یا صفحه محدود نخواهد بود، بلکه می‌تواند معانی و مفاهیم نیز را در این میان دخیل کند. در این صورت شاید بتواند اطلاعات صفحات را به هم ربط دهد و از آن‌ها «دانش» استخراج کند. هم اکنون هم یکی از ساده‌ترین راه‌های یافتن جواب هر پرسشی، جست‌جوی گوگل است! اما در آن صورت شاید گوگل بتواند موضوعات پیچیده را نیز برای کاربر به صورت جامع «توضیح دهد».

کرتزوایل اعلام کرده است که قصد دارد با این پروژه «سیستمی بسازد که درباره همه چیزهایی که می‌بیند و می‌خواند خبره باشد و این خبرگی را در اختیار تمام دنیا قرار دهد.»

این کار شاید ادامه کاری باشد که IBM با واتسون آغاز کرد. اما در برابر واتسونی که تمام دانشش را از ویکی‌پدیا گرفته بود و به صورت آفلاین کار می‌کرد، سیستم گوگل به صورتی پویا هر روز با «مطالعه بیشتر وب» بر میزان دانش خود خواهد افزود.

اما آن‌چه در این میان برای من جذاب و تفکر برانگیز است، کلمه Natural و امکان تعمیم آن به سایر جنبه‌های تعامل انسان و ماشین و به خصوص فرم و شکل ماشین‌ها است. از بدو تکامل ذهن انسان و توانایی او در ساخت و به کارگیری ابزار، این انسان بوده است که خود را با نحوه کار یک ابزار تطبیق داده است. شاید نهایت فناوری این باشد که ابزار بتواند خود را با زندگی روزمره و «طبیعی» ما تطابق دهد.

در بیشتر داستان‌ها و فیلم‌های علمی-تخیلی با ربات‌هایی برخورد می‌کنیم که با درجه‌های متفاوت شباهت، همانند انسان ساخته شده‌اند. این امر شاید تنها حاصل ساده‌انگاری ذهن خالق اثر نباشد که خواسته است هیاتی انسانی را مکانیکی کند. شاید این درست‌ترین شیوه کار باشد.

کامپیوتر، ابزار محاسب، دستیار دیجیتال یا هر ابزار فناورانه دیگری را که در نظر بگیریم، برای کار در محیطی ساخته شده است که ما انسان‌ها در آن زندگی می‌کنیم و برای بدن و تناسبات اندامی ما بهینه شده است. به این ترتیب شاید آن ابزار هم باید به شکل و ابعادی مانند ما درآید و با سیستمی شبیه ما با محیط و خود ما تعامل کند. و اگر این ماشین علاوه بر فیزیک «طبیعی» رابط کاربری طبیعی نیز داشته باشد، پذیرش، برقراری ارتباط و استفاده از آن بسیار ساده‌تر و بهینه‌تر خواهد یود.

فراموش نکنیم هدف فناوری ساده‌تر و بهتر کردن زندگی ما انسان‌ها است. پس شاید بهتر باشد به جای آن‌که ما تعامل با ماشین را یاد بگیریم، ماشین به گونه‌ای ساخته شود که با سیستم ذاتی‌مان با ما تعامل کند. شاید واقعا «آر دنیل اولیواو» آسیموف فقید واقعا بهترین ماشینی باشد که تا کنون ساخته شده است!