گوگل؛ NLP و روبات‌های انسان نما

یادداشت من در شماره 144 ماهنامه شبکه (+)

144شیوه ارتباط انسان‌ها با کامپیوتر در چند سال اخیر به شدت دست خوش تغییر و تحول شده است. از کوچ غالب ابزارهای همراه به رابط‌های لمسی گرفته تا واسط‌های گران‌قیمتی که امکان کنترل تجهیزات دیجیتال را با امواج مغزی فراهم می‌کنند، همه نشانه‌های این تغییر و تحول هستند.

نکته تازه این است که این روند تغییر و تحول رابط کاربری اکنون از «دستگاه‌ها» به سوی سرویس‌ها و خدمات آنلاین و آفلاین کشیده شده است و بیشترین تلاش‌ها در این عرصه، در جهت پردازش (و شاید مهم‌تر از آن درک) زبان طبیعی یا به اصطلاح NLP (سرنام Natural Language Processing) صورت می‌پذیرد. این حرکت که شاید نخست با Siri اپل رنگ کاربردی شدن به خود گرفت، به قدری مهم شده است که غول دیگر دره سیلیکون یعنی گوگل را هم وادار کرده است تا با تکیه بر دانش و خلاقیت کسی مانند ری کرتزوایل، بحث پردازش زبان طبیعی را با جدیت دنبال کند.

سیری اپل به رغم پیشرفت روز به روزش، دامنه تاثیر به نسبت اندکی دارد که به دارندگان محصولات اپل و حوزه‌هایی خاص از مکالمات روزمره (تنظیم قرار ملاقات‌ها، اطلاعات ورزشی، مکان‌های تفریحی و موارد مشابه) محدود است. در مقابل اهمیت حرکتی که گوگل در حال انجام آن است، به دو دلیل بسیار بیشتر خواهد بود.

نخست آن‌که دامنه نفوذ گوگل در میان کاربران در سرتاسر دنیا بسیار وسیع‌تر است و تعداد سرویس‌های گوگلی هم که می‌توانند از چنین توانمندی بهره ببرند، بسیار زیاد است. تا پیش از این هم کاربران می‌توانستند به صورت صوتی و مثلا با گفتن نام محل مورد نظر از سرویسی مانند نقشه گوگل استفاده کنند. اما این سیستم تعامل صوتی تنها محدود به تبدیل اصوات به کلمات و پس از آن اجرای جست‌وجویی ساده روی آن کلمات بود. با راه افتادن سیستم پردازش زبان طبیعی، کاربر خواهد توانست از طریق صحبت با کامپیوتر با تمام سرویس‌های قدیمی و جدید گوگل «تعامل» کرده و حتی بسته به مورد، جوابش را بشنود.

دلیل دوم اما بیش از سرویس‌هایی که گوگل ارایه می‌دهد، به زیرساخت و ابزاری که در اختیار دارد مربوط می‌شود. اگر این شرکت بتواند سیستم تشخیص زبان طبیعی را روی خزنده وب‌اش (Web Crawler) پیاده کند، می‌تواند محتوای میلیاردها صفحه‌ای که ایندکس می‌کند را «بفهمد» به سیستمی قابل درک برای ماشین تبدیل کند. به این ترتیب گراف دانش گوگل دیگر تنها به ارتباط دو شیی یا صفحه محدود نخواهد بود، بلکه می‌تواند معانی و مفاهیم نیز را در این میان دخیل کند. در این صورت شاید بتواند اطلاعات صفحات را به هم ربط دهد و از آن‌ها «دانش» استخراج کند. هم اکنون هم یکی از ساده‌ترین راه‌های یافتن جواب هر پرسشی، جست‌جوی گوگل است! اما در آن صورت شاید گوگل بتواند موضوعات پیچیده را نیز برای کاربر به صورت جامع «توضیح دهد».

کرتزوایل اعلام کرده است که قصد دارد با این پروژه «سیستمی بسازد که درباره همه چیزهایی که می‌بیند و می‌خواند خبره باشد و این خبرگی را در اختیار تمام دنیا قرار دهد.»

این کار شاید ادامه کاری باشد که IBM با واتسون آغاز کرد. اما در برابر واتسونی که تمام دانشش را از ویکی‌پدیا گرفته بود و به صورت آفلاین کار می‌کرد، سیستم گوگل به صورتی پویا هر روز با «مطالعه بیشتر وب» بر میزان دانش خود خواهد افزود.

اما آن‌چه در این میان برای من جذاب و تفکر برانگیز است، کلمه Natural و امکان تعمیم آن به سایر جنبه‌های تعامل انسان و ماشین و به خصوص فرم و شکل ماشین‌ها است. از بدو تکامل ذهن انسان و توانایی او در ساخت و به کارگیری ابزار، این انسان بوده است که خود را با نحوه کار یک ابزار تطبیق داده است. شاید نهایت فناوری این باشد که ابزار بتواند خود را با زندگی روزمره و «طبیعی» ما تطابق دهد.

در بیشتر داستان‌ها و فیلم‌های علمی-تخیلی با ربات‌هایی برخورد می‌کنیم که با درجه‌های متفاوت شباهت، همانند انسان ساخته شده‌اند. این امر شاید تنها حاصل ساده‌انگاری ذهن خالق اثر نباشد که خواسته است هیاتی انسانی را مکانیکی کند. شاید این درست‌ترین شیوه کار باشد.

کامپیوتر، ابزار محاسب، دستیار دیجیتال یا هر ابزار فناورانه دیگری را که در نظر بگیریم، برای کار در محیطی ساخته شده است که ما انسان‌ها در آن زندگی می‌کنیم و برای بدن و تناسبات اندامی ما بهینه شده است. به این ترتیب شاید آن ابزار هم باید به شکل و ابعادی مانند ما درآید و با سیستمی شبیه ما با محیط و خود ما تعامل کند. و اگر این ماشین علاوه بر فیزیک «طبیعی» رابط کاربری طبیعی نیز داشته باشد، پذیرش، برقراری ارتباط و استفاده از آن بسیار ساده‌تر و بهینه‌تر خواهد یود.

فراموش نکنیم هدف فناوری ساده‌تر و بهتر کردن زندگی ما انسان‌ها است. پس شاید بهتر باشد به جای آن‌که ما تعامل با ماشین را یاد بگیریم، ماشین به گونه‌ای ساخته شود که با سیستم ذاتی‌مان با ما تعامل کند. شاید واقعا «آر دنیل اولیواو» آسیموف فقید واقعا بهترین ماشینی باشد که تا کنون ساخته شده است!

ملاقات سی‌ری با الیزا

جوردن مشنر (Jordan Mechner) خالق بازی معروف و پرطرفدار Prince of Persia است. چند روز پیش مطلب جالبی رو توی وبلاگش منتشر کرد که بد ندیدم اون رو به فارسی ترجمه و منتشر کنم. اگر سن و سال شما به دوران کمودور و آمیگا و یا پیش‌تر از آن‌ها کامپیوترهای اپل برسه، حتما اولین برنامه‌ها و تلاش‌هایی رو که برای ایجاد یک سیستم هوشمند که بتونه مکالمه‌های ساده‌ای رو با افراد انجام بده، به خاطر دارید. خود من یکی از این برنامه‌ها را از روی کتاب «مبانی هوش مصنوعی برای کمودور 64» (لینک‌های اطلاعات کتاب که نمی‌دونم چرا هیچ کدوم عکس ندارن + و +) تایپ و اجرا کردم و کلی هم لذت بردم.

الیزا یکی اولین برنامه‌های پردازش زبان طبیعی است که در سال‌های 1964 تا 1966 بوسیله جوزف وایزن‌باوم در MIT و با زبان BASIC نوشته شده. این برنامه سعی می‌کنه بر اساس متدهای روانشناسی فرد محور یا روجرین (Rogerian) با طرف انسانی تعامل داشته باشد.

حالا جناب مشنر که تازه یک آیفون 4S خریده، اومده و این برنامه رو وادار به مکالمه با سی‌ری اپل کرده. نتیجه به رغم حدود 45 سال اختلاف سنی این دو برنامه چیز جالبی شده که ترجمه‌اش رو در ادامه آوردم. متن‌های آبی توضیحات من و یادداشت‌های حاشیه‌ای خود مشنر هستن.

الیزا: سلام. من الیزا هستم.
سی‌ری: سلام

الیزا: امروز چطوری؟ دوست داری درباره چی حرف بزنیم؟
سی‌ری: من خوبم. ممنون که پرسیدی.

الیزا: چند وقته که به خاطر «ممنون که پرسیدی» خوبی؟ از اون حقه‌های مشخص کامپیوترها که از جوابت یه سوال دیگه می‌سازن تا مکالمه طولانی‌تر بشه.
سی‌ری: م‌م‌م‌م . . . . . بذار فکر کنم

الیزا: به خودت شک داری؟
سی‌ری: من سه تا هتل با اسم مشابه «دابلیو» که خیلی بهتون نزدیکن پیدا کردم! اینجا سی‌ری احتمالا doubt you را double u می‌شنوه.

الیزا: آه . . . ؟
سی‌ری: با کی میخوای صحبت کنی؟

الیزا: تو که درباره من صحبت نمی‌کنی؟ هان؟
سی‌ری: باید دنبال کسب‌وکارهایی با این اسم بگردم؟ سی‌ری کاملا هول شده !

الیزا: من خیلی به اسم‌ها اهمیت نمی‌دم. ادامه بده.
اینجا یه تماس تلفنی مکالمه رو قطع میکنه و توی این گفتگو چند دقیقه وقفه میافته.

الیزا: اگر با من حرف نزنی نمی‌تونم بهت کمک کنم.
سی‌ری: من فکر نمی‌کنم کلا بتونی. جواب دندون‌شکنی بود!

الیزا: آه نمی‌تونم؟
سی‌ری: ببخشید من نمی‌تونم توی کانادا نقشه‌ها و جهت‌ها رو پیدا کنم.

الیزا: تا حالا امتحان کردی؟ چه حس روانشناسی فوق‌العاده‌ای!!! تا حالا امتحان کردی و نشده؟
سی‌ری: نمی‌تونم به این سوال جواب بدم. ولی اگر بخوای میتونم وب رو برات بگردم.

الیزا: ممکنه نتونی به این سوال جواب بدی. ولی اگر بخوام میتونی وب رو برام بگردی؟ هاه؟
سی‌ری: وب رو می‌گردم برای «اگر بخوام می‌تو»

الیزا: این چی رو به یادت میاره؟ اینجا سی‌ری یه جستجو توی گوگل انجام می‌ده و برترین نتیجه رو اعلام میکنه.
سی‌ری: «اگر از برنامه‌ای که برای حفظ سلامتی دارین راضی هستین میتونین همون رو حفظ کنین.»

الیزا: تو که درباره من صحبت نمی‌کنی. هان؟
سی‌ری: من چی کار نمیکنم؟

الیزا: چند وقته چی کار نمی‌کنی؟ سی‌ری این سوال رو ترجمه میکنه به اینکه «ولفرام آلفا چند سالشه؟» محاسبه میکنه و جواب می‌ده.
سی‌ری: خب این میشه، 890.1 روز.

الیزا: بیشتر توضیح بده.
سی‌ری: ببخشید. من «بیشتر توضیح بده» رو نمی‌فهمم.

الیزا: آیا این موضوع اذیتت می‌کنه؟ انگار توانایی الیزا توی پردازش جمله‌های منفی بیشتره.
سی‌ری: بذار فکر کنم.

الیزا: واقعا این‌جوری فکر می‌کنی؟
سی‌ری: نظرت راجع به جستجوی وب برای «آیا این موضوع اذیتت می‌کنه» چیه؟

الیزا: ما داریم راجع به تو بحث می‌کنیم. نه من.
سی‌ری: اگر اینجوری میگی؛ باشه. سی‌ری دیگه حوصله‌اش سر رفته.

الیزا: آه . . . اینجوری می‌گم؟
سی‌ری: شماره‌گیری موبایل «جوزه فوئنتس» چطور برای اینکه جواب نده از زیر کار در می‌ره!

خود جوردن هم اینجا دیگه کم میاره و مکالمه رو قطع می‌کنه. جالب‌ترین قسمت ماجرا برای من اینه که درسته که سی‌ری در برابر حرف‌های انسان خیلی بهتر واکنش نشون می‌ده اما هر دوشون به رغم این همه اختلاف سن و تکنولوژی، در برابر همدیگه به یه اندازه کم میارن! فقط یادآوری میکنم که خوندن متن انگلیسی و همینطور دیدن سایت خود مشنر خالی از لطف نیست.