ملاقات سی‌ری با الیزا

ملاقات سی‌ری با الیزا

جوردن مشنر (Jordan Mechner) خالق بازی معروف و پرطرفدار Prince of Persia است. چند روز پیش مطلب جالبی رو توی وبلاگش منتشر کرد که بد ندیدم اون رو به فارسی ترجمه و منتشر کنم. اگر سن و سال شما به دوران کمودور و آمیگا و یا پیش‌تر از آن‌ها کامپیوترهای اپل برسه، حتما اولین برنامه‌ها و تلاش‌هایی رو که برای ایجاد یک سیستم هوشمند که بتونه مکالمه‌های ساده‌ای رو با افراد انجام بده، به خاطر دارید. خود من یکی از این برنامه‌ها را از روی کتاب «مبانی هوش مصنوعی برای کمودور 64» (لینک‌های اطلاعات کتاب که نمی‌دونم چرا هیچ کدوم عکس ندارن + و +) تایپ و اجرا کردم و کلی هم لذت بردم.

الیزا یکی اولین برنامه‌های پردازش زبان طبیعی است که در سال‌های 1964 تا 1966 بوسیله جوزف وایزن‌باوم در MIT و با زبان BASIC نوشته شده. این برنامه سعی می‌کنه بر اساس متدهای روانشناسی فرد محور یا روجرین (Rogerian) با طرف انسانی تعامل داشته باشد.

حالا جناب مشنر که تازه یک آیفون 4S خریده، اومده و این برنامه رو وادار به مکالمه با سی‌ری اپل کرده. نتیجه به رغم حدود 45 سال اختلاف سنی این دو برنامه چیز جالبی شده که ترجمه‌اش رو در ادامه آوردم. متن‌های آبی توضیحات من و یادداشت‌های حاشیه‌ای خود مشنر هستن.

الیزا: سلام. من الیزا هستم.
سی‌ری: سلام

الیزا: امروز چطوری؟ دوست داری درباره چی حرف بزنیم؟
سی‌ری: من خوبم. ممنون که پرسیدی.

الیزا: چند وقته که به خاطر «ممنون که پرسیدی» خوبی؟ از اون حقه‌های مشخص کامپیوترها که از جوابت یه سوال دیگه می‌سازن تا مکالمه طولانی‌تر بشه.
سی‌ری: م‌م‌م‌م . . . . . بذار فکر کنم

الیزا: به خودت شک داری؟
سی‌ری: من سه تا هتل با اسم مشابه «دابلیو» که خیلی بهتون نزدیکن پیدا کردم! اینجا سی‌ری احتمالا doubt you را double u می‌شنوه.

الیزا: آه . . . ؟
سی‌ری: با کی میخوای صحبت کنی؟

الیزا: تو که درباره من صحبت نمی‌کنی؟ هان؟
سی‌ری: باید دنبال کسب‌وکارهایی با این اسم بگردم؟ سی‌ری کاملا هول شده !

الیزا: من خیلی به اسم‌ها اهمیت نمی‌دم. ادامه بده.
اینجا یه تماس تلفنی مکالمه رو قطع میکنه و توی این گفتگو چند دقیقه وقفه میافته.

الیزا: اگر با من حرف نزنی نمی‌تونم بهت کمک کنم.
سی‌ری: من فکر نمی‌کنم کلا بتونی. جواب دندون‌شکنی بود!

الیزا: آه نمی‌تونم؟
سی‌ری: ببخشید من نمی‌تونم توی کانادا نقشه‌ها و جهت‌ها رو پیدا کنم.

الیزا: تا حالا امتحان کردی؟ چه حس روانشناسی فوق‌العاده‌ای!!! تا حالا امتحان کردی و نشده؟
سی‌ری: نمی‌تونم به این سوال جواب بدم. ولی اگر بخوای میتونم وب رو برات بگردم.

الیزا: ممکنه نتونی به این سوال جواب بدی. ولی اگر بخوام میتونی وب رو برام بگردی؟ هاه؟
سی‌ری: وب رو می‌گردم برای «اگر بخوام می‌تو»

الیزا: این چی رو به یادت میاره؟ اینجا سی‌ری یه جستجو توی گوگل انجام می‌ده و برترین نتیجه رو اعلام میکنه.
سی‌ری: «اگر از برنامه‌ای که برای حفظ سلامتی دارین راضی هستین میتونین همون رو حفظ کنین.»

الیزا: تو که درباره من صحبت نمی‌کنی. هان؟
سی‌ری: من چی کار نمیکنم؟

الیزا: چند وقته چی کار نمی‌کنی؟ سی‌ری این سوال رو ترجمه میکنه به اینکه «ولفرام آلفا چند سالشه؟» محاسبه میکنه و جواب می‌ده.
سی‌ری: خب این میشه، 890.1 روز.

الیزا: بیشتر توضیح بده.
سی‌ری: ببخشید. من «بیشتر توضیح بده» رو نمی‌فهمم.

الیزا: آیا این موضوع اذیتت می‌کنه؟ انگار توانایی الیزا توی پردازش جمله‌های منفی بیشتره.
سی‌ری: بذار فکر کنم.

الیزا: واقعا این‌جوری فکر می‌کنی؟
سی‌ری: نظرت راجع به جستجوی وب برای «آیا این موضوع اذیتت می‌کنه» چیه؟

الیزا: ما داریم راجع به تو بحث می‌کنیم. نه من.
سی‌ری: اگر اینجوری میگی؛ باشه. سی‌ری دیگه حوصله‌اش سر رفته.

الیزا: آه . . . اینجوری می‌گم؟
سی‌ری: شماره‌گیری موبایل «جوزه فوئنتس» چطور برای اینکه جواب نده از زیر کار در می‌ره!

خود جوردن هم اینجا دیگه کم میاره و مکالمه رو قطع می‌کنه. جالب‌ترین قسمت ماجرا برای من اینه که درسته که سی‌ری در برابر حرف‌های انسان خیلی بهتر واکنش نشون می‌ده اما هر دوشون به رغم این همه اختلاف سن و تکنولوژی، در برابر همدیگه به یه اندازه کم میارن! فقط یادآوری میکنم که خوندن متن انگلیسی و همینطور دیدن سایت خود مشنر خالی از لطف نیست.

سی‌ری (Siri)، سیراب کننده کاربران

سی‌ری (Siri)، سیراب کننده کاربران

یا چرا iPhone 4S به اندازه iPhone 5 مهم است.

هرچند خیلی از عاشقان و طرفداران اپل از معرفی آیفون 4S به جای آیفون 5 ناامید و سرخورده شدند، اما به نظر می‌رسه بیشتر کسانی که به صورت عمیق‌تر و دقیق‌تر تکنولوژی و اخبار صنعت آی‌تی رو دنبال میکنن قبول داشته باشن که تکنولوژی تشخیص گفتار طبیعی معرفی شده در این نسخه انقلابی‌تر و جذاب‌تر از تمام تغییرات ظاهری و سخت‌افزاری باشه که همه برای آیفون 5 منتظرش بودن. وبلاگ 1پزشک کنفرانس خبری دیروز اپل رو به قول خودش نیمه‌زنده پوشش داده و انصافا هم به خوبی از پس این کار براومده. اما به شدت پیشنهاد می‌کنم که اول از همه توضیحات و به خصوص ویدیوی تبلیغی اپل رو توی این آدرس ببینید و اگر سواد انگلیسی خوبی دارین، حتما تا انتهای مطلب رو بخونید. تشخیص گفتار از اولین نسخه‌های آیفون یکی از قابلیت‌های پیش‌فرض این گوشی‌ها بوده، اما این نرم‌افزار Siri واقعا مرزهای فناوری و کارایی رو چندین پله جلوتر برده و اون رو برای کاربرای عادی هم قابل استفاده کرده.

این نرم‌افزار که در پس‌زمینه با تکنولوژی‌های شرکت نوانس (نوانس در ویکی‌پدیا) کار می‌کنه، به سادگی زبان طبیعی کاربر رو درک میکنه و بهش عکس‌العمل نشون می‌ده. نه تنها زبان طبیعی رو درک و پردازش می‌کنه بلکه (حداقل اینطوری که از دموها و تبلیغ‌ها بر می‌آد) مفهوم جمله‌ها رو هم در حالت‌های مختلف متوجه میشه. اگر بپرسید «امروز پالتو بپوشم یا نه؟» درک می‌کنه که این سئوال شما به وضعیت آب‌وهوا بستگی داره و در نتیجه با چک کردن پیش‌بینی شرایط جوی به شما جواب می‌ده. اگر بپرسید «این طرف‌ها پیتزافروشی خوب کجاست؟» درک میکنه که «این‌طرف‌ها» یعنی باید از GPS موقعیت شما رو دربیاره و بعد رستوران‌های اون منطقه رو جستجو کنه. تازه این سئوال یادش می‌مونه تا اگر بی‌مقدمه پرسیدین «غذای مکزیکی چی؟» نپرسه «چی یعنی چی؟» و بدونه که منظورتون اینه که این‌طرف‌ها غذای مکزیکی هم پیدا میشه یا نه. این یکی از کامل‌ترین و بهترین نمونه‌های تشخیص  گفتاره که قبلا نمونه‌اش رو فقط توی واتسون IBM دیده بودیم. حالا تصور کنید که قابلیت‌های یک سوپرکامپیوتر چند میلیارد دلاری توی یک گجت 130 گرمی توی جیبتون باشه. ضمن اینکه تقریبا با تمام اپ‌های پیش‌فرض آیفون هم سازگاره و بنابراین برقراری تماس، خوندن و نوشتن پیامک و ایمیل، تنظیم ساعت و زنگ هشدار و . . . به سادگی امکان‌پذیر خواهد بود.

سئوالی که اینجا از هر چیز دیگه‌ای مهمتره اینه که آیا اپل API های این نرم‌افزار قدرتمند رو برای توسعه‌دهنده‌ها باز می‌کنه یا نه. اگر چنین اتفاقی بیافته، خدا می‌دونه که از ترکیب این تکنولوژی با بقیه فناوری‌ها و حسگرها و . . . چه کاربردهایی که برای این سیستم تشخیص گفتار ایجاد نمی‌شه. فرض کنید با گفتن «سردمه!» بسته به موقعیت شما سیستم تهویه ماشین یا خونه تنظیم بشه یا با دونستن سابقه بیماری‌هاتون بهتون پیشنهاد بشه که به جای مترو با تاکسی برین خونه. یا با گفتن  «لعنتی، عجب ترافیکی!» مسیرهای جایگزین برای رسیدن به مقصد رو بهتون پیشنهاد کنه. به نظر من فقط یک نکته خیلی مهم باقی می‌مونه. اگر گجت یا کامپیوتر بتونه مثل یک انسان با ما صحبت کنه آیا اپیدمی گوشه‌گیری و انزواطلبی خوره‌های کامپیوتر چندین پله شدیدتر نمی‌شه؟ چون این آدم‌ها همون یک ذره احساس نیاز به یک دوست و یک همزبون رو هم دیگه می‌تونن با کامپیوترشون ارضا کنن. این جنبه‌اش به شدت ترسناکه.


پی‌نوشتشرکت نوانس هم برای خودش غولی محسوب میشه که ارزش تکنولوژی‌هاش چیزی بسیار بیشتر از تشخیص گفتار برای دارندگان آیفونه. به سایتش دوباره سر بزنید.

پی‌نوشت 2: این مطلب را در وبلاگ اهالی شبکه نیز منتشر کرده‌ام.