سی‌ری (Siri)، سیراب کننده کاربران

یا چرا iPhone 4S به اندازه iPhone 5 مهم است.

هرچند خیلی از عاشقان و طرفداران اپل از معرفی آیفون 4S به جای آیفون 5 ناامید و سرخورده شدند، اما به نظر می‌رسه بیشتر کسانی که به صورت عمیق‌تر و دقیق‌تر تکنولوژی و اخبار صنعت آی‌تی رو دنبال میکنن قبول داشته باشن که تکنولوژی تشخیص گفتار طبیعی معرفی شده در این نسخه انقلابی‌تر و جذاب‌تر از تمام تغییرات ظاهری و سخت‌افزاری باشه که همه برای آیفون 5 منتظرش بودن. وبلاگ 1پزشک کنفرانس خبری دیروز اپل رو به قول خودش نیمه‌زنده پوشش داده و انصافا هم به خوبی از پس این کار براومده. اما به شدت پیشنهاد می‌کنم که اول از همه توضیحات و به خصوص ویدیوی تبلیغی اپل رو توی این آدرس ببینید و اگر سواد انگلیسی خوبی دارین، حتما تا انتهای مطلب رو بخونید. تشخیص گفتار از اولین نسخه‌های آیفون یکی از قابلیت‌های پیش‌فرض این گوشی‌ها بوده، اما این نرم‌افزار Siri واقعا مرزهای فناوری و کارایی رو چندین پله جلوتر برده و اون رو برای کاربرای عادی هم قابل استفاده کرده.

این نرم‌افزار که در پس‌زمینه با تکنولوژی‌های شرکت نوانس (نوانس در ویکی‌پدیا) کار می‌کنه، به سادگی زبان طبیعی کاربر رو درک میکنه و بهش عکس‌العمل نشون می‌ده. نه تنها زبان طبیعی رو درک و پردازش می‌کنه بلکه (حداقل اینطوری که از دموها و تبلیغ‌ها بر می‌آد) مفهوم جمله‌ها رو هم در حالت‌های مختلف متوجه میشه. اگر بپرسید «امروز پالتو بپوشم یا نه؟» درک می‌کنه که این سئوال شما به وضعیت آب‌وهوا بستگی داره و در نتیجه با چک کردن پیش‌بینی شرایط جوی به شما جواب می‌ده. اگر بپرسید «این طرف‌ها پیتزافروشی خوب کجاست؟» درک میکنه که «این‌طرف‌ها» یعنی باید از GPS موقعیت شما رو دربیاره و بعد رستوران‌های اون منطقه رو جستجو کنه. تازه این سئوال یادش می‌مونه تا اگر بی‌مقدمه پرسیدین «غذای مکزیکی چی؟» نپرسه «چی یعنی چی؟» و بدونه که منظورتون اینه که این‌طرف‌ها غذای مکزیکی هم پیدا میشه یا نه. این یکی از کامل‌ترین و بهترین نمونه‌های تشخیص  گفتاره که قبلا نمونه‌اش رو فقط توی واتسون IBM دیده بودیم. حالا تصور کنید که قابلیت‌های یک سوپرکامپیوتر چند میلیارد دلاری توی یک گجت 130 گرمی توی جیبتون باشه. ضمن اینکه تقریبا با تمام اپ‌های پیش‌فرض آیفون هم سازگاره و بنابراین برقراری تماس، خوندن و نوشتن پیامک و ایمیل، تنظیم ساعت و زنگ هشدار و . . . به سادگی امکان‌پذیر خواهد بود.

سئوالی که اینجا از هر چیز دیگه‌ای مهمتره اینه که آیا اپل API های این نرم‌افزار قدرتمند رو برای توسعه‌دهنده‌ها باز می‌کنه یا نه. اگر چنین اتفاقی بیافته، خدا می‌دونه که از ترکیب این تکنولوژی با بقیه فناوری‌ها و حسگرها و . . . چه کاربردهایی که برای این سیستم تشخیص گفتار ایجاد نمی‌شه. فرض کنید با گفتن «سردمه!» بسته به موقعیت شما سیستم تهویه ماشین یا خونه تنظیم بشه یا با دونستن سابقه بیماری‌هاتون بهتون پیشنهاد بشه که به جای مترو با تاکسی برین خونه. یا با گفتن  «لعنتی، عجب ترافیکی!» مسیرهای جایگزین برای رسیدن به مقصد رو بهتون پیشنهاد کنه. به نظر من فقط یک نکته خیلی مهم باقی می‌مونه. اگر گجت یا کامپیوتر بتونه مثل یک انسان با ما صحبت کنه آیا اپیدمی گوشه‌گیری و انزواطلبی خوره‌های کامپیوتر چندین پله شدیدتر نمی‌شه؟ چون این آدم‌ها همون یک ذره احساس نیاز به یک دوست و یک همزبون رو هم دیگه می‌تونن با کامپیوترشون ارضا کنن. این جنبه‌اش به شدت ترسناکه.


پی‌نوشتشرکت نوانس هم برای خودش غولی محسوب میشه که ارزش تکنولوژی‌هاش چیزی بسیار بیشتر از تشخیص گفتار برای دارندگان آیفونه. به سایتش دوباره سر بزنید.

پی‌نوشت 2: این مطلب را در وبلاگ اهالی شبکه نیز منتشر کرده‌ام.

پارسال همین موقع

به نظر میرسه که تب شبکه‌های اجتماعی مبتنی بر موقعیت به این زودی فروکش نکنه. سرویس‌های متنوعی بر اساس زیرساخت‌ها و داده‌های شرکت‌های مختلف عرضه شدن و از بین اون‌ها سرویس 4square (توضیح کامل‌تر در وبلاگ 1پزشک) نمونه موفقی محسوب میشه. به تازگی هم سرویس جدیدی بر مبنای این 4square قدیمی راه افتاده که اسم کاملش شده «4squareand7yearsago» و کارش اینه که هر روز به شما ایمیل میزنه و یادآوری میکنه که پارسال این موقع کجاها بودید (یا در واقع کجاها check-in کردید). البته باید اکانت 4square تون رو (البته اگر بشه توی ایران ازش استفاده کرد) به این سرویس جدید لینک کنید و تازه یک سال هم از سرویس 4square استفاده کرده باشین.

چنین سیستم‌های یادآوری خاطراتی که گاهی بهشون مهندسی حافظه هم میگن سعی میکنن اطلاعات دیجیتال ما رو (اینجا به عنوان مثال محل‌هایی که check-in کردیم) رو به خاطرات انسانی غیردیجیتال و بیادموندنی تبدیل کنن. و این مهندسی حافظه موضوع نوشته کوتاهی در آخرین شماره مجله وایرد بود.