یا چرا iPhone 4S به اندازه iPhone 5 مهم است.
هرچند خیلی از عاشقان و طرفداران اپل از معرفی آیفون 4S به جای آیفون 5 ناامید و سرخورده شدند، اما به نظر میرسه بیشتر کسانی که به صورت عمیقتر و دقیقتر تکنولوژی و اخبار صنعت آیتی رو دنبال میکنن قبول داشته باشن که تکنولوژی تشخیص گفتار طبیعی معرفی شده در این نسخه انقلابیتر و جذابتر از تمام تغییرات ظاهری و سختافزاری باشه که همه برای آیفون 5 منتظرش بودن. وبلاگ 1پزشک کنفرانس خبری دیروز اپل رو به قول خودش نیمهزنده پوشش داده و انصافا هم به خوبی از پس این کار براومده. اما به شدت پیشنهاد میکنم که اول از همه توضیحات و به خصوص ویدیوی تبلیغی اپل رو توی این آدرس ببینید و اگر سواد انگلیسی خوبی دارین، حتما تا انتهای مطلب رو بخونید. تشخیص گفتار از اولین نسخههای آیفون یکی از قابلیتهای پیشفرض این گوشیها بوده، اما این نرمافزار Siri واقعا مرزهای فناوری و کارایی رو چندین پله جلوتر برده و اون رو برای کاربرای عادی هم قابل استفاده کرده.
این نرمافزار که در پسزمینه با تکنولوژیهای شرکت نوانس (نوانس در ویکیپدیا) کار میکنه، به سادگی زبان طبیعی کاربر رو درک میکنه و بهش عکسالعمل نشون میده. نه تنها زبان طبیعی رو درک و پردازش میکنه بلکه (حداقل اینطوری که از دموها و تبلیغها بر میآد) مفهوم جملهها رو هم در حالتهای مختلف متوجه میشه. اگر بپرسید «امروز پالتو بپوشم یا نه؟» درک میکنه که این سئوال شما به وضعیت آبوهوا بستگی داره و در نتیجه با چک کردن پیشبینی شرایط جوی به شما جواب میده. اگر بپرسید «این طرفها پیتزافروشی خوب کجاست؟» درک میکنه که «اینطرفها» یعنی باید از GPS موقعیت شما رو دربیاره و بعد رستورانهای اون منطقه رو جستجو کنه. تازه این سئوال یادش میمونه تا اگر بیمقدمه پرسیدین «غذای مکزیکی چی؟» نپرسه «چی یعنی چی؟» و بدونه که منظورتون اینه که اینطرفها غذای مکزیکی هم پیدا میشه یا نه. این یکی از کاملترین و بهترین نمونههای تشخیص گفتاره که قبلا نمونهاش رو فقط توی واتسون IBM دیده بودیم. حالا تصور کنید که قابلیتهای یک سوپرکامپیوتر چند میلیارد دلاری توی یک گجت 130 گرمی توی جیبتون باشه. ضمن اینکه تقریبا با تمام اپهای پیشفرض آیفون هم سازگاره و بنابراین برقراری تماس، خوندن و نوشتن پیامک و ایمیل، تنظیم ساعت و زنگ هشدار و . . . به سادگی امکانپذیر خواهد بود.
سئوالی که اینجا از هر چیز دیگهای مهمتره اینه که آیا اپل API های این نرمافزار قدرتمند رو برای توسعهدهندهها باز میکنه یا نه. اگر چنین اتفاقی بیافته، خدا میدونه که از ترکیب این تکنولوژی با بقیه فناوریها و حسگرها و . . . چه کاربردهایی که برای این سیستم تشخیص گفتار ایجاد نمیشه. فرض کنید با گفتن «سردمه!» بسته به موقعیت شما سیستم تهویه ماشین یا خونه تنظیم بشه یا با دونستن سابقه بیماریهاتون بهتون پیشنهاد بشه که به جای مترو با تاکسی برین خونه. یا با گفتن «لعنتی، عجب ترافیکی!» مسیرهای جایگزین برای رسیدن به مقصد رو بهتون پیشنهاد کنه. به نظر من فقط یک نکته خیلی مهم باقی میمونه. اگر گجت یا کامپیوتر بتونه مثل یک انسان با ما صحبت کنه آیا اپیدمی گوشهگیری و انزواطلبی خورههای کامپیوتر چندین پله شدیدتر نمیشه؟ چون این آدمها همون یک ذره احساس نیاز به یک دوست و یک همزبون رو هم دیگه میتونن با کامپیوترشون ارضا کنن. این جنبهاش به شدت ترسناکه.
پینوشت: شرکت نوانس هم برای خودش غولی محسوب میشه که ارزش تکنولوژیهاش چیزی بسیار بیشتر از تشخیص گفتار برای دارندگان آیفونه. به سایتش دوباره سر بزنید.
پینوشت 2: این مطلب را در وبلاگ اهالی شبکه نیز منتشر کردهام.