“我真希望我能觸碰你” ,西奧多躺在床上說。 他在愛情中經(jīng)歷了沉默、被拒絕,但這一次他終于聽到了薩曼莎試探性地回應(yīng):“你想怎樣觸碰我呢?”
這只是電影《Her》中動(dòng)人的一幕:男主角西奧多和他耳朵中的人工智能系統(tǒng)墜入愛河。但是包括工業(yè)設(shè)計(jì)師Gadi Amit和易用性大師Don Norman在內(nèi)的多位專家說,這種耳戴式智能硬件(或者“耳穿戴”)已經(jīng)不只存在于科幻小說中,而是馬上就能成為現(xiàn)實(shí)。
市場上已經(jīng)出現(xiàn)了一些與電影中異曲同工的*。索尼公司最近推出了一款耳戴式智能硬件,叫 Xperia Ear。 英特爾也展示了一款類似的概念產(chǎn)品。另一款名為 Bragi Dash 的具有生理測試功能的可發(fā)聲設(shè)備也將登陸KickStarters。與此同時(shí),另一家眾籌平臺(tái)也籌集了1700萬美元,參與智能耳塞領(lǐng)域的競爭。蘋果公司也參與進(jìn)來:蘋果將在新版iPhone上取消3.5mm耳機(jī)插孔,取而代之的可能是一對(duì)無線Beats。難怪交互式界面公司的創(chuàng)始人Mark Stephen說: “我們已經(jīng)和《Her》接近得難以置信了” 。

當(dāng)然啦,要想打造電影中斯嘉麗約翰遜似的沙啞*嗓音,我們還有很多文化、人體工程學(xué)和技術(shù)設(shè)計(jì)上的難關(guān)需要攻克。
像iPhone一樣異軍突起的穿戴設(shè)備
歸功于亞馬遜在語音智能領(lǐng)域的技術(shù)突破(亞馬遜不久前發(fā)布了新的Echo),我們終于能夠隨心所欲地在家里和電腦說話了。雖然亞馬遜可能利用Echo扳回一城,但是據(jù)MindMeld的一項(xiàng)研究,只有4%的智能手機(jī)用戶用過Alexa。與此同時(shí),62%的市場份額都在其它手機(jī)端人工智能助理(如Siri, Google Now, Cortana)手中。這就是為什么Echo早些年在這一領(lǐng)域的勝利果實(shí)會(huì)迅速被像索尼、蘋果,甚至幾家初創(chuàng)公司的個(gè)人設(shè)備廠商瓜分。除非亞馬遜也像電影里的斯嘉麗約翰遜一樣,隨著*,悄悄溜進(jìn)人們的耳朵,否則難以力挽敗局。
這是一種全新的產(chǎn)品:一種戴在耳朵里的獨(dú)立設(shè)備,它能夠聽見你講話并且輕聲回應(yīng)你。它像Siri或者Alexa,它蜷縮在你的耳膜附近,外形是一個(gè)戴在耳朵里的隱形無線揚(yáng)聲器和麥克風(fēng)。業(yè)內(nèi)專家認(rèn)為,這項(xiàng)技術(shù)在未來短短幾年內(nèi)就能實(shí)現(xiàn)。想象一下,你即將有一位個(gè)人助理為你記錄日常對(duì)話,一個(gè)調(diào)研員幫你在IMDb上查到了你怎么也想不起來的演員的名字,一個(gè)貼心的伴侶不但愿意傾聽你的困惑,還能夠給你提供心理治療……
雖然聽起來科幻,但是很快就能席卷市場。密歇根大學(xué)的助理教授、Clarity-Lab的主任Jason Mars說: “我認(rèn)為耳穿戴能取得iPhone那樣的商業(yè)成功” 。 “有了亞馬遜Echo,人們想出了很多有趣的點(diǎn)子來和自己的房子對(duì)話?,F(xiàn)在有了耳穿戴科技,你就可以隨時(shí)享受智能助理的協(xié)助了”。

親和性的新高度
耳戴式設(shè)備與生俱來的親和力將決定我們?cè)谀囊约叭绾问褂盟鼈?。以往,每一個(gè)走過你身邊的人都能看見你電腦屏幕上有什么,即便是手機(jī)也不能保證絕對(duì)私密。但現(xiàn)在,即使人工智能不知道你深藏內(nèi)心的秘密,它至少只在你的耳邊,就像有人貼著你的耳朵說悄悄話。
“在用蘋果手表時(shí),我還是在和一臺(tái)機(jī)器講話——我在跟我腕子上戴的這東西說話。盡管它快趕上通訊手表了,但它還是做在手表上的一個(gè)微創(chuàng)新?!盕rog的前首席文化官、Argodesigh的創(chuàng)始人Mark Rolston說, “但是和我自己說話,像有一個(gè)鬼魂,一個(gè)天使,或者一個(gè)魔鬼坐在我肩上,就大不一樣了。怎么說呢,它有更深的心理暗示作用,讓我覺得我腦袋里有另外一個(gè)人” 。
Rolston認(rèn)為,私人交互界面的改變將會(huì)影響你和人工智能之間的關(guān)系。在一些私密性的事情上,你會(huì)很自然地依賴它 ——你可能不想讓你的蘋果手表提醒你什么時(shí)候該避孕了,但如果是一句只有自己能聽見的語音提示來告訴你,就容易接受多了。漸漸地,你耳朵里的人工智能會(huì)悄悄地查到任何你不好意思當(dāng)著別人的面用Google查找的信息。
“想象一下我在用右耳朵聽你說話,然后Siri在我的左耳朵里教我怎么說,”他說。“這樣我就能出色地搞定這個(gè)面試,因?yàn)槊嬖嚂r(shí)有一臺(tái)電腦不斷地告訴我各種相關(guān)的問題和概念”。
同時(shí),因?yàn)樗臒o所不知,我們很容易對(duì)它產(chǎn)生過高的期待,這會(huì)給設(shè)備設(shè)計(jì)者帶來麻煩。在日常生活中,我們能根據(jù)情境,對(duì)身邊的人抱有比較現(xiàn)實(shí)的期待,比如說,我們不會(huì)要求干洗店的員工幫我們算12.98%的信用卡最低還款率,也不會(huì)讓銀行的人給我們講一個(gè)睡前故事。但是對(duì)于一個(gè)像智能助理這樣的新生科技而言,人們很難判斷什么樣的期待是合理的。用戶可能會(huì)把這些平臺(tái)當(dāng)作無所不能,在任何情境下都全能的神一般的存在,而不是把它們只是當(dāng)作軟件,并隨之對(duì)它們失望。
“AI助理能為我們做什么”和“我們希望它為我們做什么”之間的差距,是現(xiàn)有的人工智能技術(shù)的一個(gè)問題?!熬拖馭iri,總會(huì)出現(xiàn)很多失靈的情況”,英特爾新式設(shè)備公司的Dan Eisenhardt說?!拔铱偸墙oSiri機(jī)會(huì),但是只要一天中她有一兩次不管用,我就會(huì)很失望。所以我就棄用了?!?/p>
在英特爾,Eisenhardt正在通過創(chuàng)建基于音頻、有更具體語境的可穿戴設(shè)備來解決這個(gè)問題。在國際消費(fèi)電子產(chǎn)品展覽會(huì)(CES)上,英特爾推出了和Oakley合作研發(fā)的Radar。它將智能眼鏡和耳機(jī)結(jié)合在了一起,致力于解決跑步者和騎自行車的人的一些問題。諸如“我跑多遠(yuǎn)了?”或“我的心率是多少?”。因?yàn)樗私饽闼幍恼Z境,所以可以專向理解你在聊的話題。這提高了整體的精確程度。而且它還具備學(xué)習(xí)能力,比如你問系統(tǒng)“我的步調(diào)(或者跑速)”,過一會(huì)兒再問“現(xiàn)在怎么樣了”,它就能明白你問的還是步調(diào)。
全新的營銷計(jì)劃
那么這個(gè)存在于我們耳朵里的人聲,它到底是一個(gè)通用的聲音,還是不同公司會(huì)給他們的人聲設(shè)定一個(gè)不同的性格?目前為止,第三方公司都在爭相采用亞馬遜的Alexa,但是不遠(yuǎn)的將來,這些公司都會(huì)努力設(shè)計(jì)研發(fā)自己專屬的聲音特征。

“我可以讓Alexa給我訂個(gè)Domino的披薩或者叫個(gè)Uber,但是這些品牌也會(huì)自己投入去研發(fā)個(gè)性化的聲音”,Rolston說。“我們面對(duì)的是一個(gè)全球性的巨大市場,會(huì)有成百上千家聲音品牌出現(xiàn)。他們或許都基于Siri或Alexa的接口,但Alexa無法代表街邊那家披薩店?,F(xiàn)在是Alexa在跟我說話,但是我想要那個(gè)醉醺醺的賣披薩的?!?/p>
“解決方案就是讓每個(gè)品牌有專屬的聲音,”Rolston接著說?!叭绻以赟iri系統(tǒng)里有個(gè)披薩店,可能我就不說‘嘿,Siri’,而是說‘嘿,某某披薩店’。這些披薩店自己也不想聽起來像Siri,他們想成為自己?!?/p>
在Botanic,Mark Meadows研發(fā)出了叫做“Avatars”的聊天機(jī)器人,他們能初步實(shí)現(xiàn)讓不同的聊天機(jī)器人產(chǎn)生不同的個(gè)性。比如,心理咨詢師們可以通過同一個(gè)虛擬的心理咨詢師來分享業(yè)內(nèi)的知識(shí),或者機(jī)修工可以創(chuàng)造他們自己的虛擬機(jī)修工。Meadows實(shí)際上還為一套Avatars評(píng)價(jià)系統(tǒng)注冊(cè)了專利。就像他所提醒的,人類總是盲目信任機(jī)器,而親密感更給了機(jī)器難以置信的權(quán)力。
Meadows還提到了最近麥當(dāng)勞的一項(xiàng)促銷活動(dòng)。這項(xiàng)活動(dòng)把歡樂兒童餐的餐盒變成了一臺(tái)虛擬現(xiàn)實(shí)機(jī)。他希望麥當(dāng)勞可以利用這項(xiàng)科技制作出一個(gè)麥當(dāng)勞叔叔avatar,并且讓它直接和你的孩子們進(jìn)行對(duì)話游戲,而你即便是家長,也無法知道對(duì)話內(nèi)容。 “孩子們和麥當(dāng)勞叔叔Avatar的關(guān)系可以讓品牌更高效地和消費(fèi)者互動(dòng)。此時(shí)麥當(dāng)勞叔叔已經(jīng)不是你在電視上看到的那個(gè)奇怪的小丑了,”他說?!八兂闪艘粋€(gè)親密的朋友,會(huì)悄悄向你的孩子提供消費(fèi)建議”。
Meadow認(rèn)為一個(gè)評(píng)價(jià)系統(tǒng)可以制衡這種品牌能力。他申請(qǐng)了一項(xiàng)聊天機(jī)器人“牌照”,這是一個(gè)評(píng)價(jià)系統(tǒng)的專利,可以發(fā)現(xiàn)有可能濫用人工智能聊天機(jī)器人的行為。這套評(píng)價(jià)系統(tǒng)介于Twitter的認(rèn)證和Amazon的評(píng)星級(jí)之間。
基礎(chǔ)設(shè)施的挑戰(zhàn)
對(duì)于iPhone用戶來說,用Siri至多感覺像是進(jìn)行了一次軟件更新,這是因?yàn)槭褂肧iri的成本是無形的。真正的操作遠(yuǎn)在北卡羅來納,蘋果在Siri上線之前就建立了全世界第一個(gè)數(shù)據(jù)中心,耗資10億美元。隱藏的計(jì)算成本剛好能解釋,為什么運(yùn)營著地球上最大的服務(wù)器網(wǎng)絡(luò)的亞馬遜能在語音智能方面占優(yōu)勢(shì)。但盡管如此,我們還遠(yuǎn)遠(yuǎn)到不了電影《her》描述的智能世界。
“如果每個(gè)人都希望不間斷地和Siri或者Cortana交流,當(dāng)這些交流同時(shí)進(jìn)行時(shí),我們的數(shù)據(jù)中心根本應(yīng)付不了如此巨大的數(shù)據(jù)流量,”Mars說?!翱隙ㄓ幸恍┬枨笤诩夹g(shù)上不能得到滿足,就像我們不能讓地球上每臺(tái)手機(jī)同時(shí)下載視頻一樣,因?yàn)槭謾C(jī)信號(hào)無法支撐。沒有任何一個(gè)服務(wù)器可以滿足成百萬甚至幾十億人同時(shí)且不間斷地和智能助理對(duì)話?!?/p>
試想當(dāng)你打開Siri時(shí),總會(huì)有一些故障出現(xiàn)。難道蘋果沒試圖處理這些故障碼?他們當(dāng)然做了。但是人們是不是越來越少地使用Siri了呢?也許是吧。Mars表示Siri已經(jīng)很難有所改進(jìn), “每做一丁點(diǎn)質(zhì)量上的改進(jìn),或者每增加一些用戶,運(yùn)行Siri的成本就會(huì)飆升?!?人工智能越是聰明,就需要越大的數(shù)據(jù)處理系統(tǒng),這絕不是再建幾個(gè)大服務(wù)器基地就能解決的問題。我們需要能處理更大數(shù)量級(jí)數(shù)據(jù)的服務(wù)器。這就是為什么在Mars的實(shí)驗(yàn)室,他在研究如何設(shè)計(jì)出能十倍甚至百倍提高運(yùn)算律的服務(wù)器。例如,如果一個(gè)人的手機(jī)能夠處理更多的數(shù)據(jù),就可以讓服務(wù)器操縱特殊的手機(jī)硬件來運(yùn)行一些人工智能軟件,這或許是條路。
所以我們依舊不清楚我們是否要讓智能助手無處不在。如果基礎(chǔ)設(shè)施只能支持一小部分用戶,公司將如何篩選誰可以先用上這項(xiàng)技術(shù)?這些人在技術(shù)的協(xié)助下將比我們變得優(yōu)秀多少?Mars相信迅速發(fā)展的耳戴助手會(huì)加速服務(wù)器瓶頸的到來。
設(shè)計(jì)耳穿戴
當(dāng)然,服務(wù)器只是硬件問題之一。耳穿戴的熱銷不代表它們已經(jīng)技術(shù)成熟并進(jìn)入全盛。硅谷New Deal Design設(shè)計(jì)公司的創(chuàng)始人Gadi Amit就不認(rèn)為現(xiàn)今的耳戴硬件設(shè)備有索尼公司或者其他初創(chuàng)公司說的那么好。
一方面,就舒適度而言這些耳塞戴起來特別難受。比方說,有些人覺得蘋果的耳塞棒極了,而另一些人連戴幾秒鐘都無法忍受。一旦設(shè)計(jì)者把塞繩去掉(塞繩用來支撐耳塞的重量以在你的耳朵中固定耳塞),索尼和蘋果的技術(shù)都不能提供其他固定方案,除非讓你的耳道自己卡住耳塞。
“主要的問題之一是耳塞會(huì)掉出來。你塞回去他還是會(huì)在你做任何動(dòng)作的時(shí)候再次掉出來,”Amit說?!皼]有辦法解決這個(gè)問題,只能把它拿出來,再通過別的途徑掛在耳朵外邊?!钡且坏┠惆言O(shè)備掛在了耳朵外邊,這個(gè)設(shè)備的一切精巧性就都沒了。外加你還得忍受耳廓的疼痛。
“舒適性的問題就擺在那,它是一個(gè)因人而異的事情。有的人覺得可以接受,但有的人就完全不能接受”,他說?!坝肋h(yuǎn)都不會(huì)有100%的滿意度,特別是在用戶跑步的時(shí)候。整體滿意度將只能徘徊在30%或50%” 。 他把這和觸屏作比較,觸屏在任何時(shí)候總是能達(dá)到100%的滿意度。
Amit迅速反應(yīng)到的另一個(gè)問題是聲音質(zhì)量的問題。聲音產(chǎn)品市場已經(jīng)有消費(fèi)者在追求更高音質(zhì)的外戴式耳機(jī)。參照其在過去十年的緩慢發(fā)展進(jìn)程,微型聽覺設(shè)備不會(huì)在近期有什么大的起色。同樣地,麥克風(fēng)和聲音識(shí)別系統(tǒng)也存在著諸多限制,即便是他們很好用,在實(shí)際生活應(yīng)用中精確度也只能達(dá)到90%。
“這聽起來挺高的,但實(shí)際上慘不忍睹。試想你在進(jìn)行一次正常對(duì)話,如果聽不懂其中的5%,會(huì)很難理解對(duì)話內(nèi)容”,Amit說?!皩?duì)于一些應(yīng)用程序來說這已經(jīng)很好了,但是如果我們想在未來幾年用耳朵徹底取代圖形用戶界面,要走的路還非常遠(yuǎn)”。
相反地,Amit想象中不久的將來會(huì)是各種交互方式交織的狀況,這其中耳中電腦或者聲控系統(tǒng)將只是一個(gè)組成部分。盡管他相信圖形用戶界面在2015年達(dá)到了頂峰,他對(duì)任何單一突破(比如iPhone的觸屏)全盤吞沒其他方式的用戶體驗(yàn)的可能性深表懷疑?,F(xiàn)在我們有能夠讀懂手勢(shì)和面部表情的技術(shù),我們有可視頭機(jī)讓我們?cè)谝曨l內(nèi)容中身臨其境,我們甚至有能夠傳導(dǎo)身體感受的觸覺感受裝置。
“我們有五種感官,我們要實(shí)現(xiàn)全部五種感官和智能科技的交互體驗(yàn)” ,Amit說。 “我們現(xiàn)在設(shè)計(jì)這些項(xiàng)目時(shí)遇到的真正困難是如何找到正確的結(jié)合方式,并能適應(yīng)用戶多元的舒適度要求。如何混搭是我們現(xiàn)在面臨的最大挑戰(zhàn)。我們有各種各樣的技術(shù),就看你如何將他們搭配起來”。
就像Meadows說的那樣,當(dāng)這些技術(shù)同時(shí)發(fā)揮作用的時(shí)候,他們運(yùn)行得更加和諧也更加準(zhǔn)確。他們可以理解我們?cè)谡f什么以及我們的感受。
這就是為什么蘋果最近并購了兩家你幾乎都沒聽說過的公司:Emotient,一個(gè)情緒識(shí)別軟件,能夠在半秒鐘的時(shí)間里通過人類表情識(shí)別情緒;Faceshift,一個(gè)可以記錄人臉并同步到虛擬人像上的軟件。放到一起,這兩宗并購預(yù)示著如果Siri不僅能聽到你還能見到你,她將變得更加智能化。同時(shí)如果你也能看到她,她也許也會(huì)變得更為打動(dòng)人。
失落的一角:*直覺
相比于數(shù)據(jù)中心和人體工程學(xué)限制,甚至是潛在的企業(yè)濫用親密度的問題,耳戴助手面臨的最大挑戰(zhàn)來自于你耳朵中的人工智能設(shè)備很難掌握哪些細(xì)小的、*化的因素。
“現(xiàn)在你有助手告訴你你最喜歡的意大利餐廳開門了,你有可能大為欣喜,”圣迭戈加州大學(xué)的設(shè)計(jì)實(shí)驗(yàn)室主任、《日常設(shè)計(jì)》(The Design of Everyday Things)的作者Don Norman說?!暗且灿锌赡苁窃谀汩_車或者過馬路時(shí),又或者當(dāng)你終于和你的愛人進(jìn)行深入的談話的時(shí)候。最難以把握的部分是那些社交細(xì)節(jié)、時(shí)機(jī),知道哪些時(shí)候適合或者不適合向你提供信息”。
耳戴助手將不得不經(jīng)常費(fèi)力應(yīng)對(duì)這些只能憑直覺判斷的社交場合,因?yàn)镹orman相信耳戴助手的最大潛在益處在于能利用一天中一些5秒、10秒、30秒的零散時(shí)間。用這些時(shí)間他也許能查一下電子郵箱或者手機(jī)短信,都加起來也是一段相當(dāng)可觀的時(shí)間。但他還是為一個(gè)沒有社交能力的電腦可能表現(xiàn)出的危險(xiǎn)的莽撞行為而擔(dān)憂。
“我擔(dān)心的是安全。我們已經(jīng)知*們因?yàn)樽呗窌r(shí)看手機(jī)而受傷。他們會(huì)撞到東西,但是至少手機(jī)是在你可控范圍內(nèi)的。你可以想什么時(shí)候不看就不看。你可以強(qiáng)迫你自己不看, “他說。 “我過馬路時(shí)從來不看手機(jī)。但是如果這是一個(gè)助手,給我建議、向我推薦東西、告訴我一些它覺得我可能感興趣的事情,我沒有辦法控制它什么時(shí)候告訴我,這就有可能給我?guī)砦kU(xiǎn)”。
在他的實(shí)驗(yàn)室,Norman正在通過研究汽車的自動(dòng)化裝置研究這些復(fù)雜的*界限。換句話說,一輛無人駕駛的汽車如何穿越繁忙的人行道口?!斑@些車不得不硬闖,要不它們就沒辦法穿越如織的行人”,他說。所以這就要求這些汽車編程能夠適應(yīng)當(dāng)?shù)仄嚭托腥说奈幕?。在加利福尼亞,這意味著汽車一步步慢慢向前推進(jìn),行人自由走動(dòng)。但是在亞洲,這就意味著汽車需要更加強(qiáng)力地突破人群,甚至是強(qiáng)塞過去。兩種程序在當(dāng)?shù)囟寄茏嘈?,但是如果你想調(diào)換這兩者,加州的汽車會(huì)一天都呆在亞洲的十字路口動(dòng)彈不得,而亞洲汽車會(huì)把加州的行人撞翻。
所以真的很復(fù)雜。
雖然對(duì)于那些《火線密令》里出來的神經(jīng)敏感的人來說,《她》里面的科技將把我們帶到世界末日,但是想到我們已經(jīng)每天玩不止150次智能手機(jī)了,如果這都不能抹煞人類本性,一項(xiàng)新科技就毀滅*恐怕也不可能。
“我走到我辦公室的路上要遇到很多學(xué)生。我很驚奇地發(fā)現(xiàn)他們中90%都在步行穿過校園時(shí)看手機(jī)” ,Norman說。 “我試圖了解他們?cè)诟墒裁?,但是大部分情況下他們看上去都挺開心的。他們看得很入神。我不認(rèn)為是科技讓他們想要這么做。我想科技只是讓他們能夠隨時(shí)保持聯(lián)系。”



