現(xiàn)如今,機(jī)器人發(fā)展到了什么程度?人類應(yīng)該用怎樣的態(tài)度對(duì)待機(jī)器人?近期,在蘇州MEMS(微機(jī)電系統(tǒng))市場(chǎng)年會(huì)上,國(guó)內(nèi)家庭機(jī)器人專家以對(duì)傳感器的應(yīng)用需求為脈絡(luò),梳理了陪伴機(jī)器人的發(fā)展思路。
家庭機(jī)器人一般分為三類
如果可以,你會(huì)為家里添置一臺(tái)什么樣的機(jī)器人?
目前來(lái)說(shuō),家庭智能機(jī)器人主要可以分為三種類型,第一種是應(yīng)用型機(jī)器人,有著非常明確的功能,比如開(kāi)始逐漸普及的掃地機(jī)器人、擦窗機(jī)器人等。第二種是社交陪伴型機(jī)器人,能夠和人類互動(dòng)交流,陪伴用戶一起成長(zhǎng)。國(guó)內(nèi)外許多企業(yè)已經(jīng)開(kāi)始研發(fā)社交陪伴型機(jī)器人,例如阿爾法機(jī)器人、小優(yōu)等,并且在未來(lái)的一到兩年內(nèi),家庭社交陪伴型機(jī)器人有可能會(huì)成為消費(fèi)類市場(chǎng)的重點(diǎn)。
最后一類是仿生機(jī)器人,從原理上仿生生物的動(dòng)作、表情、思考方式等,如本田研發(fā)的Asimo機(jī)器人可以完美模仿兩腳運(yùn)動(dòng),完成很多非常復(fù)雜的動(dòng)作,包括上下樓梯等,美國(guó)的情感機(jī)器人索菲亞則可根據(jù)人類語(yǔ)言反饋不同的表情,達(dá)到和人類交流的目的。
處理器大腦是認(rèn)知技術(shù)核心
“不管是應(yīng)用型機(jī)器人、社交陪伴型機(jī)器人,還是仿生機(jī)器人,其核心功能需求都是相似的,分別是感知、認(rèn)知和動(dòng)作行為控制能力。”東莞凡豆信息科技有限公司總經(jīng)理朱曉明介紹說(shuō),感知就是通過(guò)MEMS傳感器,感知外部環(huán)境;認(rèn)知是把信息在機(jī)器人腦中進(jìn)行分析處理,然后轉(zhuǎn)化為機(jī)器人的經(jīng)驗(yàn),使其能夠伴隨經(jīng)驗(yàn)成長(zhǎng);動(dòng)作行為控制可以理解為操控機(jī)器人的肢體動(dòng)作、表情反饋等。
處理器大腦是認(rèn)知技術(shù)的核心,決定了機(jī)器人的智能程度。如IBM設(shè)計(jì)的超級(jí)計(jì)算機(jī)Watson,在美國(guó)電視問(wèn)答節(jié)目Jeopardy中擊敗人類選手而一戰(zhàn)成名,引起不小的轟動(dòng)。隨后Watson被應(yīng)用在醫(yī)療、銀行、調(diào)查機(jī)構(gòu)等多個(gè)領(lǐng)域,而且IBM正在努力讓W(xué)atson能比人類更智能。
但是,現(xiàn)階段市面上能見(jiàn)到的大部分社交陪伴型機(jī)器人,仍采用傳統(tǒng)的手機(jī)或者平板的成熟解決方案,雖然能夠?qū)崿F(xiàn)基本功能,但是沒(méi)有針對(duì)性。因?yàn)閷?duì)于不同性質(zhì)的機(jī)器人,應(yīng)該選擇或者偏重不同的功能。
“社交陪伴機(jī)器人應(yīng)具備云端大腦,否則就是只擁有有限知識(shí)的玩具,不會(huì)智能地伴隨著用戶的成長(zhǎng)而成長(zhǎng)。”朱曉明說(shuō),“但其智能化功能不能全通過(guò)云端實(shí)現(xiàn),需要在云端和本地做一個(gè)合理的區(qū)分,保證在斷網(wǎng)的情況下,機(jī)器人依舊能夠完成基本工作。同時(shí),數(shù)據(jù)處理也是如此,需要優(yōu)化本地和云端的存儲(chǔ)和處理。”
機(jī)器人的感知與感覺(jué)
機(jī)器人與MEMS行業(yè)緊密相連,因?yàn)樗心芟氲降腗EMS傳感器,都在機(jī)器人身上得到體現(xiàn),促進(jìn)機(jī)器人智能化的發(fā)展。讓我們來(lái)看看幾個(gè)主要的技術(shù)實(shí)現(xiàn)狀態(tài)。
語(yǔ)音是機(jī)器人最基本的要求,從最初的故事機(jī)、點(diǎn)讀筆到功能逐漸豐富的云機(jī)器人,市面上也有許多在售的語(yǔ)音互動(dòng)機(jī)器人,如語(yǔ)兜機(jī)器人、樂(lè)視推出的樂(lè)小寶、兒童教育機(jī)器人小優(yōu)、國(guó)外的COGNI-TOYS等,其核心價(jià)值都是通過(guò)語(yǔ)音架構(gòu),實(shí)現(xiàn)和小孩的互動(dòng)交流。
語(yǔ)音通過(guò)麥克風(fēng)獲取,然后提取和保存用戶的聲音特征,通過(guò)終端和云端的配合,對(duì)于一些簡(jiǎn)單的語(yǔ)音,終端直接可以實(shí)現(xiàn)。但是,對(duì)于復(fù)雜的語(yǔ)音,機(jī)器人一般都會(huì)將語(yǔ)音發(fā)送到云端進(jìn)行識(shí)別,然后再返回終端,這時(shí)你可能會(huì)感覺(jué)到明顯的交流停頓。
另外,云端光能理解語(yǔ)言文字還遠(yuǎn)遠(yuǎn)不夠,必須進(jìn)一步理解其中的語(yǔ)意,讓機(jī)器人大腦真正懂得用戶的語(yǔ)意。因此,機(jī)器人通過(guò)語(yǔ)意的理解掌握用戶的需求,而用戶的反饋又可以驗(yàn)證語(yǔ)意的理解是否準(zhǔn)確,從而逐漸培養(yǎng)機(jī)器人的智力智商。因?yàn)檎Z(yǔ)言非常豐富,所以語(yǔ)意的理解也會(huì)千變?nèi)f化,需要經(jīng)過(guò)長(zhǎng)時(shí)間的語(yǔ)句和說(shuō)話方式積累,通過(guò)大量的數(shù)據(jù)堆積來(lái)分析語(yǔ)意。同時(shí),還需要有感情識(shí)別,在用戶聲調(diào)變高、語(yǔ)速變快時(shí)候,能夠理解用戶正處在生氣的狀態(tài)。現(xiàn)階段真正完全依賴語(yǔ)音控制的應(yīng)用還比較少。另外,在復(fù)雜的環(huán)境中,聲音本身的辨識(shí)度也會(huì)下降,語(yǔ)音識(shí)別也將更加困難。
在家庭中,機(jī)器人最好能夠記住每一個(gè)家庭成員的樣子,識(shí)別用戶的表情,甚至識(shí)別手勢(shì)動(dòng)作,陌生人入侵等。因此,視覺(jué)同樣是必不可少的功能。這就是人臉識(shí)別。通過(guò)人臉識(shí)別找到人臉部的特征點(diǎn),機(jī)器人還可以進(jìn)一步達(dá)到識(shí)別感情的效果,例如:眼瞼的動(dòng)作、下巴往上還是往下、嘴型怎么樣等,就可以知道這個(gè)表情背后的含義。此外,還有手勢(shì)識(shí)別和動(dòng)作識(shí)別,都可以通過(guò)攝像頭捕獲,使機(jī)器人更加智能化。
觸覺(jué)系統(tǒng)將讓機(jī)器人更加智能
“無(wú)論是人臉識(shí)別、手勢(shì)識(shí)別,還是動(dòng)作識(shí)別,其實(shí)本質(zhì)就是圖像處理和理解。”朱曉明表示,機(jī)器人的芯片解決方案架構(gòu)可以從優(yōu)化目前手機(jī)芯片中CPUGPU的架構(gòu)入手,根據(jù)CPU做指定識(shí)別、數(shù)據(jù)處理和操作系統(tǒng),GPU可以處理大量的圖像信息的分工,重新優(yōu)化架構(gòu)從而提高效率。
另外,觸碰感知可以讓機(jī)器人和人的互動(dòng)變得簡(jiǎn)單,“逗一下,或者給機(jī)器人撓癢,或者拍一下打招呼,機(jī)器人都能感覺(jué)到,并且做出正確的反饋。如果加上人工皮膚的真實(shí)質(zhì)感,或者能對(duì)外部表面質(zhì)地和物理性能做到全面感知,這樣的機(jī)器人觸覺(jué)系統(tǒng)將讓他們更加無(wú)所不能。”
社交陪伴型機(jī)器人的研發(fā)設(shè)計(jì)最主要考慮的兩個(gè)因素,一是功能目標(biāo)需要明確,即機(jī)器人主要是滿足用戶什么需求;其二是云端的開(kāi)發(fā),也就是認(rèn)知,是機(jī)器人能否越來(lái)越聰明,能否幫助用戶解決生活問(wèn)題的關(guān)鍵。