云知聲億元融資后發(fā)力計(jì)算機(jī)語(yǔ)義理解
近日,F(xiàn)acebook單獨(dú)組建了一個(gè)新的人工智能部門(mén),其研究目的是將人們分享的內(nèi)容聯(lián)系起來(lái),從而使得Facebook可以對(duì)用戶提出的問(wèn)題做出更深入的回答。往前追溯,2012年5月,Google推出知識(shí)圖譜(Knowledge Graph),可以將搜索結(jié)果進(jìn)行知識(shí)系統(tǒng)化,任何一個(gè)關(guān)鍵詞都能獲得完整的知識(shí)體系;2012年9月份,國(guó)內(nèi)搜索公司搜狗和百度分別推出知立方和實(shí)體搜索,意圖構(gòu)建中文的互聯(lián)網(wǎng)知識(shí)圖譜;2011年,IBM推出知識(shí)問(wèn)答系統(tǒng)Watson,并在智力問(wèn)答比賽中成功戰(zhàn)勝了兩位人類(lèi)選手;2010年10月蘋(píng)果隨iPhone 4S的發(fā)布推出了智能語(yǔ)音助手Siri。
這些巨頭的意圖,是對(duì)互聯(lián)網(wǎng)大量無(wú)序數(shù)據(jù)做結(jié)構(gòu)化重組,目的是更好的理解用戶的自然語(yǔ)言和行為,并且其背后都使用了一個(gè)共同的技術(shù):語(yǔ)義理解技術(shù)。
你不可不知的語(yǔ)義理解
語(yǔ)義就是自然語(yǔ)言文本的涵義。對(duì)計(jì)算機(jī)來(lái)說(shuō),就是當(dāng)計(jì)算機(jī)遇到這個(gè)文本輸入的時(shí)候,應(yīng)該進(jìn)行的回答或響應(yīng)。例如,當(dāng)用戶問(wèn)“北京明天什么天氣”,計(jì)算機(jī)能夠理解這句話的意圖是問(wèn)天氣信息,且城市是北京,時(shí)間是明天,從而執(zhí)行的操作是從特定數(shù)據(jù)源中查詢到北京明天的天氣信息并呈現(xiàn)給用戶。語(yǔ)義理解讓計(jì)算機(jī)聽(tīng)懂用戶說(shuō)了什么,并進(jìn)一步回答用戶的問(wèn)題或與用戶對(duì)話。語(yǔ)義技術(shù)可以讓搜索引擎通過(guò)推理獲得答案,已經(jīng)被業(yè)界公認(rèn)為是搜索的未來(lái),也同時(shí)是人機(jī)交互的未來(lái)。語(yǔ)義技術(shù)的重要性已經(jīng)在工業(yè)界得到了廣泛的認(rèn)可。今年3月份,Gartner就發(fā)布了一份報(bào)告,認(rèn)為語(yǔ)義技術(shù)在2013年及以后的信息管理領(lǐng)域十大重要技術(shù)中列第三位。
對(duì)普通用戶來(lái)說(shuō),語(yǔ)義技術(shù)會(huì)給我們的日常生活帶來(lái)什么新的體驗(yàn)?zāi)?。最為常?jiàn)的方式是語(yǔ)義技術(shù)和語(yǔ)音技術(shù)的結(jié)合,它創(chuàng)造了一種更為自然和智能的交互方式。以今年11月1日“去哪兒”推出的新版移動(dòng)客戶端為例,它包含了一個(gè)語(yǔ)音搜索的新功能,用戶可以直接用自然語(yǔ)音來(lái)查詢機(jī)票酒店,不需要通過(guò)文字輸入或下拉選擇等交互方式來(lái)輸入查詢獲取信息,確實(shí)很方便。這是最近語(yǔ)義技術(shù)在移動(dòng)互聯(lián)網(wǎng)應(yīng)用中一個(gè)非常有代表性的嘗試。
語(yǔ)義技術(shù)比較適合的應(yīng)用類(lèi)型至少有兩種:一是操控類(lèi)的應(yīng)用,通過(guò)語(yǔ)音可以直接發(fā)出指令,如語(yǔ)音撥號(hào),發(fā)短信等;二是信息查詢類(lèi)的應(yīng)用,特別是查詢條件比較多的情況,傳統(tǒng)的交互方式需要用戶用文字輸入很多查詢條件,這對(duì)用戶來(lái)說(shuō)很繁瑣。而語(yǔ)義的交互方式可以讓用戶通過(guò)一句話或者多回合的對(duì)話方式獲取其所要的信息。從應(yīng)用場(chǎng)景來(lái)說(shuō),語(yǔ)義技術(shù)與語(yǔ)音識(shí)別相結(jié)合在下面三種場(chǎng)景是可以非常有效地解決用戶交互的問(wèn)題:1)不方便使用雙手的車(chē)載設(shè)備;2)在環(huán)境相對(duì)私密的家庭中的智能家電家居,如樂(lè)視的超級(jí)電視語(yǔ)音助手; 3)只有小尺寸屏幕或沒(méi)有屏幕的可穿戴設(shè)備中,如智能手表、智能手環(huán)。
語(yǔ)音時(shí)代,沒(méi)語(yǔ)義,不智能
語(yǔ)義技術(shù)因其專(zhuān)業(yè)性和復(fù)雜性,目前主要掌握在一些專(zhuān)業(yè)公司手中。對(duì)普通開(kāi)發(fā)者來(lái)說(shuō),要想利用語(yǔ)義技術(shù)簡(jiǎn)化操作和提升用戶體驗(yàn),從頭開(kāi)始學(xué)習(xí)和開(kāi)發(fā)語(yǔ)義技術(shù),并不是一件容易的事情。所幸的是,國(guó)內(nèi)一些公司陸續(xù)以公有服務(wù)的方式提供語(yǔ)義解析服務(wù),一般稱(chēng)之為“語(yǔ)義云”,這大大降低了開(kāi)發(fā)者使用語(yǔ)義技術(shù)的門(mén)檻。目前,科大訊飛和北京云知聲先后推出了各自的公有語(yǔ)義服務(wù)。
科大訊飛是國(guó)內(nèi)著名的語(yǔ)音技術(shù)公司。其語(yǔ)義服務(wù)主要是把語(yǔ)音助手中需要的一些語(yǔ)義理解功能開(kāi)放成API,主要功能是對(duì)某些領(lǐng)域的輸入文本,返回經(jīng)語(yǔ)義解析后的結(jié)果,解析結(jié)果是XML格式??拼笥嶏w的語(yǔ)義服務(wù)開(kāi)放了16個(gè)領(lǐng)域,開(kāi)發(fā)者能選擇最多5個(gè)領(lǐng)域測(cè)試。如果需要使用更多領(lǐng)域,是否免費(fèi)還未知。
北京云知聲是最近崛起的新興語(yǔ)音技術(shù)公司,定位為B2B2C,用互聯(lián)網(wǎng)的方式切入市場(chǎng)。其語(yǔ)義服務(wù)總體設(shè)計(jì)和科大訊飛的語(yǔ)義云類(lèi)似,提供了一些常見(jiàn)領(lǐng)域的語(yǔ)義解析功能,解析結(jié)果是JSON格式。云知聲的語(yǔ)義服務(wù)目前支持30多個(gè)領(lǐng)域,且全部領(lǐng)域都可以自由選擇。另外,云知聲語(yǔ)義服務(wù)的一個(gè)特點(diǎn)是,其部分領(lǐng)域不僅僅只是返回語(yǔ)義解析結(jié)果,還能返回該問(wèn)題對(duì)應(yīng)的結(jié)果數(shù)據(jù),如天氣和股票等;同時(shí)部分領(lǐng)域還支持上下文理解和對(duì)話,如航班等生活信息領(lǐng)域。
開(kāi)發(fā)者盡享語(yǔ)義技術(shù)紅利
對(duì)開(kāi)發(fā)者來(lái)說(shuō),以上兩家公司的語(yǔ)義服務(wù)都可以嘗試,但開(kāi)發(fā)者在選擇語(yǔ)義服務(wù)時(shí),需要更多的權(quán)衡。因?yàn)檎Z(yǔ)義解析是和業(yè)務(wù)領(lǐng)域相關(guān)的,而且各個(gè)語(yǔ)義服務(wù)返回的數(shù)據(jù)格式都不一致,所以選定了一家服務(wù)商,今后如果要更換,并不像語(yǔ)音云那么容易。筆者認(rèn)為在選擇時(shí)有兩個(gè)因素是需要重點(diǎn)考察的,一是語(yǔ)義解析的準(zhǔn)確率,由于語(yǔ)義與領(lǐng)域相關(guān)性很大,公共服務(wù)是否與開(kāi)發(fā)者的應(yīng)用場(chǎng)景契合,會(huì)比較大的影響準(zhǔn)確率,所以需要由開(kāi)發(fā)者自己來(lái)比較。另外,在準(zhǔn)確率方面,同時(shí)能提供語(yǔ)音云和語(yǔ)義服務(wù)的公司會(huì)更有優(yōu)勢(shì)。因?yàn)檎Z(yǔ)義理解要處理的大部分文本是語(yǔ)音識(shí)別的結(jié)果,沒(méi)有語(yǔ)音識(shí)別技術(shù)則無(wú)法對(duì)特定領(lǐng)域做語(yǔ)音識(shí)別的優(yōu)化,而如果語(yǔ)音識(shí)別結(jié)果錯(cuò)誤率在特定領(lǐng)域變高的話,必然會(huì)導(dǎo)致語(yǔ)義理解結(jié)果變差。 二是開(kāi)放程度,供應(yīng)商面向自己和面向其他開(kāi)發(fā)者提供的是否是一致的服務(wù)。如果供應(yīng)商自己的應(yīng)用與開(kāi)發(fā)者有競(jìng)爭(zhēng)關(guān)系,那語(yǔ)義服務(wù)的開(kāi)放程度肯定會(huì)有所保留。
總的來(lái)說(shuō),語(yǔ)義技術(shù)的出現(xiàn),特別是語(yǔ)義技術(shù)和語(yǔ)音技術(shù)的結(jié)合為移動(dòng)互聯(lián)網(wǎng)應(yīng)用提供了一種全新的交互方式。同時(shí)公有語(yǔ)義服務(wù)的推出大大降低了移動(dòng)開(kāi)發(fā)者使用語(yǔ)義技術(shù)的門(mén)檻。移動(dòng)開(kāi)發(fā)者可以抓住這個(gè)機(jī)會(huì),在交互方式上進(jìn)行新的嘗試和突破,快人一步,也就意味著更快的成功?!?/P>
關(guān)注我們


