NLP 所帶來的「自然美」

img
 介紹四個網站,StikkitSpongecellPostickyTodo.txt,都是近年推出的線上備忘錄、待辦事項、月曆網站,這些功能其實很多成熟的軟體或網站早就在提供了,可說是紅得不能再紅的紅海戰場,然而這四個網站不同的地方是,許多傳統網站都習慣叫人填寫一張又一張的「表格」,而它們卻試著讓人回歸到最簡單的「抽一張便條紙,直接記下何日何時做某事」的反射動作,不必填表,只要寫下,它們會想辦法懂得你在寫什麼,置入該放的位置;使用者介面簡單化以後,介面本身也多樣化了,譬如Posticky讓我們用手機做這件事,而Spongecell讓我們透過寄一封email到該站主機的方式來做這件事。

這幾個網站的前途如何,在激烈競爭的情況下難以判斷,不過它們一致使用「自然語言處理」(natural language processingNLP)肯定是未來更值得創業家注意的一塊領域,所謂「自然語言處理」,就是人類日常隨便說的話,要讓機器也能聽得懂。今天,我們正處在一個「讓使用介面超簡化」的持續趨勢中。如果這樣說沒什麼感覺,提到「Google」,大家都可以感受到。Google讓人不必再腦袋裡重組思考,只要直接憑直覺輸入一串字,半秒後就可以看到自己想要的東西赫然出現在眼前。Google或許不必仰賴正統的自然語言處理,新搜尋引擎如PowersetLexxe等使用更多的自然語言處理來搜尋字串與網頁內容也不見得能打敗Google,但,幾乎其他所有的「介面超簡化」、「介面Google化」,都要靠自然語言處理,才能瞭解人們想問什麼、哪些才是正確的答案卷。隨著介面愈來愈簡單化,愈來愈「自然美」,人們也漸漸習慣凡事只寫一句話、說一行字、按一個按鈕就「下命令」,在接下來的幾年,我們會看到自然語言處理漸漸成為創業家必學的招術。

資訊界的人知道,自然語言處理的相關學問其實已經被研究了好一陣子,和語音辯識、字型辯識、人工智慧同樣研發了二十年以上,多少大廠的資助與幫忙,多少的測試產品奮力在市場上叫「買我買我」,至今的成果依然教人失望。不是科學家無能,而是人性本就如此,一套人工智慧產品,即使它的準確率已經高達99%,只要仍然存在著1%的失誤率,它就是無法被使用者完全信任。而且教人困窘的是,科學家去「訓練」乖巧的機器去和人類交談,在速度上還輸給「訓練」這些難搞的人類去跟機器交談;前者拖了太久,效果還沒出來,後者已經起來了。譬如現在許多年輕人顯然不太需要「中文手寫辨識」了,很多字不太會寫,不如直接用姆指在手機上打簡訊,速度已經如雷霆霹靂;如果在電腦的大尺寸鍵盤上打中文一秒更可以打到二、三字,寫字的話一秒可能只能寫半邊。用念的?對不起,網路使用者早就已經不習慣把嘴巴張開。

實驗室裡的金頭腦科學家耗一生之力研究最偉大的「自然語言處理」,等不及的創業家早已經開始紛紛將「自然語言」應用在簡單一點的地方;設計一個完全善解人意的IQ 180機器人,留給實驗室去做吧。這四個網站所做的「自然語言處理」,雖然只是簡單版,就已經很有用了。譬如一句「16日下午2點要去福華國際會議中心14樓貴賓廳參加二人創業媒合小聚」這句話,只要先幫使用者分辨出時間、地點、會議名稱,再顯示出來給他看過,按下確認鍵,原本繁瑣的介面就可以瞬間變成一個近似於Google介面與反應速度的小網站,讓人們馬上就愛上了。創業家要使用這樣的運用,頂多可能只需要修幾堂課,K幾本書,再加上坊間一些好用的程式碼資源如openNLPFreeLingLingPipe的輔助,就足夠寫出這麼一支小小的程式,做出一件很有用的事情。之前曾提過的一個某秘密創業計畫,就是直接性的將自然語言運用到某個最熱門的領域,便帶來了前所未有的便利,也讓人非常期待它的推出。

使用者被Google寵壞了,每個網站都需要再更「介面超簡化」,所以這部份的創業機會,每個領域應該都有。這塊幾乎可以說是自然語言處理的科學界留給網站創業家的禮物。聖誕節到了,或許可以拆開看看,這禮物裡面還有哪些驚人的「自然美」商機。

4 Comments