「統計系」恐將變成第一志願,但網路到底是量化資料較偉大,還是質化資料較偉大?

最近有一篇文章再次被美國網路人拿出來討論,這是在《紐約時報》去年的一篇文章, 「未來十年內最迷人的工作,會是『統計學家』」,然後又有一篇幾個月前從O’Reilly團隊所出的文章也再次拿出來,這文章介紹了「數據科學(data science)的力量」。

他舉了一個例子,一位哈佛大學畢業的女生,原本專修「人類學」,後來她在研究所的主題是研究馬雅人當時在何處定居,並且使用了一些原本不屬於她學科的「數學與統計學」來計算馬雅人定居的pattern,畢業之後,竟然被Google聘請過來了,利用她對於大量資料的計算能力,為Google搜尋引擎進步一下!他們說,像這位女博士的這種統計學家,無論原本是在分析人類學的數字還是哪一個學問的數字,Google這樣的網路公司,都願意以12.5萬美元的年薪予以聘用!

為什麼?或許人類學家已經收集了馬雅文化許多數字資料等著要分析,但「現在的人類」又有更多的數字資料等著被分析啊!網路上天天有人在搜尋、有人在分享、關鍵字不斷變幻,文章指出,現在的資料已經夠多了,但到了2012年,資料量還會是現在的五倍多!驚!除了Google,那篇文章還說,另一家大廠IBM也在去年四月開了一個「商業數據分析與優化服務」的部門,大量聘用了200位數學家來作分析,這個「數學工廠」運用了各式各樣先進的分析軟體,可以從資料中萃取出「黃金」。

當年四年前自己寫的《搶先佈局十年後》一書中,已在兩個章節提到網路時代的「數字分析師」的重要,當時我預測的一百多種新職業中,有以下這兩個:「使用消費者預測軟體、資料挖礦軟體,整合出對公司最有效率的商品策略分析師」、「能從一大堆數字、圖片資料找出危險訊號的資料挖礦專才」,這些分析師可以從成千上萬收集的資料中,去看出看似普普通通,一推出卻就如野火撩原,一發不可收拾的產品,提升人類購買慾的「邪惡密碼」;另外,我曾寫到,在徵才的時候,配合一些資料挖礦的技術以及「網路黑名單」,事先對每位前來面試者作身家調查及性向測驗,看這個人到底會不會是好員工,未來的易動率會有多大。「儘管美國勞工法規定,不能因為員工性向測驗沒通過而不錄取,但這種事情永遠是沒人知道的。」

大家認定「數字學家」是未來,還不只這樣!還有另一篇文章則講到,其實不必這麼偉大,一般人也可以感受到資料被整理之後的便利,單單是你想買機票的時候,上網去「搜尋航班」,就有三個新的網站可以為你做不一樣的搜尋,其中之一的「Hipmunk」上星期才開站,它會主動的將「廢話」除掉,什麼叫「廢話」?假設你不care是飛哪一家航空公司,只care你的機票價格和是否轉機,那麼它會自動的將差不多價錢但要轉好幾次的拿掉,或者同樣的時間但一個要等二小時轉機一個要等五小時轉機,那它會將五小時轉機的拿掉,這樣拿掉的小動作可以大幅提升使用者滿意度。而另一個InsideTrip則是讓你在選航班的時候可以多選「機齡」、「位子大小」……。而Yapta則讓你鎖定某一個航班,當它的價格有所調整的時候,會寄一封email給你,你就知道你現在可以過去了。

不過,當我看到矽谷網路人再次拿出這些東西,再次將它們炒得這麼熱,我,卻有些不一樣的想法!事實上,過了三年後,除了「數字」外,還有另一種資料,更有意思

我認為,在「數字」資料裡頭撈黃金,真的像在沙堆中萃取金沙,中了就買礦山,沒中什麼也沒有,但目前有一種「東西」,通常直接被丟到垃圾桶,只要你打開垃圾桶,就可以看得到──

那些東西,就是非數字的文字

可以說是「質化」的資料。

數字一直都在,去年的數字,只要用一個工具又可以計算出一個結論,但,這些「質化」的資料,每天每天每天被全世界各種人所寫出來,它們是「文字」、是「圖片」、是影片,它們無法以「總量」一視全部,每天被製造出來的太多,今天的壓過昨天,昨天的壓過前天,比恐龍化石還埋得更深。美國人比較直,他們認為最大的希望是在「數字資料」上,但我們會覺得,資料變多,除了數字變多,文字也變多了啊!而且,相對的還有另一個重要資源的變化,那就是──「時間也變少了」

昨天剛好有一篇文章,就介紹了一個新網站叫「fleetSummaries.com」,這間新公司並不是提供你資料的分析,它是專攻「書」。

別看現在「書」好像沒有很快,全球出書的速度已經遠遠超過我們可以看的速度,尤其是「商業書」,他們說,現在每一年都有超過10萬本的商業書出版,但一般的讀者一年能看完5本就很厲害了,對於一位很忙碌的管理階層的主管、創業家、大老闆、投資者……來說,他們最珍貴的是「時間」,但又想看這這些商業書,怎麼辦?fleetSummaries.com每一周都會將一些當下最紅的商業書籍,做成一個最簡單易懂的「導讀」給你,他們預計,原本必須讀好幾天以上的書,只要看他們導讀,20分鐘就可以學到一切。

如果你忙到連20分鐘都沒有嗎?除了PDF、HTML之外,他們也將整本書的內容做成「心智圖」,或也可以用「聽」的(MP3),或也可以使用Kindle來閱覽。這樣看來,忙碌的城市人可以將這些知識一次打包,每周都讀完當周剛剛出版的所有的商業書籍!

至於這網站是否有版權的問題,我想,只要引用的字數不超過一個數字,全部的文字都是經過某人吸收之後再吐出來的,應該還在合理範圍內。或許「數字」的未來是給Google、IBM那種公司去請200位數學家去發掘的,但「文字」的未來卻是我們「小人物」所可以發掘的

看,開一間「FleetSummaries.com」,看遍所有商業書,每周全部一口氣全部讀給你看,這樣的網站,「小人物」就可以做得到。

這和未來文字會有何關係呢?

離當時喊出「未來文字團隊」已經大約一年了,當時希望成立一個「未來文字團隊」,是希望可以共同經營一個粉絲專頁,再轉成電子書出版,但後來試行三個月即證明我們談不到合作廠商,無法讓當時的「未來文字寫手」得到獲利,因此喊停。但一年來,我們的團隊成立、業務穩定,可以再次來嘗試「未來文字」了

有興趣嗎?歡迎報名參加「未來文字團隊」。志工性質,不喜勿報,歡迎寫信至contact.mr6@gmail.com、invite.mr6@gmail.com,標題提到「未來文字」,我們會再回信給您報告第一次時間。

26 comments

  1. 這裡的質與量,是指兩種研究方法的類型,質性研究(Qualitative Research)與量化研究(Quantitative research),並不是在談品質與數量.
    補充提供Mr.6參考,Qualitative Research國內翻譯為質性研究,並不是質化.

  2. 4樓講的對極了

    量只是起點,決定有沒有意義還是需要質去探討,這還是需要網路人,統計系也沒辦法做,這有一點像投資,會計師沒有人變投資大師,因為他們只懂數字,卻不懂數字後面的"meaning"…

    fleetSummaries.com 不就是一個"類書評"網站,還是不看好…

    因為真正值得讀的商業書1年沒有多少本,弄一個"1年必讀的商業書"website,然後專門研究這10-20本書會更有意義,雖然世界變化很快,但觀念還是很少變化….

    關於"未來文字",嘿嘿!,我想到更快的方式,可以短時間之內成功,看mr.6何時有空可以聊聊….

    參考,參考….

  3. 幾年前,我設計了一個「理解筆記」,就是希望整理文章或書籍的「筋骨」,以幫助快速理解;如果能由廣大讀者或專家,共同淬鍊該文或該書籍的「筋骨」,為後來的讀者將節省大量時間及思路(維)啟示。很遺憾,孤掌難鳴!
    如果「未來文字」作為專業「理解」團隊,能針對學生的教課書或熱門財經書籍等進行「理解」整理,形成系列「理解筆記」出版於網上,應不愁沒有學習市場。
    如果誰願意登高一呼,我願完力配合!

  4. Most human’s listening ability is still way under developed. This could be the real gold mine for both normal, vision challenged people or anyone with any kind of learning disabilities.

  5. 這資訊爆炸的時代, 要找出自己要的資訊實在是不容易的一件事.
    找出實用的資訊然後統計歸類出有用的資料也是一門新學問阿~~

  6. “每一年都有超過10萬本的商業書出版"
    vs.
    “Each year more than 10,000 business books are published."

    ==> No wonder rumor explodes in another language.

  7. 我是一位統計系的學生….你分析的文章不無道理

    但是我覺得你說的環境,資料採礦這塊在大國家能得到比較完整的發展,如

    之前美國公布全國薪資平均數入前十高的行業,統計專長名列前茅,當然

    我沒去看paper,不過是由美統局發布多少有公信力。

    台灣的統計人才若不想遠渡重洋只能期待大陸這塊市場,畢竟訊息量

    大,要與大陸統計學界競爭得要非常戰戰兢兢,大陸統計在亞洲也是數一

    數二。無論如何統計是一門深奧的工具,必須輔以另一個領域知識

    相信這樣做出來的研究一定比別人出色….

  8. This design is steller! You obviously know how to keep a reader amused. Between your wit and your videos, I was almost moved to start my own blog (well, almost…HaHa!) Great job. I really loved what you had to say, and more than that, how you presented it. Too cool!

  9. Hello I am so grateful I found your web site, I really found you by error, while I was looking on Aol for something else, Anyways I am here now and would just like to say thanks a lot for a remarkable post and a all round exciting blog (I also love the theme/design), I don’t have time to go through it all at the minute but I have book-marked it and also added in your RSS feeds, so when I have time I will be back to read a lot more, Please do keep up the excellent job.

迴響已關閉。