如今,社交網(wǎng)站的流行,網(wǎng)購的普及以及各種傳感器的廣泛應用伴以數(shù)據(jù)儲存成本的降低和分析處理的思想與算法發(fā)展,讓我們產(chǎn)生了巨大的數(shù)據(jù)的同時更容易存儲、分析和利用它們。這就是所謂的大數(shù)據(jù)時代。一款優(yōu)秀的產(chǎn)品,必定是迎合時代潮流的。那么在“大數(shù)據(jù)時代“下,我們應該如何去創(chuàng)造一個”大數(shù)據(jù)“產(chǎn)品?如何采集并利用數(shù)據(jù)?以下五點是我在“大數(shù)據(jù)時代”下的產(chǎn)品思考。
確定產(chǎn)品定位
數(shù)據(jù)收集
數(shù)據(jù)收集即自己去收集數(shù)據(jù),成為數(shù)據(jù)擁有者,通過數(shù)據(jù)授權(quán)等方式利用數(shù)據(jù)。
數(shù)據(jù)分析
擁有出色的數(shù)據(jù)分析技術(shù),從別人提供的數(shù)據(jù)那挖掘數(shù)據(jù)的價值。
數(shù)據(jù)創(chuàng)新
沒有數(shù)據(jù),也沒有出色的技術(shù)。但是看到了數(shù)據(jù)之間的聯(lián)系,預見到了數(shù)據(jù)存在的價值,成為這方面的先行者。
轉(zhuǎn)變產(chǎn)品思維
很多時候,我們能獲取約等于全局的數(shù)據(jù)量,但是我們很多時候還是用原先的數(shù)據(jù)處理方式。
原先我們只能獲取一部分數(shù)據(jù),然后以這部分數(shù)據(jù)去估算。所以我們的數(shù)學模型對數(shù)據(jù)的精確性和隨機性要求非常高,因為數(shù)據(jù)是這么的少,改變一點點就能帶來結(jié)果上的巨大偏差。現(xiàn)在我們擁有了更多的數(shù)據(jù),使用相對簡單的算法,只需帶入更多的數(shù)據(jù)就會擁有更精確的結(jié)果。
數(shù)據(jù)不再是單一的,結(jié)構(gòu)化的,而是混雜的。
“小數(shù)據(jù)”時,我們會去給數(shù)據(jù)分類分級,去盡可能的結(jié)構(gòu)化他們,我們能應付過來,但是如今,數(shù)據(jù)多種多樣,很多時候你根本沒有辦法把他們分類分級。但我們可以利用這種混亂,比如給照片設定標簽,開辟一個新的數(shù)據(jù)種類。
大數(shù)據(jù)時代推崇的是相關(guān)關(guān)系而不是因果關(guān)系。
這也是大數(shù)據(jù)的核心:利用相關(guān)關(guān)系作出預測,而不去分析它的原因。我們只知道“是什么”,而不知道“為什么”。但是前者很明顯更簡單直接的解決了問題。但是這并不意味著“因果關(guān)系”不再重要,我們要拋棄它。比如沃爾瑪通過數(shù)據(jù)分析發(fā)現(xiàn),颶風來臨的時候蛋撻銷量特別好,那么我們就可以在颶風來臨時,多做蛋撻并擺在顯眼的位置以增加銷量。但是我們并不知道為什么它們會相關(guān)。
獲取數(shù)據(jù)
數(shù)字化同時數(shù)據(jù)化。
數(shù)字化是數(shù)據(jù)化的基礎,比如僅僅掃描一本書,讓它能夠在電子設備上閱讀,這叫數(shù)字化。但是你還不能處理上面的文字,做一些分析,我們需要通過圖片文字識別技術(shù),來將掃描的書轉(zhuǎn)化成可以提取分析的文本數(shù)據(jù)。只有數(shù)據(jù)化的數(shù)據(jù)才對我們的產(chǎn)品有價值。
從看似不可能的地方提取數(shù)據(jù)。
因為數(shù)據(jù)存儲成本的變低和數(shù)據(jù)價值的巨大,我們可以收集更多的數(shù)據(jù)存儲起來以期日后能挖掘出價值。我們要開拓思維,從許多看似不可能的地方收集數(shù)據(jù)。比如,一家日本汽車服務商,創(chuàng)新的把傳感器放到了汽車座椅上,經(jīng)過記錄與分析,我們可以判斷司機的體型,習慣坐姿,受力等等數(shù)據(jù),如果一個小偷坐上了汽車,傳感器感受到了變化,就會讓其輸入啟動密碼以確認身份。
提前設計擴展數(shù)據(jù)。
數(shù)據(jù)在不斷的再利用中才能發(fā)揮出其最大的價值,一開始就設計好數(shù)據(jù)的可擴展性能讓這種再利用更容易,雖然這并不總是可能。谷歌街景車在收集信息之初,考慮到了自己未來的自動汽車計劃。所以在采集的時候,記錄下的街景和GPS定位信息將來不僅可以優(yōu)化地圖也能用于自動汽車的研發(fā)。
利用數(shù)據(jù)廢氣。
我們看看谷歌是怎么利用登錄的驗證碼的:它將驗證碼變成一些常見的錯誤拼寫單詞,每次用戶登錄輸入這些驗證碼的時候就要求其輸入成正確的單詞。這一舉措讓谷歌的拼寫檢查器得到了巨大的提高,而且還是免費的。
數(shù)據(jù)利用
直接利用:通過直接的方式利用。比如分區(qū)域統(tǒng)計你用戶的身高,做成一張各省份平均身高表。
數(shù)據(jù)再利用:利用之前的數(shù)據(jù),往往能獲取更多的信息。比如谷歌根據(jù)搜索記錄分析,預測了各地流感發(fā)病情況,達到了相當高的準確率。
數(shù)據(jù)重組:將不同領(lǐng)域的數(shù)據(jù)結(jié)合起來分析。比如將手機的使用情況和癌癥發(fā)病率聯(lián)系起來,丹麥的科學家發(fā)現(xiàn)兩者之間并沒有什么關(guān)系。
開放數(shù)據(jù):你的數(shù)據(jù)處理能力不強,那么可以選擇公開或者授權(quán)數(shù)據(jù),讓別人用你的數(shù)據(jù)發(fā)掘出價值,并從中獲益。
法律與道德
產(chǎn)品對于用戶數(shù)據(jù)的分析,難免會涉及到用戶的隱私,數(shù)據(jù)利用的創(chuàng)新也會讓數(shù)據(jù)涉及到用戶未授權(quán)的用途,你沒法去再征求所有用戶同意。在法律不明確的情況下,我們利用這些數(shù)據(jù)去做些什么,會產(chǎn)生生什么樣的后果,產(chǎn)品設計者必須要思考清楚,并負承擔起相應的責任。