主持人:下面有請(qǐng)北京締元信互聯(lián)網(wǎng)數(shù)據(jù)技術(shù)有限公司的CEO秦雯為我們講解大小數(shù)據(jù)結(jié)合研究用戶體驗(yàn),謝謝秦總。
秦雯:非常高興、非常榮幸,也謝謝劉老師給這個(gè)機(jī)會(huì)來(lái)跟大家分享,先說(shuō)兩點(diǎn)感想。上午很遺憾,沒(méi)有來(lái)聽(tīng),我相信上午的發(fā)言更精彩,下午前邊聽(tīng)了幾位的介紹和分享以后,確實(shí)因?yàn)槲易约罕救嗽谶@個(gè)行業(yè),我們說(shuō)大數(shù)據(jù)跟市場(chǎng)研究這個(gè)行業(yè)是一個(gè)部分重疊,但還不完全說(shuō)大數(shù)據(jù)就等于市場(chǎng)研究,在這個(gè)行業(yè)的話,這么多年我確實(shí)看到了整個(gè)大數(shù)據(jù)應(yīng)用,從概念到應(yīng)用、到落地越來(lái)越成熟,剛才時(shí)趣的王總的分享,我覺(jué)得應(yīng)該說(shuō)已經(jīng)有一套自己的體系了,這是一個(gè)。
第二個(gè),昨天在朋友圈看到一個(gè)小朋友發(fā)的帖子,他說(shuō)他跟一個(gè)大數(shù)據(jù)專家聊天有三點(diǎn)體會(huì)對(duì)他打動(dòng)比較深的,我想延展一下說(shuō)一下。第一個(gè),大數(shù)據(jù)不是解決平均的問(wèn)題,而是要發(fā)現(xiàn)變異,我們?cè)傺诱挂幌碌脑挘褪谴髷?shù)據(jù)甚至不是解決統(tǒng)計(jì)問(wèn)題,更多地是要解決個(gè)性化個(gè)體的問(wèn)題,這是一點(diǎn)。第二點(diǎn),大數(shù)據(jù)是要去發(fā)現(xiàn)新的商業(yè)模式,要去創(chuàng)新業(yè)務(wù),而不是說(shuō)只是落在我們說(shuō)我們?cè)瓉?lái)的市場(chǎng)研究,原來(lái)是樣本數(shù)據(jù),我們現(xiàn)在有大數(shù)據(jù)了,所以我們看到公開(kāi)場(chǎng)合媒體上有很多傳統(tǒng)做市場(chǎng)研究的,非常熟悉樣本研究的專家,實(shí)際上對(duì)大數(shù)據(jù)都持懷疑,甚至排斥、否定的態(tài)度。在我看來(lái),其實(shí)他們是從立場(chǎng)上、出發(fā)點(diǎn)可能就有一些問(wèn)題。第三點(diǎn),他分享的是大數(shù)據(jù)只是方法,關(guān)鍵是怎么去發(fā)現(xiàn)它的商業(yè)價(jià)值,我們前邊這幾年大家都在講大數(shù)據(jù)概念、講大數(shù)據(jù)的價(jià)值的話,其實(shí)對(duì)愿景、對(duì)未來(lái)大數(shù)據(jù)能夠給我們帶來(lái)什么,或者現(xiàn)在正給我們帶來(lái)什么其實(shí)已經(jīng)有很多論述,我經(jīng)常在這種公開(kāi)的場(chǎng)合說(shuō)已經(jīng)講煩了,因?yàn)樘焯煸谥v什么是大數(shù)據(jù),大數(shù)據(jù)有什么好處、有什么價(jià)值?實(shí)際在現(xiàn)在這個(gè)階段,我們?cè)趺茨軌蛉グ汛髷?shù)據(jù)用起來(lái),這個(gè)是我今天最后落,實(shí)際上我今天就講一個(gè)具體的做項(xiàng)目的例子,落在我們的實(shí)際應(yīng)用上,也就是說(shuō)我們公司至少有一份業(yè)務(wù)是怎么掙錢(qián)的?數(shù)據(jù)是怎么變現(xiàn)的?
實(shí)際上這個(gè)題目其實(shí)是我去年參加咱們協(xié)會(huì)本來(lái)想講的,為什么說(shuō)我能感覺(jué)到大家的觀念發(fā)生變化呢?去年參加的會(huì)議范圍比較小,但是我聽(tīng)了以后我發(fā)現(xiàn)大家對(duì)大數(shù)據(jù)的認(rèn)知有太多的偏差了,所以我去年把我這個(gè)PPT放下,我去講了我認(rèn)為的什么是大數(shù)據(jù)。今年有這個(gè)機(jī)會(huì)我還想把去年的案例,或者這個(gè)應(yīng)用點(diǎn)再分享一下。當(dāng)然我也不認(rèn)為這個(gè)就代表了說(shuō)我們未來(lái)大數(shù)據(jù)的一個(gè)必然方向和前景,但是至少在現(xiàn)階段大家能看到它是怎么產(chǎn)生價(jià)值的。
這一張PPT我相信如果之前有朋友關(guān)注我們公司和關(guān)注我的分享的話,這一張內(nèi)容其實(shí)我用過(guò)很多次了,但是是講什么呢?我為什么不用大小數(shù)據(jù)了?因?yàn)槲野l(fā)現(xiàn)現(xiàn)在對(duì)大數(shù)據(jù)和小數(shù)據(jù)的定義也還是混淆不清的。我看有些文章說(shuō)什么是小數(shù)據(jù)?每個(gè)人的完整的行為信息就是小數(shù)據(jù),實(shí)際可能從另外一方面理解的話,我們把這種連續(xù)的行為數(shù)據(jù)我們認(rèn)為它是大數(shù)據(jù)范疇的,所以這個(gè)理解不一樣,干脆我們不討論主意了,我們也不討論概念了,我們看解決問(wèn)題。比較能夠容易界定的就是我們把它分成樣本數(shù)據(jù)和監(jiān)測(cè)數(shù)據(jù),或者說(shuō)調(diào)查數(shù)據(jù)和監(jiān)測(cè)數(shù)據(jù)。這個(gè)里邊今天跟我講的相關(guān)的兩類數(shù)據(jù)的區(qū)別點(diǎn)一個(gè)是主觀的,一個(gè)是客觀的,一個(gè)是斷點(diǎn)的、一個(gè)是連續(xù)的,其他的一些要素和特性我就不展開(kāi)講了,我們進(jìn)入案例環(huán)節(jié)。
這是一個(gè)跑步人群的研究,這實(shí)際上是一個(gè)咨詢項(xiàng)目,也就是說(shuō)客戶想了解現(xiàn)在愛(ài)跑步的這群人,他到底是個(gè)什么樣子?所以項(xiàng)目背景是我們的一個(gè)客戶是做馬拉松賽事的集團(tuán),它想推一個(gè)基于移動(dòng)的服務(wù)于馬拉松和跑步愛(ài)好者的手機(jī)應(yīng)用。在這之前要做一些可行性分析也好,或者是項(xiàng)目的背景的一些分析,幫助他去制定他的產(chǎn)品、他的營(yíng)銷,包括他今后繼續(xù)組織馬拉松這樣的賽事的時(shí)候的一些傳播、推廣的策略信息。
當(dāng)然傳統(tǒng)的這種問(wèn)題,我們的抽樣調(diào)查的方式,我相信大家都非常熟悉,我們看看從我們的角度怎么把這種抽樣的數(shù)據(jù)和全樣數(shù)據(jù),和我們所監(jiān)測(cè)的用戶行為數(shù)據(jù)結(jié)合起來(lái)用,給客戶提供的一個(gè)成果。落實(shí)到研究?jī)?nèi)容就這三個(gè)偏好,一個(gè)是運(yùn)動(dòng),更多的是跑步這項(xiàng)運(yùn)動(dòng)的偏好,還有一實(shí)際上是內(nèi)容偏好,他們?cè)诰W(wǎng)上愛(ài)看什么,再有一個(gè)是品牌偏好,他在運(yùn)動(dòng)當(dāng)中偏愛(ài)哪些品牌的相關(guān)的商品。這三個(gè)解決一個(gè)是對(duì)人群本身的特性,第二個(gè)是我們傳播可能未來(lái)合適的渠道,第三個(gè)是營(yíng)銷的主要服務(wù)對(duì)象,解決這三個(gè)問(wèn)題。
我們做的研究方法其實(shí)是兩種,一種就是我們也做了在線的調(diào)研,主要收集的數(shù)據(jù),或者說(shuō)去了解的信息是這種跑步人群一些基本背景情況,和他主觀上的一些對(duì)跑步的認(rèn)識(shí),還有一些偏好,這些信息。另外兩個(gè)的話,興趣愛(ài)好和商業(yè)價(jià)值我們是通過(guò)行為數(shù)據(jù)挖掘來(lái)做的,這是一個(gè)調(diào)研問(wèn)卷,我不知道大家有沒(méi)有印象,應(yīng)該當(dāng)時(shí)主要大的門(mén)戶和一些APP都包括進(jìn)去了。
行為數(shù)據(jù)怎么來(lái)做?大家可能在座的有些知道締元信本身是在做大的媒體和獨(dú)立的應(yīng)用,還有一些垂直網(wǎng)站的全流量監(jiān)測(cè),這是我們的基本業(yè)務(wù),所以我們每天覆蓋了大概兩億多網(wǎng)民上網(wǎng)的在主要應(yīng)用平臺(tái)上上網(wǎng)的信息,所以我們?cè)谶@樣海量的信息下,我們?cè)趺炊x是跑步人群?這兒有一個(gè)全樣數(shù)據(jù),我們說(shuō)的行為數(shù)據(jù)的一種方法。我們基本上把一個(gè)是從他的行為上,他看哪些內(nèi)容,內(nèi)容行為上去畫(huà)一條線,還有一個(gè)的話就是他的上網(wǎng)習(xí)慣上,這是一個(gè)。把這個(gè)人群定義好的話,我們把符合這個(gè)用戶的定義單提出來(lái),當(dāng)然設(shè)定一個(gè)可行的時(shí)間、周期,這個(gè)數(shù)據(jù)提出來(lái)以后的話,我們把他這個(gè)周期所有的數(shù)據(jù)都提出來(lái),去做挖掘和研究。具體的處理就是一個(gè)所謂的大數(shù)據(jù)平臺(tái),因?yàn)槲覀円膊粫?huì)是只為這一個(gè)項(xiàng)目單獨(dú)來(lái)做處理,這是整個(gè)大數(shù)據(jù)平臺(tái)每天要做的處理內(nèi)容,大概就是這幾個(gè)環(huán)節(jié),采集、轉(zhuǎn)化、標(biāo)簽化、輸出結(jié)果。
對(duì)我們來(lái)講,實(shí)際這個(gè)項(xiàng)目操作的時(shí)候,當(dāng)我們把人群定義好以后,我們實(shí)際上只需要去按照這個(gè)定義出來(lái)的標(biāo)簽把相關(guān)的用戶從我們的數(shù)據(jù)平臺(tái)里提取出來(lái),就可以再去做進(jìn)一步地分析和研究了。
我先講一下在這個(gè)項(xiàng)目過(guò)程當(dāng)中,這兩類數(shù)據(jù)它是怎么相互結(jié)合使用的,首先第一個(gè)這兩類數(shù)據(jù)互為前提,所謂互為前提我舉了兩個(gè)例子,我不展開(kāi)講,比方說(shuō)我們說(shuō)樣本數(shù)據(jù),我們是根據(jù)樣本數(shù)據(jù)了解、知道跑步人群本身也是高依賴度的網(wǎng)民。因?yàn)槿绻f(shuō)另外一個(gè)主題,這個(gè)受眾或者說(shuō)你要研究的對(duì)象它本身網(wǎng)絡(luò)依賴程度不高的話,你實(shí)際上再去提這些數(shù)據(jù),提他的行為數(shù)據(jù)就沒(méi)有意義了,所以這是用樣本的結(jié)論,或者說(shuō)樣本數(shù)據(jù)的結(jié)果作為模型法的前提。反過(guò)來(lái)的話,我們從行為,從跑步人群的行為數(shù)據(jù)上,或者反映出來(lái)的信息上,我們能發(fā)現(xiàn)他們的一些行為特征,但是因?yàn)檫@樣的數(shù)據(jù)只能告訴你他是怎么樣的,他不能告訴你他為什么這樣,所以我們會(huì)根據(jù)發(fā)現(xiàn)的這些特征反過(guò)來(lái)去設(shè)計(jì)我們的調(diào)查問(wèn)卷。我們有針對(duì)性地去問(wèn)、去了解這樣的行為特征它背后的原因,我們就說(shuō)所謂的因果研究,所以這個(gè)是互為前提,這是第一點(diǎn)。
第二點(diǎn),兩個(gè)數(shù)據(jù)結(jié)果相互印證,同樣的項(xiàng)目,這兩個(gè)如果有差別,或者是矛盾的,那說(shuō)明你本身的研究是有問(wèn)題的。我舉了一些例子,比方說(shuō)我們通過(guò)這兩類數(shù)據(jù)都能看到跑步人群的話,男性比男性多,中青年為主,中等收入為主,這是一個(gè)。當(dāng)然在實(shí)際的項(xiàng)目研究過(guò)程當(dāng)中還有很多其他的一些可以相互印證的結(jié)論和信息,我就不展開(kāi)講了。
第三點(diǎn),更重要的是兩類數(shù)據(jù)相互補(bǔ)充,我們看在樣本法的話,我們更多地是去了解每個(gè)人主觀上的一些東西,和在他網(wǎng)上的行為上我們反應(yīng)不出來(lái)的他的信息。比方說(shuō)他是不是經(jīng)常跑步?他為什么跑步?我們?nèi)绻诰W(wǎng)上無(wú)論在手機(jī)上還是PC端,這個(gè)人哪怕天天去看跑步信息,他也不一定是跑步愛(ài)好者。我們之前有一個(gè)例子,汽車內(nèi)容的用戶,我們發(fā)現(xiàn)有一批這樣的人,基本上天天來(lái)看汽車內(nèi)容,但是好像跟買車沒(méi)關(guān)系,最后研究出來(lái)的話,這批人是什么?是圈子里的人,他本身就是汽車行業(yè)的。這樣的話,通過(guò)這樣的問(wèn)卷調(diào)查我們?nèi)チ私馑麨槭裁矗吭趺礃??模型法更多的是一些客觀信息,他在網(wǎng)上怎樣的一些行為特征和偏好。
最后還有一分鐘,正好把我舉的結(jié)論看一下,跑步人群在網(wǎng)上喜歡討論什么內(nèi)容,這是跑步裝備里邊他最喜歡什么,這一點(diǎn)也是兩類數(shù)據(jù)互相印證了。這個(gè)實(shí)際上是一個(gè)所謂的用戶人群畫(huà)像,我們上邊這個(gè)一排是男性,下邊一排是女性,不同年齡段的人,他的偏好特征是不一樣的,當(dāng)然另外一方面我們也可以從其他緯度對(duì)跑步的愛(ài)好程度不同,可能偏好程度也是不一樣的,這個(gè)數(shù)據(jù)都能夠很靈活地做多緯的價(jià)差分析。這是對(duì)品牌的偏好,這個(gè)是除了跑步人群對(duì)汽車品牌的偏好,對(duì)明星的偏好,大概能夠看得出來(lái)這樣的研究和傳統(tǒng)的只做樣本研究的話,可能會(huì)有一些差別。
我最后想總結(jié)一句話,實(shí)際上我們?cè)趯?shí)踐當(dāng)中,我們基本上在類似這樣的項(xiàng)目,我們遵循的是這樣的一個(gè)金字塔原則,為什么是金字塔?而不是三塊的疊加,或者是簡(jiǎn)單地相加呢?保證用戶是同源的,我們?cè)谧罨A(chǔ)的事實(shí)監(jiān)測(cè),監(jiān)測(cè)數(shù)據(jù)我們知道客觀行為、知道其然,我們通過(guò)用戶調(diào)查去了解其所以然,尤其是在做互聯(lián)網(wǎng)產(chǎn)品的可用性測(cè)試的時(shí)候,這樣一個(gè)金字塔的方法我們是用得比較多的。
我估計(jì)我的時(shí)間也到了,謝謝大家,我今天就分享到這里。
主持人:謝謝秦總,締元信這個(gè)公司在數(shù)據(jù)方面,尤其在一些汽車行業(yè)的相關(guān)數(shù)據(jù)我們跟它有合作,他們的數(shù)據(jù)會(huì)特別詳細(xì),包括到了每一個(gè)產(chǎn)車型,重級(jí)車什么樣的數(shù)據(jù)分析,包括跑步的數(shù)據(jù),很多運(yùn)動(dòng)產(chǎn)品、運(yùn)動(dòng)用品都做相關(guān)的活動(dòng)。