
圖/視覺中國
在龐大的數(shù)據(jù)面前,人類越來越像一個提供輸入的變量角色,任何試圖偽裝和保護(hù)自己的舉動,在360度無死角的數(shù)據(jù)監(jiān)控下都顯得徒勞。你使用的APP,在試圖了解和定義你。
文| 閆坤沐
編輯| 金匝
“越氪越非”
律師李欣然(化名)第一次對某大型旅行票務(wù)網(wǎng)站產(chǎn)生警覺是在去年暑假。為了帶女兒去日本迪士尼,她相中一家酒店,但同一個房型,在她手機上顯示的價格比在丈夫手機上貴了120元人民幣。
剛開始,李欣然還以為是丈夫沒選三人同住的緣故,但仔細(xì)核對后發(fā)現(xiàn)并不是。她向婆婆要來手機,以新客人的身份下載注冊了同一款A(yù)PP,還很嚴(yán)謹(jǐn)?shù)赜昧髁慷皇羌依颳iFi聯(lián)網(wǎng),查詢后發(fā)現(xiàn),一些房間比丈夫手機上顯示的價格還要更低。
“搜索以后的結(jié)果直接就有差異,我沒有領(lǐng)優(yōu)惠券也沒有收到紅包。”
因為工作原因,李欣然出差頻繁,經(jīng)常用APP給自己訂商務(wù)型酒店。盡管不清楚具體的技術(shù)原理,但她憑直覺推斷,自己是被平臺的用戶畫像識別成了消費能力高的客戶,所以會給她顯示更高的價格。
李欣然和丈夫的收入都不低,自認(rèn)為并不算對價格敏感的用戶,如果APP用正常的價格調(diào)節(jié)方式給新用戶發(fā)放一些額外優(yōu)惠,她并不會介意。
讓她不舒服的是,價格上的差異對待是在她完全不知情的情況下進(jìn)行的:“我在乎的是知情權(quán)。如果我知道網(wǎng)站在搞活動,但我沒資格參加,這就沒關(guān)系;如果我知道有優(yōu)惠券,但是需要分享到朋友圈、每天簽到點贊或者掐時間搶,我不愿意犧牲這個精力來換優(yōu)惠,我也心甘情愿。但現(xiàn)在我懷疑,是APP收集我的使用習(xí)慣暗地里對我區(qū)別定價,那我當(dāng)然有負(fù)面情緒。”
在社交網(wǎng)絡(luò)上,和李欣然一樣因為感受到被區(qū)別對待而產(chǎn)生“負(fù)面情緒”的人不在少數(shù),他們的集體控訴經(jīng)由媒體報道后催生了一個新的概念:“大數(shù)據(jù)殺熟”。概念的發(fā)明反過來又刺激了更多網(wǎng)友把自己的經(jīng)歷對號入座。
圖/視覺中國
幾乎沒有一個互聯(lián)網(wǎng)產(chǎn)品不被懷疑“殺熟”——
有人說在電影購票APP里花錢買了會員,票價反而比非會員更高;
有人發(fā)現(xiàn)同樣是買一年的視頻網(wǎng)站會員,iPhone用戶比Android手機用戶多花幾十塊錢;
有人察覺到用旅行APP買機票,只要你沒付錢,價格越搜越貴,余票越來越少,直到只剩一張,嚇得你趕緊出手??傻雀读隋X再搜,這張機票還能買,而且又跌回了原來的優(yōu)惠價。
有人抱怨玩卡牌游戲“越氪越非”(越花錢越難抽到價值大的卡牌),讓不愛花錢的用戶更容易抽到好卡,作為誘餌刺激有付費意愿的人繼續(xù)掏更多錢……
輿論風(fēng)暴中,攜程大住宿事業(yè)部CEO陳瑞亮接受采訪,以職業(yè)身份向用戶保證,自家平臺上沒有過也不會有大數(shù)據(jù)殺熟的現(xiàn)象發(fā)生。他解釋不同用戶間顯示的差價是優(yōu)惠券造成的,攜程會“努力優(yōu)化頁面展示,更清晰真實地展示優(yōu)惠后的價格信息,避免誤解。”至于有什么避免被“殺熟”的方法,他覺得“更多地還是要從公司層面來驅(qū)動”;而對于消費者而言,“能做的就是多進(jìn)行價格比對”。
也就是說:做不做“大數(shù)據(jù)殺熟”,全憑公司自覺;而如果一家公司決定這么做,用戶要付出很大的代價。
斗智斗勇
但李欣然覺得,這聽起來顯然非常不“互聯(lián)網(wǎng)”。
她察覺到房間價格異樣時,還沒有“大數(shù)據(jù)殺熟”這個詞的出現(xiàn),但出于職業(yè)習(xí)慣,她敏銳地意識到了一個比“殺熟”更深層次的問題:我使用的APP,在試圖了解和定義我。
“如果一個APP能判斷我和我婆婆對價格的承受能力不同,那它一定知道我更多信息。”
攜程技術(shù)中心基礎(chǔ)業(yè)務(wù)研發(fā)部高級研發(fā)經(jīng)理周源曾寫過一篇文章,叫《手把手教你用大數(shù)據(jù)打造用戶畫像》,其中透露出來的一些信息,從側(cè)面驗證了李欣然的猜想。
據(jù)周源介紹,攜程對用戶數(shù)據(jù)的采集不僅來自于自家網(wǎng)站和APP,同樣也會抓取合作站點,比如微博、知乎的用戶信息。他們?yōu)橛脩艚嬒竦木S度包括性別、年齡、消費能力、親子偏好等等,“數(shù)據(jù)是海量的”。
文章中的一個圖表顯示,攜程對用戶的消費能力定義劃分為“非常小氣、一般小氣、一般大方、非常大方”四個等級。 周源在文章中反復(fù)強調(diào),要在攜程內(nèi)部調(diào)用這些數(shù)據(jù)需要非常嚴(yán)格的程序限制。
但身為消費者,很難在裁判缺失的情況下,相信企業(yè)們在利益面前會充分自律。
《手把手教你用大數(shù)據(jù)打造用戶畫像》一文中使用的圖表
事實上,差別定價并不是什么了不起的新鮮技術(shù),電商巨頭亞馬遜早在2000年9月就實施過類似的實驗。為了沖擊更高的零售額,他們選擇了68款DVD碟片,根據(jù)用戶填寫的資料、購物歷史、上網(wǎng)使用的操作系統(tǒng)等條件判斷他們的購買力,給他們輸出不同的價格。一個20美元出頭的產(chǎn)品,新用戶和老用戶之間差價波動在4美元左右。
盡管68個產(chǎn)品在亞馬遜超過千萬種的商品列表里顯得絲毫不起眼,但這個實驗進(jìn)行了不到一個月,還是被用戶發(fā)現(xiàn)了。在一個叫DVDTALK的音樂論壇上,成百上千的網(wǎng)友通過發(fā)布自己買到的產(chǎn)品價格做人工比價,憤怒之余,討論層面不可避免地上升到懷疑亞馬遜在收集和分析用戶的隱私數(shù)據(jù),以至于當(dāng)時的CEO不得不站出來保證,亞馬遜永遠(yuǎn)不會對用戶區(qū)別定價。
18年之后的中國,幾乎類似的情境發(fā)生在更多公司身上,并且遠(yuǎn)遠(yuǎn)不止于此。
“大數(shù)據(jù)殺熟”刷屏之后,知乎用戶“邏格斯”又提出另一個更可怕的假設(shè)叫“大數(shù)據(jù)售假”:如果消費行為大數(shù)據(jù)顯示你是一個不愛寫評價,幾乎不會給出差評的用戶,那么稍有良心的平臺可以把別的客戶退換的貨物或者次品優(yōu)先配送給你,但更夸張的可能性是,在某些真假混賣的電商平臺,他們可以依據(jù)這項數(shù)據(jù)把假貨發(fā)給你。
如何避免被大數(shù)據(jù)收集信息?作為一個對維權(quán)很敏感的人,李欣然開始關(guān)注和大數(shù)據(jù)斗智斗勇的方法。她棄用了大多數(shù)APP,重新回到網(wǎng)頁時代,自學(xué)使用瀏覽器的隱身模式,不在電腦或者手機上留下訪問網(wǎng)站的痕跡,還養(yǎng)成了手動清理cookie記錄的習(xí)慣,不讓網(wǎng)站有機會追蹤自己的行為邏輯,以及用任何服務(wù)之前都會貨比三家。
和李欣然一樣,更多網(wǎng)友試圖研究“調(diào)戲”大數(shù)據(jù)的方法。
豆瓣用戶“大魔王·桶狗”就貢獻(xiàn)了一條他的實驗成果:
我昨天在A平臺上打算買一桶油,下單前臨時剎車,去B平臺上看了一眼,B平臺比A平臺的會員價還便宜,于是把B平臺的油加入購物車,再刪除了A平臺的購物車。然后,我再打開A平臺,它給我發(fā)了一張糧油優(yōu)惠券。
這條廣播被他打上#與大數(shù)據(jù)斗智斗勇#的標(biāo)簽發(fā)布出來,成了當(dāng)天豆瓣的熱門廣播,評論中不少網(wǎng)友都在互相交換自己常用的比價工具。
這樣的試驗或許有玩笑成分,但也反映了在大數(shù)據(jù)面前,一個普通用戶想要保護(hù)自己的利益和隱私需要付出高昂的成本。
抵抗和偽裝都是徒勞
對大數(shù)據(jù)的恐慌情緒愈演愈烈,也催生出很多錯覺和謠言。
最典型的一個,是懷疑自己被監(jiān)聽。你一定聽朋友講過這樣的“恐怖”故事:我前腳聊天時和別人討論了去海邊旅行,后腳打開購物APP就發(fā)現(xiàn)它在給我推薦泳衣。我什么都沒搜,它是怎么知道我想干什么的?難道是利用麥克風(fēng)權(quán)限在監(jiān)聽我?
事實上,如果人工智能真的能做到這么“智能”,別說手機抗不扛得住電量,市面上的語音識別服務(wù)也不至于還在錯漏百出的階段了。
公眾的誤解在于,比起監(jiān)聽,其實你手機里的APP有一萬種性價比更高的方式了解你,而你幾乎難以察覺。
以幾乎每個APP都要求開放的位置授權(quán)舉例:
知道你什么時間位于哪個范圍活動后,通過簡單的算法分析,就能推斷出你的住址和工作地址——如果你夜里12點到早上8點都停留在一個地方?jīng)]動,那這兒十有八九是你的家。
如果再綜合比對你的鄰居們和同事們的位置數(shù)據(jù),知道和你有交集的人平時都在哪些消費水平的地段活動,就能輕松為你的消費能力劃分等級。
從要求開放位置權(quán)限到獲得用戶的消費能力信息
同樣的道理,開放讀取短信授權(quán),意味著APP可以讀取你所有的信息往來,其中可能包括銀行發(fā)給你的交易明細(xì)記錄、你常消費的商家發(fā)給你的節(jié)假日問候、你出行預(yù)定機票酒店的確認(rèn)信息。
從開放短信授權(quán)到獲取用戶全方位信息
還有更讓人意想不到的是Uber經(jīng)濟研究主管Keith Chen在美國國家公共電臺(NPR)做節(jié)目時曾經(jīng)講過一個案例:讀取手機電量對APP來說也是一項很有用的數(shù)據(jù)。在手機電量即將耗盡時,用戶愿意承受高達(dá)9.9倍的動態(tài)溢價。但他也強調(diào),Uber不會這么做。這背后的心理原理很簡單:手機沒電的人等不了,如果是著急要去一個地方,花多少錢都在所不惜。
隨著科技發(fā)展給人們提供越來越多的便利,“隱私”的概念也不僅僅是身份證號、電話號碼這樣的固定信息。那些你以為不太重要的數(shù)據(jù),都在不經(jīng)意間泄露著你的習(xí)慣。
知乎大V李小粥是國內(nèi)某家互聯(lián)網(wǎng)公司總部的高級產(chǎn)品經(jīng)理,工作讓他對大數(shù)據(jù)隱私產(chǎn)生了比普通人更敏銳的警覺:“現(xiàn)在大家對隱私的意識還是偏保守的,事實上有些場景下人工智能對人的監(jiān)控,并不需要人的主動輸入。比如你用可穿戴設(shè)備,它記錄你的體重、心律、體溫,由此給你推銷一些對應(yīng)的保險,這算不算泄露隱私呢?再比如,如果將來有一款類似于Google Glass的眼鏡產(chǎn)品,獲得你的授權(quán)可以讀取你的虹膜,你路過一個櫥窗對哪個產(chǎn)品多看了一眼,它就推送相關(guān)的產(chǎn)品廣告給你,這算不算泄露隱私呢?”
事實上,早已經(jīng)有公司應(yīng)用了他所擔(dān)憂的技術(shù)。
2014年,美國一家醫(yī)療公司會利用大數(shù)據(jù)推斷病人的發(fā)病幾率。比如一個哮喘病人,醫(yī)院可以通過監(jiān)測他是否購買過香煙、是否居住在高濃度花粉地區(qū)來判斷急救率。再比如可以綜合一個人在健身房鍛煉和購買食品的記錄,推斷他突發(fā)心臟病的概率。而這些數(shù)據(jù)都是醫(yī)院從相關(guān)的網(wǎng)站或者應(yīng)用購買來的。
最近,亞馬遜申請了兩項關(guān)于手環(huán)的專利,能夠根據(jù)手環(huán)的運動軌跡,追蹤倉庫工人的手部動作。如果發(fā)現(xiàn)工人的雙手出現(xiàn)在非工作區(qū)域,或者不是工作應(yīng)有的活動頻率,可以用震動給他們發(fā)出警告……
在龐大的數(shù)據(jù)面前,人類越來越像一個提供輸入的變量角色,任何試圖偽裝和保護(hù)自己的舉動,在360度無死角的數(shù)據(jù)監(jiān)控下都顯得徒勞。
美國技術(shù)博客Gizmodo去年曾經(jīng)采訪過一個叫Leila的性工作者。為了保護(hù)自己的人身安全,她注冊Facebook時使用了和客戶聯(lián)系時完全不同的郵箱、電話,也從不在社交網(wǎng)絡(luò)上發(fā)布和現(xiàn)實身份相關(guān)的內(nèi)容。但有一天,她在Facebook“可能認(rèn)識的好友”推薦欄里發(fā)現(xiàn)了自己現(xiàn)實中的客戶。
事實上,Leila自以為精妙的偽裝在技術(shù)面前非常不堪一擊——Facebook會識別用戶的設(shè)備ID和上網(wǎng)IP來判斷你的身份。盡管注冊了不同的賬號,但只要用同一部手機上網(wǎng),就有可能被它判斷為屬于同一個人。
而當(dāng)大數(shù)據(jù)對用戶擁有充分的了解,多花錢只是大數(shù)據(jù)應(yīng)用中對受眾傷害最小的“坑”。
扎克伯格最近遇到的信任危機就應(yīng)證了這一點。他親自承認(rèn)Facebook未能及時防范“假新聞”和“仇恨言論”散播、“用戶隱私數(shù)據(jù)”遭竊用、外國勢力利用平臺“干預(yù)”2016年總統(tǒng)選舉,并為此道歉。
在一篇叫《人民不再相信科技公司了》的評論文章中,科技媒體品玩的創(chuàng)始人駱軼航把社交網(wǎng)絡(luò)用戶這種在不知不覺的情況下被利用的感覺形容為:“被數(shù)據(jù)奴役了思維的恥辱感和不安感”。
灰色的不同意
“大數(shù)據(jù)殺熟”的全民討論過后,公眾對隱私保護(hù)的戒心越來越強烈,但互聯(lián)網(wǎng)公司們肆意處置用戶信息的案例依然層出不窮。
如果你的朋友下載注冊了探探,并給它授權(quán)了讀取通訊錄權(quán)限,你大概率會收到一條類似這樣的推廣短信:“你的一位手機聯(lián)系人在探探上將你設(shè)置為暗戀對象……”等你興沖沖下載注冊了,才發(fā)現(xiàn)一切都是套路。
職場社交APP脈脈曾經(jīng)被昔日的合作伙伴微博起訴,理由是“非法抓取使用新浪微博用戶信息”。如果用戶通過新浪微博的賬號登錄脈脈,那么脈脈會把你通訊錄里的聯(lián)系人和微博好友做信息比對,識別他們的身份,即便你的朋友并沒有注冊和使用脈脈,他們也會被實名列舉在你的“一度人脈”列表中。
最近,知乎用戶打開APP,都會收到一份《用戶隱私協(xié)議》彈窗,最后一條寫道:“您使用或者繼續(xù)使用我們的服務(wù),即意味著同意我們按照本《隱私政策》收集、使用、存儲、共享、轉(zhuǎn)讓和公開披露您的相關(guān)信息。”
其中“轉(zhuǎn)讓”和“公開披露”兩個詞格外刺眼。在前文的細(xì)則條款中,知乎列舉的會被收集的用戶隱私包括:姓名、性別、照片、身份證號、電話號碼、位置信息等等。如果點了同意,就意味著授權(quán)知乎處置這些敏感信息。
這份協(xié)議下方雖然設(shè)置了同意和不同意兩個按鈕,但不同意的按鈕是灰色的。如果用戶點擊同意,則會彈出一個說明,告知“我們將按照業(yè)界成熟的安全標(biāo)準(zhǔn),采取相應(yīng)的安全保護(hù)措施來保護(hù)您的個人信息。”至于業(yè)界標(biāo)準(zhǔn)是什么,沒有再做進(jìn)一步解釋。用戶只能選同意,否則就不能再使用知乎APP。
前不久,百度總裁李彥宏在中國發(fā)展高層論壇上說,“我想中國人可以更加開放,對隱私問題沒有那么敏感,如果他們愿意用隱私交換便捷性,很多情況下他們是愿意的,那我們就可以用數(shù)據(jù)做一些事情。”
雖然這話不那么順耳,但我們都清楚,這是實話。
前百度人工智能首席科學(xué)家吳恩達(dá)就曾經(jīng)公開說,大公司的產(chǎn)品常常不是為了收入而做,而是為了用戶的數(shù)據(jù)而做,在某一個產(chǎn)品上收集的數(shù)據(jù),會用于在另一個產(chǎn)品上獲利。這也就解釋了為什么哪怕是一個手電筒APP,在安裝時也需要用戶同意包括讀取位置信息、通訊錄在內(nèi)的幾十項權(quán)限授權(quán)。
《南方日報》曾經(jīng)對個人信息黑市做過相關(guān)調(diào)查,發(fā)現(xiàn)越來越多APP收集到的精準(zhǔn)數(shù)據(jù)成為“黑產(chǎn)”鏈條的源頭:“這種高精度的個人信息被用在網(wǎng)絡(luò)詐騙等方面時,會讓受害者難以辨識,更容易中招。”
也就是說,當(dāng)產(chǎn)品和服務(wù)是免費的,你,具象地說是你的個人信息,就是商品本身。大數(shù)據(jù)時代,我們每個人都在被幾十到幾百個變量定義,它甚至比你更了解自己。無孔不入的信息搜集中,我們是透明人。
文章為每日人物原創(chuàng)侵權(quán)必究