大數據背後,是誰在監視我們的生活?
2018年06月19日09:22

  一個AndroidApp開發者曾經試圖跟女朋友解釋自己近乎無所不能的工作:在App安裝後,他能夠獲得大量授權,推斷數據里的人群做什麼工作、常去哪裡、畢業於什麼學校、有什麼愛好、有沒有結婚、有沒有外遇、有沒有房、有沒有車、現在是外出渡假還是在家待著,甚至通過讀取銀行通知短信,推測實際收入。有時候為了客戶需要,他還得推測人心,排除偽君子,比如如果手機里下載高端財經App,打開頻率卻幾乎為零,那麼這個人的標籤要麼是不小心下錯了軟件,要麼就是‘比較裝’

  來源:人物  

  文丨李斐然

  編輯丨趙涵漠

  我們的故事

  北京城里有許多故事不為人所知,一個最容易被人忽視的真相是,在這裏,總有人比你更瞭解自己。週一早高峰時間擠在地鐵里刷財經新聞的一些人,會在週五下班路上收到系統為他們推送的八卦新聞,因為算法知道這是他們此刻最想看到的內容。做人臉識別的公司知道我們每天晚上什麼時間卸妝,什麼時候敷面膜,週末早上賴床到幾點,因為在這些時候,人臉識別通過率會驟然變低。

  在真實世界里,性別只分男和女,但是原阿里巴巴集團副總裁車品覺說,阿里巴巴曾經就有18個性別標籤,它知道有些賬號白天是男性用戶持有,而晚上使用的卻是女性。判斷依據是用戶資料、瀏覽商品類目、對話使用稱謂,以及那些我們自己或許都未曾察覺的訪問習慣――點擊屏幕的輕重,經常輸錯的錯別字,在瀏覽器窗口是喜歡在新窗口打開、還是反複使用前進後退鍵,正是它們告訴機器,此刻對著屏幕滑動商品頁面的究竟是誰。

  大數據里的我們,擁有異常真實的群體畫像。因為我們在面對手機的時候非常誠實,永遠對它說真話。

  世界上知道這些秘密的只有你,和機器另一端的數據科學家。在機器語言里,我們不止是一個名字、一個地址、一串設備識別符。它每秒鍾監測超過400個變量,記錄每一個行為軌跡。

  今年57歲的韋思岸(AndreasWeigend)知道無數這樣的故事。他出生在德國,原本在赫赫有名的歐洲粒子物理研究所(CERN)研究上帝粒子,但在2002年,他選擇投身大數據世界,成為了亞馬遜首席科學家,後來他曾任阿里巴巴數據顧問、人人網早期外部投資人,也曾為摩根大通、湯森路透、沃爾瑪、AT&T等機構提供數據諮詢。

  他教會機器一個理解人類的方法是:獲知一個用戶地址後,還要抓取這個地址周圍5公里內的書店分佈狀況,因為這決定了用戶有多大概率在亞馬遜買書、會在什麼情況下買書。這條準則後來被應用到了阿里巴巴的數據分析實踐,所以當淘寶知道你家5分鍾步行路程內有超市的時候,它就不會頻繁向你推薦油鹽醬醋,但是它看到你的搜索記錄,獲知你皮膚敏感,而15分鍾路程內的商場都沒有你習慣用的護膚品,那麼,這些商品將會出現在你的屏幕上。

  韋思岸將數據分析師每天的工作形容為‘人性實驗’,就像科學家通過實驗探索物質的本質,數據分析師通過程式研究人的行為特徵。技術改變了人的物理概念。定義我們的不僅僅是賬戶和密碼,還有我們的愛好、情緒、行為習慣。不管我們在互聯網上如何偽裝,換新的名字、新的頭像,機器總能輕易識破。數據記錄下的習慣,是我們的另一個身份定義。

  這些故事讓他興奮,同時讓他感到不安,韋思岸告訴《人物》,‘我能看到最近十幾年我們的生活因為技術發生了顛覆性變革。但是它真的讓我們變得更自在嗎?我沒有答案。’

  在數據的世界里,我們面對手機的每一個舉動,都在成為機器學習的材料,訓練人工智能更加理解人性。曾經那些高深玄奧的人生命題――我們是誰?好朋友意味著什麼?我們將會選擇什麼樣的生活――這些答案都可以從搜索記錄、社交網絡的聊天記錄和手機傳感器里找到。

  截止2018年第一季度,超過10億人每月使用微信及WeChat,6.17億人在淘寶購物,全國搜索引擎用戶達6.4億,他們時刻創造新的海量數據,也在被勾畫著異常精準的群體畫像,機器在一步步接近一張清晰的人性圖景。數據是這個時代最特別的商品,它的產生幾乎毫無成本,卻造就了無數科技獨角獸、日漸強大的上市公司,以及數以億計的產業利益。

  大數據日漸瞭解我們,但是很少人知道,我們所做的事情會讓我們成為廣告主的商品、被人剖析個性的樣本、掌握我們的一舉一動,甚至能預測我們的未來軌跡。

  ‘隱私’

  不止一位數據科學家確信,隱私已經是一件‘算法上不成立’的事件。我們知道自己在分享數據,但是大部分人並不知道,自己正在分享些什麼,更不知道,這種分享將會意味著什麼。

  聽一個分析師講述數據挖掘過程,就像是見證了一場懸疑推理,唯獨這一次,福爾摩斯活在大數據里。一切從手機App安裝軟件中的SDK開始,這是一個搭載在App中的軟件開發工具包,其中嵌入了統計分析工具,實時收集用戶信息。當然,這是經過你授權同意的,就在你可能從來沒有認真讀完的用戶協議里。

  從App下載到手機那一刻起,揣測人生的嚐試就開始了。僅僅是安裝過程中所抓取的硬件設備信息,App已經對你有了一個大概印象――如果一台手機一個月內有10次連接同一個星巴克的WIFI,20次連接同一個定位在寫字樓的公共區域WIFI,30次連接一個家庭WIFI,再算上這些WIFI的地理位置,以及WIFI名里的關鍵詞,那麼,一條幾近清晰的生活――工作的路線軌跡,get。

  在學者的論文里,這被形容為一個‘數據失控’的時代,沒有人能控製自己的數據,我們的數據時刻被人監視。

  不過,實際經手數據的人並沒有這種感覺。人們擔憂自己的個人信息泄露,比如姓名、電話、地址。在業界,工程師給隱私下過一個最簡單的定義――隱私,就是那些不允許自由流動的數據,比如被法律禁止交易的身份證號、個人徵信、醫療記錄,它們只能固定儲存,不允許隨意讀取。事實上,現在App收集信息也確實越來越受到限製,比如IOS10以後的系統已經禁止讀取許多設備硬件信息,Android系統也在逐步限製軟件能夠獲取的用戶信息範圍。

  不過對公司來說,以上這些信息固然重要,但更值錢的是另一些數據――你的喜好、興趣、生活方式、行為習慣――而這些數據在很多人的概念里,還不屬於隱私。

  ‘大數據能做很多事情,通過合理分析解釋世界。最好的事是,這些東西完全不觸及隱私。’大河在一家公司的數據相關部門工作,她認為,隱私是法律明令禁止收集和交易的身份證號、手機號、戶籍地址等個人身份信息,而她的工作完美避開了它們。‘剛剛分析的這些畫像,我根本不知道他是誰,我看到的只是設備。比如我能看到一個在回龍觀的Android設備,早上9點去瞭望京晚上9點又回來了。他的軌跡我都知道,但是我並不知道他是誰。所以它又能匿名,又很精準。’

  一個不願意署名的數據工程師說,要說有問題,是那些私下倒賣個人身份信息的黑市有問題,20塊錢買一個人的徵信報告,幾百塊錢就能買高淨值人群打包數據,這些跟社會信息相關的是隱私,需要管。但是互聯網公司收集的都是‘淺層信息’,這沒關係。

  小喬曾經在一家以‘大數據分析’為主力業務的互聯網公司工作,她的工作就是利用公司通過大數據得到的用戶畫像,組織線下營銷活動。她說,自己並不那麼擔心習慣被人察覺,因為在她的經曆里,好多都是‘忽悠人用的,又不準,怕什麼’?特別是在北上廣,每個人都那麼不一樣,用戶畫像根本行不通,也就在三四線城市,弄個噱頭忽悠一下人。

  ‘(我們)什麼信息都能得到,但是沒什麼用,也懶得看。’一個不願署名的程式員這樣說,‘互聯網公司讓你感到害怕,只是因為你在App里,沒有掩飾你是什麼樣的人,而App把這些看在眼裡――你不會出櫃,但會偷偷在淘寶上搜索潤滑劑;你不會跟人說葷段子,但App上看到翹臀美女還是會點進去;你對外痛擊侵犯版權,但看到四位數價格的正版軟件,還是去搜了盜版的下載’

  實實在在的人民幣

  對於掌握海量用戶數據的大公司,真實的人性畫像等於錢,因為他們能找到非常精準的目標用戶,比如商家想要賣一款針對5歲以下孩子的推車,他們就可以提供‘家裡有5歲以下孩子、訂單中卻未發生過此類母嬰商品購買行為’的用戶群。他們將海量用戶喜好、興趣、習慣等數據組建成數據庫,這樣向品牌商和廣告主推銷:這些消費者數據也是一種資產,你知道他們習慣買什麼、什麼時候想買,它能如預知未來一樣,直觀看到未來可能收割的營業額,不是某種估計的指標或指數,而是‘實實在在的人民幣’。

  這大概是廣告主最喜歡的時代。Facebook曾推出一項行之有效的算法lookalike。比方說,一家公司想賣啤酒,它只需要提供100個曾經購買過這款酒的用戶群體,數據會將它們視為種子用戶,尋找和種子用戶相似的另外500個人。他們有相似的興趣愛好,相似的行為習慣,他們可能並沒有買過啤酒,但是基於他們的行為特徵相似性,該相似群體極有可能在推送後馬上得到轉化,買下這款啤酒。

  並非所有人都對這些‘隱私’的開放無感。武山在一家行業排名很高的互聯網公司工作,利用大數據進行算法推薦。每天在工作的時候,他能夠看到全體用戶在App上的行為軌跡信息,包括電話、地址、搜索記錄、每一屏交互行為等等。這是他的工作內容,可是他說,這也讓他不安。

  ‘雖然都說數據開放、數據開放,但還是覺得,這些數據真是太開放了,沒有做好保護啊!比如內部員工可以查到用戶在App上的行為習慣啊,還有App收集用戶信息的時候,哪些該收集,哪些不該收集,在我看來也算隱私啊,應該有一些機製保護吧?’武山說,‘可我不知道有沒有行業標準,現在我是全靠自律的。就是如果我想看,我隨便都能看到啊!’

  據《財經》此前的報導,國內個人信息泄露數達55.3億條,平均每個人有四條相關個人信息泄露,這些信息最終在黑市反複倒手,直至被榨乾價值。其中,80%的數據泄露來自企業內鬼,駭客僅占20%。去年6月,廣東蒼南警方發佈通報,有Apple公司國內員工涉嫌以非法手段獲取Apple手機關聯的個人信息,包括用戶註冊Apple賬戶時所填個人信息,涉案22人中有20人在Apple國內直銷公司及Apple外包公司工作,每條以10元到180元不等的價格出售,非法倒賣個人信息至少20多萬條。

  就在不久前,一名Facebook安全工程師被解僱,因為在網上搭訕女性的時候吹噓,自己能夠看到所有人的信息,‘我是一個專業的跟蹤狂’。而一位豆瓣用戶則發文稱,與前男友分手後遭到持續跟蹤騷擾,前男友利用某電商App登錄漏洞,查到了她家人、閨蜜、朋友的姓名、住址、電話,可是即便經過投訴,最終也沒有阻止跟蹤狂的持續登錄。

  現在,買東西需要填個註冊表,或者下載新App後需要關聯用戶信息,都會讓武山不舒服。他說,這可能是他的‘職業病’。

  在互聯網上,韋思岸做過的最瘋狂的人性實驗,是關於自己的。從2006年開始,他主動將自己所有聯繫信息公佈在自己的網站上。在那裡,任何人都可以看到他的實時地址、電話、郵箱、行程、工作日程、即將搭乘的航班號及座位號。他公佈了自己在舊金山和上海的住址,精確到樓層房間號。

  這和他的父親的經曆有關。韋思岸的父親因為被誣陷是間諜,曾被強行關進監獄,坐了六年牢。後來,韋思岸查閱父親的個人檔案時,意外地發現,即便父親出獄後,安全部還在持續監視他,還給身為兒子的自己建了檔案,收集信息。

  這個經曆極大影響了他的數據觀,‘我們不能抱著一個天真浪漫的觀點,還以為我們能夠擁有隱私。我見過數據是怎麼對待我的父親的,我的父母曾經一度一無所有,我們不應該天真地以為,一切不會再重現。’

  ‘我把聯繫方式放在網上,可要是讓我公佈我的搜索記錄,我絕對不願意。’他說,某種程度上來說,電話號或者住址並不是私密信息,你的朋友知道,你的同事也可能知道,但搜索記錄中所透露出的個人喜好、習慣,則是非常私密的個人信息。

  一個AndroidApp開發者曾經試圖跟女朋友解釋自己近乎無所不能的工作:在App安裝後,他能夠獲得大量授權,推斷數據里的人群做什麼工作、常去哪裡、畢業於什麼學校、有什麼愛好、有沒有結婚、有沒有外遇、有沒有房、有沒有車、現在是外出渡假還是在家呆著,甚至通過讀取銀行通知短信,推測實際收入。有時候為了客戶需要,他還得推測人心,排除偽君子,比如如果手機里下載高端財經App,打開頻率卻幾乎為零,那麼這個人的標籤要麼是不小心下錯了軟件,要麼就是‘比較裝’

  這些推測並不完全準確,也沒有涉及身份信息,卻已經讓身為普通用戶的女朋友感到冒犯,衝他大發脾氣:‘你這人怎麼這樣?你為什麼要看我們這麼多數據啊?誰叫你拿這些授權的?是你老闆逼你這麼幹的嗎?’

  對抗

  在技術的世界里,邊界是最難討論清楚的話題。大部分公司都在反複強調,我們雖然收集大量數據,但是十分重視隱私,絕對不會泄露你的名字。事實上,許多大公司的確是這樣做的,它們內部有非常嚴格的數據保護措施,比如微信有比較複雜的ID體系,系統內部有用戶的唯一ID標識,但是第三方開發者不能獲得這個唯一ID,即便是同一個用戶,在不同公眾號下被第三方開發者收集到的ID都是完全不一樣的,這樣就完全阻止公眾號之間用戶數據的隨意買賣交易。

  負責用戶挖掘的微信斑馬系統只支援一萬人以上的人群畫像分析,從而實現‘分析一群人而不分析一個人’,而在分析過程中也會主動控製精度,比如分析用戶住址時,只定位到小區,不再基於氣壓傳感器定位高度,做樓棟和樓層的定位。

  在一次媒體採訪會上,阿里巴巴的一個技術負責人說:‘數據肯定是往越來越嚴控的方向發展,我們採集信息的目的,其實還是為了更好地提升用戶體驗,所以一個基本原則是,這些信息的獲取要從提升產品的角度出發。’比如對有的App來說,獲取WIFI信息是為了挖掘用戶社交關係,這讓人感覺越界,但是對金融、支付類的App來說,知道WIFI地址可以快速判斷這是不是用戶常用地址,這筆交易有沒有可能是盜刷,它能有效防範資金風險。

  不過,雖然花了兩個小時反複解釋現有隱私保護如何嚴格,臨走的時候,他還是忍不住補了一句:‘不過啊,最近網上那種做個心理測試啊,點進圖片生成自己的照片啊那種,我勸大家還是不要點了,那種背後一般都存在很大的信息收集的。’

  這種看似無害的休閑App可能不會直接竊取手機號、身份證號等身份信息,但就在點擊授權、進入遊戲的那一瞬間,它很容易完全獲得你的社交關係和網絡行為習慣。今年3月份,Facebook被爆隱私醜聞,存在影響8700萬人的嚴重數據隱私濫用,這些數據包括用戶的社交關係、興趣偏好、點讚記錄等個人信息,而這一切就是從類似的心理測試開始的。劍橋分析公司通過左右這些用戶在Facebook收到的推送,影響他們在美國大選中對候選人的態度,最終幫助特朗普當選,這些數據也‘不知道被複製了多少次’,甚至有可能存儲在俄羅斯。

  並不是沒有技術辦法對抗這樣的數據危機。在英國,有專門保護個人隱私的公共機構,直接向英國國會報告。它提出了數據管理者登記製度,要求每個處理個人信息的機構都要在信息專員辦公室登記,否則就算為刑事犯罪。很多公司也有謹慎的數據使用哲學。Google會把用戶的姓名、賬號、聯繫方式、地址等信息,與行為數據完全分開,不會將兩者關聯使用。而雅虎會有專門的研究員,在實踐中界定數據蒐集的隱私邊界。

  許多數據科學家將自己設計的隱私保護對策詳細公佈在論文中,有人將分散信息流控製和差分隱私保護技術應用到雲計算,還有人通過模糊處理(obfuscation)技術對用戶隱私全程加密,另一種有效的操作方法是製造噪聲,根據用戶歷史記錄製造等比例的行為噪音,這樣試圖解讀用戶行為的服務商就很難辨別哪個是用戶真實需求,哪個是系統製造的噪音,從而保護用戶真實的隱私。

  但是,在真實的大數據前線,還輪不上這些對策上場,仗已經敗了。技術理想的敵人其實比想像中更原始――嚴謹規則背後,不講規則的人。

  程路從美國留學回來後,在國內一家交友類社交平台工作,負責大數據處理。運營的同事要做市場推廣活動,要看用戶數據,他想看用戶最近在聊什麼,然後根據用戶喜好有針對性地開展活動。‘理論上講,這也是業務需求,他想抽樣,我也不介意。’程路說,聊天記錄經過加密處理,他很快做了抽樣,斷裂可追溯信息,對用戶信息做了脫敏。但是運營同事不願意,他要求看全量數據。

  全量數據是什麼概念?它是一個用戶在App上的所有數據,能夠非常精準地描述用戶,他的身份背景、興趣愛好、行為習慣,甚至每天的喜怒哀樂,都能從行為痕跡里推測出來,但是這是對隱私的極大挑戰。程路試著跟對方解釋,只是做市場推廣的話,使用脫敏後的抽樣樣本就可以了,沒有必要查看全量數據。

  但意外的是,這個提議沒有得到理解。運營的人不同意,公司CTO不同意,連CEO也不同意。他的一個同行說,‘我挺驚訝的,做這一行的還有這種想法。’而另一個同行評價他,‘心態這麼不穩,怎麼在中國生活?如果知道自己的房子、車子、保險、信用卡、婚戀、酒店入住、戶籍信息、工作信息等等全部真實的信息每天都在各個公司的銷售那裡買賣轉手百來次,你還會有什麼感想?毫無心理波動。’

  可是,這對程路來說,違背了自己的技術理想。‘這就好像藉著你的手,把別人的日記挨頁翻給人看一樣。’他反問,‘要是你的日記,你願意嗎?’

  最後,決定數據命運的是來自CEO輕描淡寫的評論,‘這有什麼啊,你就給他唄!’

  程路把全量數據給了業務部門,同一個禮拜,他辭職了,‘一半的原因是這件事吧,道不同了。’在這裏,他還時不時要面對數據交易,會有大公司的銷售人員拿著報價表找他談合作,表單上每一類用戶群體都有一個大概標價,愛旅遊的、每天點外賣的、打遊戲時長每天超過4小時的,每一個群體都有一批相對應的廣告主喜歡。所以,只要細化出了用戶特徵,就能有機會把它賣錢,這是一筆大生意,但這讓他感到很不舒服。

  現在,他在一家外資遊戲公司,選擇新工作有很多理由,其中一個考慮,現在的大環境里很難找到一個不越界的公司,那就找個沒那麼強烈想要收集社交數據的地方。他說,這樣工作起來心裡會舒服點。

  韋思岸說,對抗隱私危機,最有效的辦法只有嚴懲。‘我們不能天真地期待數據公司能夠有足夠的自我驅動力,替我們維護數據中的隱私部分。對這些公司而言,懲罰是它們唯一聽得懂的語言。’

  數據未來

  我們正在面對的數據未來是,人或許比想像中更容易預測,而算法可能比我們更瞭解世界。

  2008年9月15日,美國雷曼兄弟公司宣告破產,引發次貸危機,而最早察覺到這件事的是Linkedin的數據科學家。他們注意到,9月14日明明是一個週末,網站數據卻十分活躍,不斷有人瘋狂聯繫工作、更新簡曆、發送消息,而所有這些行為都來自雷曼兄弟的員工。

  隨著技術優化,現在甚至不需要成為專業人士,就能洞察真相。就在今年初,使用健身記錄軟件Strava的用戶發現,仔細查看App所提供的跑步熱力圖,能輕易推測出美軍駐阿富汗軍事基地的具體位置。因為它會實時追蹤用戶位置數據,以高亮形式呈現在地圖上,而在當地用戶很少的戰亂地區,每天集體跑步的美國士兵在熱力圖上圈出了異常明顯的行動路線,基地位置、出勤時間、巡邏路線在圖上一目瞭然。

  2012年,美國羅徹斯特大學教授亞當・薩迪克(Adam Sadilek)和微軟實驗室的工程師約翰・克拉姆(John Krumm)共同發佈了他們的研究,‘如今已有大量研究能夠預測人的未來行程,比較典型的是可以預測一小時以後,人會去哪兒。’他們的論文這樣寫道,‘相反,我們著手解決的是更開放的難題――預測數月甚至數年後,人們會在哪兒。’

  他們收集了32000天里307個人和396輛車的GPS數據,構建模型,準確度高達80%。在他們的描述里,未來的營銷廣告甚至可以精確成這樣:‘需要理髮嗎?4天后,你將會出現在這家美髮廳附近,到時候可以獲得5美元的折扣。’

  大河說,有次數據團隊私下聊天,聊著聊著突然有人問,一個人活一輩子,是不是也能用大數據分析出來?

  結果,幾個人嘻嘻哈哈地開始推演,很快把自己嚇到了。在理想狀態下,一個人從生到死的每一個階段,還真有可能預測出來――出生在哪裡,家庭背景什麼樣,父母收入水平怎麼樣,小時候的性格行為習慣,結合當地教育水平指數,再算上從新聞中提取的實時經濟波動曲線等等,很多以為是意外的東西,更多時候只是一種計算概率。

  討論到最後,有人嚷嚷,那活著還有什麼意思啊?鬧了半天,活著就是一個數學概率問題啊?

  事實上,這是一部分數據科學家的願望。他們希望打通每個環節的數據,獲得全域大數據,開啟‘上帝視角’,最大限度挖掘數據。在樂觀者的描述里,那會是一個奇妙的世界,機器會基於大數據替我們選擇最划算的商品、最合適的醫生、最好的路徑,以後也不再會有交通堵塞,每個人的運行軌跡會實時調整配置,一路綠燈

  但是,也會遇到另一種可能:你的健康數據顯示你的膽固醇過高,需要鍛鍊,節製飲食,可是你的購物車里下單了油炸食品,簽收人是你本人,運動傳感器顯示,你沒去跑步,還是窩在沙發上看電視劇,因此,潛在招聘官判定你的性格含有‘意誌薄弱’的標籤,打算拒絕你的求職申請。

  這是一家大公司技術負責人曾經面對的一個真實的選擇。在他的故事里,數據研究者找到他,希望他打通數據,利用用戶的購物數據輔助招聘決策。但是那一次,他選擇了放棄。一大理由是跨度太大,準確率無法保證,另一個理由是,這樣做讓他多少感到倫理越界,‘大數據亦有所不為’。

  在大數據的世界里,依然有人相信,世界上總有數據沒有辦法解釋的那部分人性。韋思岸說,他依然更相信Serendipity,機緣巧合。‘我不想被定位、細分、轉化、分析,我可不想成為一個被大數據模型定義的人。’

  儘管早已不是一名物理學家,但是他依然篤信許多物理學法則,比如能量守恒、關係反轉。大數據最美好的部分,不是最終發現了揭示人性的完美模型,而是不斷探索人性的過程。

  他說,技術最美妙之處,就在於它能夠提供無數的可能性。技術挖掘用戶數據,讓人感受到越界,但同樣地,它也能用來曝光那些封閉信息的官僚機構和組織,用技術的方式打破他們的掩飾,讓數據完全透明,為公眾所用。現在的關鍵,是展開公開的討論,找到這條邊界。

  無論如何,我們依然生活在這個數字化包圍的世界,不願意放手。統計顯示,人們平均每天要在手機屏幕上滑動2617次,在睡不著覺的晚上,23%的受訪者會抱著手機睡覺,而其中的3%則強調,自己必須要天天握著手機,才能入睡。

  光纖傳回數據的時候沒有聲音,它不會提醒你,這裏正在發生什麼。在更好的規則到來前,大數據世界將依然是一個沒有警笛的沉默戰場。就像是這座城市里被忽視的週五晚高峰地鐵上的八卦、沒有打開的高端財經App、被印在報價表上的個人喜好,還有那些為了它苦惱、爭吵、麻木、抗爭的人類故事一樣,它們只存在在一串字符與另一串字符的連接中,極少為人們所知。

  (本文部分數據來源CNNIC、Quest Mobile、TalkingData、友盟、尼爾森、國家統計局等公開數據及上市公司公開年報,尤榕萍、萬雨可、姚胤米對此文亦有貢獻,文中提及的中國數據工作者均為匿名)

關注我們Facebook專頁
    相關新聞
      更多瀏覽