【尾聲】挑戰中國:摘下“差不多先生”的文化標簽 涂子沛
“而最大的毛病,則是西歐和日本都已以商業組織的精神一切按實情主持國政的時候,中國仍然是億萬軍民不能在數目字上管理。……一旦某一個國家能在數目字上管理,到底使用何種數字,尚可以隨時商酌,大體上以技術上的要求作主,不必籠統的以意識形態為依歸了。”
——黃仁宇(1918—2000),美籍華裔歷史學家,1991年
在論述完大數據時代的趨勢以及這個時代給個人、企業和社會帶來的諸多挑戰之后,本書應該可以畫上句號了。但在結束之前,作為一名中國人,還是按捺不住,要絮叨幾句我們中國在這個大時代當中所處的位置。
數據表明,今天的中國,是一個人口大國、互聯網大國、手機大國,但卻恰恰還不是一個數據大國。2011年,麥肯錫公司以2010年度各國新增的存儲器為基準,對全世界大數據的分布作了一個研究和統計,中國2010年新增的數據量約為250拍,不及日本的400拍、歐洲的2000拍,和美國的3500拍相比,更是連十分之一都不到。
和美國相比,中國擁有數據量的絕對值較小,這在情理當中。本書第三章曾談到,美國的聯邦政府,是一個數據帝國,它的數據主要有三個來源,一是業務管理的數據,二是民意社情的數據,三是物理環境的數據。這三種數據的積累,并不是一蹴而就的,在其漫長的發展過程中,有其重要的里程碑,例如1940年羅斯福引進的民意調查、1962年啟動的海浪監測計劃和1973年誕生的最小數據集。
而中國類似進步的取得,都是進入21世紀之后才發生的事情。2003年,中國開始著手制定醫療系統的最小數據集,3年之后,中國衛生部出臺了第一版中國醫院最小數據集的標準。也是在2003年,中國創立了第一個全國性的大型社會調查項目,開始對社會的發展和變遷進行全方位、綜合性、縱貫性的問卷訪談調查。這個調查叫做“中國綜合社會調查”,是由中國人民大學發起的,中國人民大學隨后還按照國際標準成立了“中國社會調查開放數據庫”,向全社會開放調查的結果和數據。2006年9月,在幾經周折之后,國家統計局正式成立了社情民意調查中心,這是中央政府第一個、也是目前唯一一個專司社情民意調查的單位;至于對物理環境數據的采集,更是2010年前后才見到若干零星的報道。
因此,從歷史發展的角度來看,中國擁有的數據量較小,可以理解;但另一方面,立足現實,中國的人口、互聯網的用戶、手機的持有量都位居全世界第一,2010年全年新增的數據量卻尚不及美國的十分之一,也大大出人意料。
2011年,中國擁有4.8億的互聯網用戶,幾乎是美國的兩倍;擁有近9億部手機,是美國的3倍;ヂ摼W和手機,都是產生數據的重要來源。在中國,存儲器的價格也已經和國際接軌、相對便宜。在認真考察了這些因素之后,就不難發現,中國缺乏的不是可供收集的數據,也不是收集數據的手段,而是收集數據的意識。
中國人數據意識的淡薄,由來已久,甚至可以稱之為國民性的一部分。
19世紀中葉,中國的大門被西方的堅船利炮打開。由于科學落后、文化封閉,此后的百多年來,中國人飽受屈辱。在落后、挨打的痛苦掙扎中,中國人開始慢慢睜眼看世界,反省自己與西方的差距,在這個過程當中,也有思想先賢對國民“數據意識”方面的問題進行反省、批判和鞭笞。
中國近現代著名的思想家胡適就對中國人“凡事差不多、凡事只講大致如此”的習慣和作風深感憂慮。1919年,他寫下著名的《差不多先生傳》,活靈活現地白描了中國人取道中庸、不肯認真、甘于糊涂、拒絕精準的庸碌形象:
你知道中國最有名的人是誰?
提起此人,人人皆曉,處處聞名。他姓差,名不多,是各省各縣各村人氏。你一定見過他,一定聽過別人談起他。差不多先生的名字天天掛在大家的口頭,因為他是中國全國人的代表。
差不多先生的相貌和你和我都差不多。他有一雙眼睛,但看的不很清楚;有兩只耳朵,但聽的不很分明;有鼻子和嘴,但他對于氣味和口味都不很講究。他的腦子也不小,但他的記性卻不很精明,他的思想也不很細密。
他常常說:“凡事只要差不多,就好了。何必太精明呢?”
……
后來他在一個錢鋪里做伙計;他也會寫,也會算,只是總不會精細。十字常常寫成千字,千字常常寫成十字。掌柜的生氣了,常常罵他。他只是笑嘻嘻地賠小心道:“千字比十字只多一小撇,不是差不多嗎?”
有一天,他為了一件要緊的事,要搭火車到上海去。他從從容容地走到火車站,遲了兩分鐘,火車已開走了。他白瞪著眼,望著遠遠的火車上的煤煙,搖搖頭道:“只好明天再走了,今天走同明天走,也還差不多?墒腔疖嚬疚疵馓J真了。八點三十分開,同八點三十二分開,不是差不多嗎?”他一面說,一面慢慢地走回家,心里總不明白為什么火車不肯等他兩分鐘。
……
他死后,大家都很稱贊差不多先生樣樣事情看得破,想得通;大家都說他一生不肯認真,不肯算賬,不肯計較,真是一位有德行的人。于是大家給他取個死后的法號,叫他做圓通大師。
他的名譽越傳越遠,越久越大。無數無數的人都學他的榜樣。于是人人都成了一個差不多先生。——然而中國從此就成為一個懶人國了。
黃仁宇,是著名的華人歷史學家,他參加過抗日戰爭,后來在美國學習、研究、深造,成為學貫中西的一代大家。他在晚年時發表了一系列的著作探討中西方社會的異同。他認為:
“資本主義社會,是一種現代化的社會,它能夠將整個的社會以數目字管理(MathematicallyManagement)。”
數目字管理,即以事實為基礎、以數據為核心的精確管理。
黃仁宇總結說:“中國過去百多年來的動亂,并不是所謂道德不良,人心不古,也不是全部軍人專橫,政客搗亂,人民流離”,而是因為中國未能像西方那樣實行“數目字管理”的現代治國手段。他還認為:“一旦某個國家能在數目字上管理,到底使用何種數字,尚可以隨時商酌,大體上以技術上的要求作主,不必籠統的以意識形態為依歸了。”
一句話:中國的落后,根源之一正是缺乏以數據為基礎的精確管理;而未來中國的進步,也有賴于建立這種精確的管理體系。
除了中國人自己思想家的反省和批評,西方世界對我們中國人漠視數據的特點也洞若觀火。
阿瑟·史密斯(ArthurSmith)是一位美國的傳教士,他于1872年來到中國,在中國的普通社區生活了54年,隨后著書立說,成為名動一時的中國文化研究專家。1894年,史密斯出版了《中國人的性格》一書,該書在中國社會、國際社區都產生過很大的影響,一度被公認為研究中國人最權威、最詳盡的著作之一,被翻譯成很多個國家的文字。
史密斯認為,中國人,是一個“漠視精確、思維含混”的民族,他在書中寫道:
“中國人完全能夠像其他民族一樣學會對一切事物都非常精確——甚至更加精確,因為他們有無限的耐心——但我們必須指出的是,他們目前還不重視精確,他們還不知道精確是什么。如果這一看法是正確的,那么就可以有兩條推論:其一,在我們考查中國歷史檔案時,必須考慮到中國人漠視精確這一特性。我們采用中國人所提供的數字和數量很容易使我們自己受騙,因為他們從來就不想精確。其二,對于中國人所提供的冠以‘統計數字’以抬高其權威性的各種材料,必須留有很大的余地。”(《中國人的性格·漠視精確》)
作為一名留學生,長期在美國學習、工作和生活,我也深感到,和美國人相比,中國人確實缺乏“用數據來說話”的素養。中國的語言表達方式中“重定性、輕定量”的特點非常明顯,口語中經常使用“大概”、“差不多”、“少許”、“若干”、“一些”等等高度模糊的詞語。我身邊的一位攻讀博士學位的朋友,曾經給一位美國教授提供過一份中國菜的烹調方法,但其中關于“鹽少許”、“酒若干”、“醋一勺”的提法,令這位美國教授抓耳撓腮、不知所措。我事后自問,也確實感到這種提法,完全是跟著感覺走,讓人無從下手。此外,和美國數據資源的豐富、開放相比,不少中國留學生對于國內的數據匱乏有切膚之痛。寫論文、做研究,如果能選一個自己熟悉的中國話題,于國于己,都更有意義?蛇x的話題不少,但常常因為一數難求,多數選題都逃不出夭折的命運!有些數據國內確實沒有,有待收集;還有些數據水分太大,經不起推敲和檢驗;再有的,被有關部門貼上了“機密”的標簽,平民百姓無緣相見。
黃仁宇還對中國人缺乏“數據精神”的根源做了剖析,他認為:在中國傳統的學問——理學或道學當中,一直都分不清倫理之“理”與物理之“理”的區別。這兩個“理”混沌不分的結果,是中國人傾向于粗略的主觀定性、排斥精確的客觀定量,從而養成了重形象、重概括、輕邏輯、輕數據的文化習慣。這種文化習慣,使中國人長期沉浸在含蓄、模糊的審美意識當中,凡事只能在美術化的角度來印證,滿足于基于相似的“模糊聯想”,止步于用邏輯來分析、用數據來證明,最終將表象上的相似,當做本質上的相同。
但歐洲在中世紀之后,就將“倫理之理”與“物理之理”這兩個“理”劃分得很清楚了。
黃仁宇的看法,并不是一家之言,F代著名思想家漢娜·阿倫特(HannahArendt)也曾經對比過中國人和西方人在思維方法上的不同。她的結論是:西方人是“詞語思維”,中國人則是“形象思維”,而形象思維不是一種基于邏輯的推理性思維。
歸根到底,中國人對數據的漠視,緣于一種文化上的缺欠:隨意、盲目、不求甚解、理性不足。
因為這種文化上的不足,科學最終在西方國家起源,當然不足為奇,中國人100多年來只能跟在別人身后亦步亦趨,也是應得的命運。
除了數據的收集和使用,中國在大數據時代需要面對的挑戰,還有數據的開放。
如果說收集數據是一種意識,使用數據是一種文化、一種習慣,那是否開放數據則是一種態度。
正如本書前文所描述的,互聯網上的數據開放,其開放的對象不僅僅是一個國家的人民,而是全世界的人民。這種開放,是無法阻擋的。中國人,只要愿意,就可以登陸其他國家的開放網站,下載他們的公共數據,分析他們的財政開支細目,考察他們的房屋交易價格,甚至參與他們對公共事務、社會事務的批評和監督。即使作為外國人,在這個全球化的時代,中國人也可以感受到數據開放給全人類帶來的種種便利和實惠。而這些便利和實惠,正在成為信息時代世界各國一項基本的公民權利。
由于互聯網的發明,“開放”已經成為人類社會一個不可逆轉、不斷加速的社會思潮。如雨果所說:你可以阻擋一支入侵的軍隊,但你無法阻擋一種思想。在這個浩浩蕩蕩、不斷前進的世界大潮當中,我們將發現,中國如果不跟上,我們的處境將會越來越微妙、越來越尷尬、越來越孤立。
收集數據、使用數據、開放數據,都是大數據時代我們中國人需要一一面對的挑戰。
這三大挑戰,沒有一個不是任重道遠。但這些挑戰,也是我們在大數據時代徹底摘掉“差不多先生”文化標簽的重大歷史機遇。如果在這個數據意義凸顯的時代,我們還抓不住這些歷史機遇,繼續漠視數據、拒絕精準、故步自封,等待我們的,還將是一個落后的100年。
【大數據就是“老大哥”:中央數據銀行之爭】
“我們有很多小的、獨立的信息記錄系統。這些系統,就單個而言,它們可能無關痛癢,甚至是很有用的、完全合理的。但一旦把它們通過自動化的技術整合連接起來,它們就會漸漸蠶食我們的個人自由。這才是真正的危險。”
——美國隱私研究委員會,1977年
1965年,人類的計算模式還僅僅處在第一個階段——主機時代,這種危險和擔心就開始初現端倪。
那個時候,現在白宮的行政管理預算局(OMB)還叫預算局。
預算局提出了一個簡單、大膽、在當時堪稱革命性的創新計劃。
該局建議,聯邦政府應該成立一個統一的“數據中心”,把政府部門所有的數據庫連接、集中、整合起來,建立一個大型的數據庫。預算局相信,這不僅能節約硬件成本,還能提高數據管理、查詢和統計的效率;此外,通過部門之間的數據對接和整合,還可以提高數據的準確性和一致性,減少數據的錯誤。
預算局甚至為這個計劃提出了具體的實施方案:人口普查局、勞工統計局、稅務局以及社保局等4個數據密集型部門先行一步,首先將數據庫連接起來,其他各個部門的數據庫逐步納入,最終的目標是,以公民為單位,為全國每一個人建立一個數據檔案,這個檔案將包括每一個人教育、醫療、福利、犯罪和納稅等等一切從搖籃到墳墓的數據記錄。
預算局將這個大型數據庫稱為“中央數據銀行”。
普林斯頓大學的高等研究院(IAS)是全世界最頂尖的研究機構之一,它的特點,是可以不屈從任何行政的任務和資金的壓力,自主開展純粹的科學研究。時任該研究院主任的是凱森教授(CarlKaysen),他盛贊這是一個劃時代的計劃。凱森發表了專門的可行性報告,指出統一管理不僅能節省運營成本、提高數據的準確性和查詢的效率,還將更好地保障數據安全。
聽起來有百利而無一弊,中央數據銀行的計劃得到了行政圈、學術界的一致響應。
經過一年的論證,1966年,聯邦政府正式向國會提交了“中央數據銀行”的方案,請求撥款、開工,開創新的數據管理篇章。
新聞界也開始報道聯邦政府的這個創舉。
但沒想到,新聞界的報道引起了強烈的社會反彈。這種反彈,最后導致了這個計劃的流產。
1967年1月,《紐約時報》發表了著名記者、隱私權專家帕卡德(VancePackard)的文章《不能告訴計算機》,他寫道:
“當政府把我們每一個人的信息和日常生活的細節都裝進一個中央級的數據銀行,我們將受控于坐在電腦機器前面的那個人和他的按鈕。這令人不安,這是一種危險。”
美國公民自由聯盟(ACLU)是一個成立于1920年、位于紐約的公益組織,它的目標是利用法律的手段維護公民的權利,隱私權正是ACLU關心的重點。對于中央數據銀行的計劃,ACLU強烈反對,并發表了一系列的聲明和調查。
哈佛大學也對這個計劃開展了專門的民調,其調查的結果表明,56%的美國人擔心自己的隱私會受到侵害,明確反對這個計劃。
一時間,曾經贏得了各方贊譽的數據銀行計劃在國會的討論中陷入了泥沼。
此后,美國國會對此召開了一系列的聽證會。1968年,眾議院隱私委員會發布了一份報告,作出結論說,該計劃無法保證公民的隱私不會受到侵害,不予批準。
但這只是一個中斷,甚至僅僅只是一個開始。此后的幾十年,隨著數據庫越來越多,類似于“中央數據銀行”的計劃不斷改頭換面,在國會發起沖刺。美國各界對其的討論也從來沒有間斷過,并形成了涇渭分明的兩派。
支持的一派以經濟學家和技術專家為主,這個陣營認為,現代經濟依賴于大規模的數據整合和交換,統一集成的中央數據庫,將提高經濟效率,方便大眾的生活,是現代社會發展的必然,是社會進步的不二選擇。
反對方自然是隱私至上的信奉者。他們認為,在信息時代,無論是個人的日常消費等瑣碎小事,還是事關健康、教育的重大決策,都會在各種各樣的信息系統當中留下“數據腳印”。這些“數據腳印”,保存在不同的系統中,可能無傷大雅。但如果建立起中央數據銀行,通過數據整合和信息加總,就可以再現一個人生活的軌跡和全景,各個系統之間的數據可以彼此印證、互相解釋,個人隱私就無所遁形。
隱私學學者認為,這種信息加總和數據整合,無異于一種監控,準確地說,是一種“數據監控”(Dataveillance),其對個人隱私權的侵害,無異于《一九八四》中的電幕。進入大數據時代之后,甚至有專家提出:大數據就是老大哥!(BigData is Big Brother)
【百年糾結:統一身份證】
“我們的立場是:現在或者可預見的將來,在美國都不應該建立統一的身份證。就嚴格的定義來說,社會安全號不能算是身份證,它最多只能算一個近似的身份標識。”
——聯邦政府衛生、教育和福利部部長咨詢委員會的報告《數據記錄、計算機和公民權利》,1973年
近幾十年以來,美國也對統一身份證這個問題做過很多次民意調查,但除了珍珠港事件之后的曇花一現,每次都是反對意見占了絕對上風。1942年,民意調查的創始人喬治·蓋洛普曾經在《紐約時報》上對統一身份證這個問題做過一個很好的總結。他認為,統一身份證是管理社會、控制公民的一種手段,在美國,這種手段被視為是警察國家的做法,是集權社會的象征,是違反美國精神的。當然,蓋洛普也承認,統一身份證有利于警察打擊犯罪、加強國家的安全,特別是在應對恐怖襲擊、自然災害等等突發事件當中,統一身份證將大大方便政府對社會的管理和控制。
統一身份證也多次成為總統大選的辯論話題。前文提到的紐約市的市長朱利安尼,曾經是2008年大選期間知名度最高的候選人,他表態支持全國統一身份證,隨后遭到了其他多位候選人的攻擊,這些候選人認為:沒有任何理由去犧牲公民實實在在的自由以換取“可能會好一點”的國家安全。
【總統的雄心:公共財政支出透明】
“聯邦政府掌握和維護的信息是整個國家的資產和財富。”
——奧巴馬,2009年1月21日
“如果我們坐等他人,那改變就不會到來。我們自己——就是我們一直在等的人,我們自己——就是我們所要尋求的改變。”
——奧巴馬,競選總統時的演講,2008年2月5日
正是在陶伯拉發布第一個數據開放網站TrackGov.us的同年,2004年11月,奧巴馬贏得了聯邦參議員的選舉。
次年1月,他躊躇滿志,從芝加哥飛往了華盛頓。
有理由相信,初起乍興的數據開放運動,也進入了他的視野。
因為,作為聯邦參議員,奧巴馬就任之后成功推出的第一份法案,就是一份有關數據開放的法案。
美國國會參議員的任期,是6年一屆。奧巴馬在參議員的位置上,只干了3年多。根據TrackGov.us網站上發布的數據,在他短暫的參議員生涯當中,奧巴馬作為第一發起人提出過137個法案,但最終成為法律的,卻僅僅只有2個。奧巴馬還作為合署人和其他議員共同發起過600多個法案,最后通過的也屈指可數。
奧巴馬成功交出的第一份答卷,是2006年4月作為主要合署人和共和黨參議員科伯恩(TomCoburn)聯合推出的《聯邦資金責任透明法案》(FFATA),這個法案后來產生了廣泛的影響,也被稱為《科伯恩—奧巴馬法案》。
這個法案要求聯邦政府向全社會開放所有公共財政支出的原始數據,這些數據,包括政府和私營機構的購買合同、公共項目的投資、直接支付以及貸款等等明細。其基本理念和TrackGov.us是一樣的:建立一個完整的、專業的公共支出數據開放網站,以統一的格式提供可以下載的數據,以供公眾查詢使用。
奧巴馬是民主黨員,科伯恩屬共和黨,作為一個跨黨提案,該法案在參眾兩院都高票通過,2006年9月,經小布什簽署后,成為法律。2007年,根據該法的規定,網站USAspending.gov上線發布,成為美國聯邦政府發布公共支出信息的門戶網站。
USAspending.gov是個巨大的數據開放網站,可以對聯邦政府2000年以來高達3萬億的政府資金使用情況以及30多萬個政府合同商所承包的項目進行跟蹤、搜索、排序、分析和對比,其數據每兩周更新一次。網站上線之后,受到了社會各界的極大好評,獲得了“政府搜索引擎”(Googlefor Government)的美譽。
當然,這個法案的產生和通過,并不僅僅是奧巴馬和科伯恩兩人力推的結果。
公共支出數據的開放,真正的先行者,還是美國民間的普通公民。
USAspending.gov網站建立的背后,更有一段國會、政府和公益組織3方攜手合作的佳話。
上文說到,開放數據的運動興起之后,首先直指公共數據。有一批社會活動家和公益組織,多次召開民間會議,發起游說活動,督促政府開放公共數據,政府財政支出的數據正是其中的焦點。
“OMB監督”(OMB Watch)就是這其中最執著、強力的行動者之一。這是一個位于華盛頓的公益組織,由加里·巴斯(GaryBass)于1983年創辦。“OMB監督”以監督政府的預算、稅收和工作績效為己任。它的直接監督對象是總統行政辦公室下屬的行政管理預算局,該局簡稱為OMB,這也是該組織之所以命名為“OMB監督”的原因。
美國的聯邦政府其實很早就開始公開發布公共支出的信息,但這種發布是零散的、不系統的,其發布形式可能是新聞發言、文字簡報,也可能是電子數據,很不統一。2005年,巴斯意識到,如果能將聯邦政府全部的開支數據統一發布在同一個網站,全社會就可以更好地查詢、研究和監督聯邦政府的開支和預算。
巴斯后來為這個項目發起了專門的社會募款活動。通過籌款集資、整理數據、開發網站、接洽政府等一系列的工作,2006年,“OMB監督”(OMB為美國總統行政辦公室下屬的行政管理預算局)推出了美國首個公共支出的數據開放網站:Fedspending.org。
Fedspending.org能夠逐條跟蹤、記錄、分析、加總OMB發布的每一筆財政支出。它推出之后,受到了全國輿論的好評,《洛杉磯時報》盛贊其為“財政透明的起點”。
正是受到這個網站的直接啟發和幫助,科伯恩、奧巴馬發起了《聯邦資金責任透明法案》,奧巴馬本人,也在這個法案的草擬和推行過程中,和“OMB監督”建立了合作關系。
《聯邦資金責任透明法案》通過之后,根據它的規定,行政管理預算局也必須建立一個和Fedspending.org類似的網站,向全社會統一開放聯邦政府所有的公共支出數據。