中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

治道|面對肺炎疫情,政府的數(shù)據(jù)開放還有很大空間

鄭磊/復旦大學國際關系與公共事務學院教授、數(shù)字與移動治理實驗室主任
2020-01-25 13:08
來源:澎湃新聞
? 澎湃研究所 >
字號

自武漢新型冠狀病毒感染的肺炎疫情爆發(fā)以來,國家和地方各級政府部門通過各種渠道發(fā)布了許多領導指示、疫情通報、自我防護知識、相關政策通知,這些信息的發(fā)布有助于公眾獲知疫情的發(fā)展情況和相關知識,在一定程度上滿足了公眾的信息需求。

然而,進入了大數(shù)據(jù)時代,除了以上政府發(fā)布的信息,公眾可能還想知道一些更具體的數(shù)據(jù),比如:所在城市或區(qū)縣每天有多少確診和疑似病例,增長情況如何?也想了解一些有關病人基本情況的數(shù)據(jù),比如:病人從哪里來,去過哪里,哪天發(fā)病的,那些疑似病例后來確診了沒有,如果沒確診,他們得的又是什么???

雖然我也不斷會從網(wǎng)上和身邊的朋友那里得到各種各樣的小道“消息”,但這些消息是真是假,難以確定。而且這些信息比較零碎,無法讓我全面系統(tǒng)地了解疫情的進展情況。我想知道有關疫情的最新的、權威的、準確的官方數(shù)據(jù)。

一、國家衛(wèi)健委網(wǎng)站數(shù)據(jù)

于是,我來到了國家衛(wèi)生健康委員會的網(wǎng)站,看看這里有沒有公開的官方數(shù)據(jù)。打開國家衛(wèi)健委的官網(wǎng)后,首先在網(wǎng)頁最上方位置看到了“全力做好新型冠狀病毒感染的肺炎疫情防控工作”橫條。(以下未經(jīng)特別注明者,均截圖于1月23日。)

國家衛(wèi)生健康委員會網(wǎng)站首頁,1月24日截圖

點進橫條,可以看到頁面最上方是“疫情通報”、“防空動態(tài)”兩個版塊,在“疫情通報”中可以看到國家衛(wèi)健委發(fā)布的各省確診病例和疑似病例數(shù)據(jù)。

國家衛(wèi)生健康委員會網(wǎng)站,1月24日截圖

1月23日這天發(fā)布的疫情通報詳細列出了17例死亡病例的病情介紹。但是,我如果還想知道其他幾百例確診和疑似病例的情況,就無從得知了。

而且,雖然這些病例情況已足夠詳細,但數(shù)據(jù)是以夾雜在文字中的形式出現(xiàn)的,而不是以結構化表格的形式展現(xiàn),不夠清晰直觀,也不利于使用者進行分析利用。假如我想用這些數(shù)據(jù)做一些分析的話,還需要自己先從這些文字中把數(shù)據(jù)提取和整理出來,做成表格或圖。在這些大段的文字之外,如果還能有一張數(shù)據(jù)表格就能一目了然,方便很多。

此外,國家衛(wèi)健委發(fā)布的數(shù)據(jù)只到了省一級,而沒有每個城市或區(qū)的數(shù)據(jù)。于是,我搜到了武漢市衛(wèi)健委的官網(wǎng),來看看這里有沒有城市一級的數(shù)據(jù)。

二、武漢市衛(wèi)健委網(wǎng)站數(shù)據(jù)

在這個網(wǎng)站的首頁,第一眼看不到有關疫情的信息或欄目。逐個點開各個欄目后,才在“公示公告”這一欄目下找到了“肺炎情況通報”。

相關通報公布了武漢市的累積病例數(shù)量和當日新增病例數(shù)據(jù)。然而,這些數(shù)據(jù)仍然沒有以表格的形式出現(xiàn)。在1月21日發(fā)布的情況通報里,只能看到20日那天的新增病例數(shù)據(jù),想要知道20號之前的數(shù)據(jù),就要再去翻找以前發(fā)布的通報。

再進一步查找后發(fā)現(xiàn),這些情況通報是和醫(yī)療機構名單、知識問答、結果公示等其他信息夾雜在一起發(fā)布的,并不便于用戶查找和獲取。更重要的是,這些情況通報不是每日都有更新,數(shù)據(jù)并不完整。比如,1月17號,以及1月6號至1月10號都沒有發(fā)布情況通報。這幾天是沒有發(fā)現(xiàn)新增病例?還是沒有發(fā)布新增病例?沒有任何備注說明。

哪里能找到一張有關疫情數(shù)據(jù)的表格?這張表格不用很花哨,只需要把每個地方每天的疫情數(shù)據(jù)都清楚明白地展現(xiàn)出來就行。

然而,無論在國家、湖北,還是武漢衛(wèi)健委的網(wǎng)站上,我都沒有找到這樣一張表格。實際情況是,有關疫情的數(shù)據(jù)以碎片化的、不連續(xù)的、不完整的方式散落在不同的政府網(wǎng)站、頁面和文件里。大部分公眾不可能有精力和能力去各個政府網(wǎng)站上提取和整理這些數(shù)據(jù),其結果是,雖然各級政府認為它們已經(jīng)發(fā)布了這些疫情數(shù)據(jù),但老百姓并沒有獲得感。

武漢市衛(wèi)健委發(fā)布的情況通報中還包括了新增病人的男女人數(shù)、病人最小和最大年齡等統(tǒng)計數(shù)據(jù)。然而,這些數(shù)據(jù)是對原始數(shù)據(jù)進行加工和歸總形成的結果,并不是一手的原始數(shù)據(jù)。原始數(shù)據(jù)可以用來做進一步的深入分析,但統(tǒng)計數(shù)據(jù)的再利用空間就很小了。

比如,情況通報中公布了新增病例的最小年齡是15歲,最大年齡是88歲,但15歲到88歲這個區(qū)間實在是太大了,如果我想知道在15-88歲之間,病人主要集中在哪個年齡段,我和我的家人是否正好屬于這個年齡段,僅通過15和88歲這兩個統(tǒng)計數(shù)據(jù)是無法回答我的這些問題的,只有得到經(jīng)過統(tǒng)計歸總前的每一個病人的年齡數(shù)據(jù)才行。

當然,我并不需要知道每個病人的姓名、住址和電話等個人信息,而只需要得到有關他們的一些基本特征的數(shù)據(jù)就可以了。這些經(jīng)過匿名化處理的數(shù)據(jù),既能被用來做出有用的分析,又不會侵犯到病人的隱私。

之后,我還在人民日報官方微博上看到過每日發(fā)布的“疫情速報”,這些帖子以短平快的方式發(fā)布最新疫情。但這些數(shù)據(jù)仍然是碎片化的,無法幫助我系統(tǒng)全面地了解疫情全貌。

1月24日,我在北京市衛(wèi)健委的官方微博“首都健康”上,找到了一張表格,展示了有關病人情況的一些基本數(shù)據(jù)。但這只是當日的新增病例數(shù)據(jù),而不是每一天的數(shù)據(jù),數(shù)據(jù)仍然不夠完整。

三、社會化機構發(fā)布的疫情數(shù)據(jù)

1月24日,我在手機上看到了由醫(yī)學知識共享網(wǎng)站“丁香園”和澎湃新聞 “美數(shù)課”欄目制作的全國疫情數(shù)據(jù),這些數(shù)據(jù)的呈現(xiàn),相較于政府網(wǎng)站要系統(tǒng)、直觀和清晰很多。

微信公眾號“丁香園”,1月24日截圖

澎湃新聞“美數(shù)課”欄目,1月24日截圖

澎湃新聞“美數(shù)課”欄目,1月24日截圖

為采集和整理這些數(shù)據(jù)并進行符合受眾需要的制作,這些社會化機構一定花了不少時間和精力。然而,由于政府發(fā)布的數(shù)據(jù)具有碎片化、不完整、顆粒度低等特點,它們的數(shù)據(jù)展現(xiàn)方式雖然已經(jīng)非常不錯,但在展現(xiàn)內容上仍然無法提供出更全更細的數(shù)據(jù)。

四、香港特區(qū)政府衛(wèi)生署網(wǎng)站數(shù)據(jù)

有鑒于此,我來到了香港特別行政區(qū)政府衛(wèi)生署的網(wǎng)站。在這個網(wǎng)站的首頁上,我在第一排的顯眼位置就看到了“嚴重新型傳染性病源體呼吸系統(tǒng)病”的版塊。

點進這個版塊之后,在頁面第一行的位置看到“本地最新情況”這條內容,點開后跳出了下面這份表格。

在這份表格上,可以看到每一位疑似病人的急診日期、性別、年齡、報告來源、醫(yī)院名稱、化驗結果、患者狀況。表格結構清晰,字段豐富,內容詳細,便于公眾解讀和分析利用。從表上能看到,經(jīng)過化驗,絕大部分疑似病人感染的并不是武漢的新型肺炎病毒,而是其他病毒,這些詳情都一一列明了,令人信服。

同時,這張表格上還有多個細節(jié)值得關注。

首先,在發(fā)布病人基本信息的同時,去除了患者的具體姓名,保護了個人信息。

其次,在發(fā)布當日新增數(shù)據(jù)的同時,還在后面列出了之前發(fā)布的累計數(shù)據(jù),并將當日數(shù)據(jù)和歷史數(shù)據(jù)用白色和陰影兩種顏色區(qū)分開來。這樣公眾就不用再去“爬樓”, 把之前發(fā)布的一個個表格下載下來再整合起來了。就這一個貼心的舉手之勞,就給用戶帶來很大的便利。

第三,特別需要關注的一個細節(jié)是,在表格之后還附上了“備注”,對數(shù)據(jù)采集的背景方法和呈現(xiàn)方式進行了詳細說明。不要小看這個備注,這能幫助公眾更準確地理解和使用表格中的數(shù)據(jù),避免誤解和誤用。

樸素干凈的一張表,卻填滿了細節(jié)和溫度,體現(xiàn)了背后真正的用戶視角和數(shù)據(jù)思維。

唯一的小遺憾是,這些數(shù)據(jù)還是以PDF的格式發(fā)布的,還需要人工做一下轉換處理后才能直接利用。PDF格式便于閱讀,不易被修改,但不便機器讀取,以進行加工利用。如果能在PDF格式之外,還能提供機器可以讀取的excel或csv等格式,就更加便于專業(yè)研究者用戶進行分析利用了。

五、政府數(shù)據(jù)開放的基本原則

暢想一下,如果類似“丁香園”這樣的社會化機構也能得到這樣的疫情數(shù)據(jù),它們能開發(fā)出來的可視化應用會更全更細,給用戶帶來更好的體驗。而且,它們也不再需要花費大量的時間精力去搜集整理各種碎片化的、不符合標準格式的政府數(shù)據(jù),而是可以集中精力將數(shù)據(jù)可視化應用做得更直觀更生動。

在這個過程中,政府作為數(shù)據(jù)的供給側把數(shù)據(jù)開放出來,市場上的專業(yè)組織作為數(shù)據(jù)的利用者把數(shù)據(jù)開發(fā)成各種應用,然后一起為社會公眾提供信息服務。政府和市場實際上以數(shù)據(jù)為原料實現(xiàn)了一種協(xié)同治理,便于共同應對疫情。

此外,將數(shù)據(jù)平等、無歧視地開放出來,讓不同的社會化機構都可以對這些數(shù)據(jù)進行開發(fā)利用,可能還會做出比“丁香園”等更好的應用。這些機構之間還可以實現(xiàn)良性競爭,以最大限度有利于用戶。這其中一個關鍵是,政府是否把完整的、準確的、及時的數(shù)據(jù),以便于利用的格式提供給了利用者。否則“丁香園”之類機構即使手再巧,也難為無米之炊。

而這正是數(shù)據(jù)開放和信息公開的一個重要區(qū)別。政府信息公開的主要目標是保障公眾的知情權,提高政府透明度,而政府數(shù)據(jù)開放則不僅要讓社會知情,還要讓社會能對政府數(shù)據(jù)進行開發(fā)利用,從而釋放數(shù)據(jù)的能量,創(chuàng)造社會和經(jīng)濟價值。

目前,在各國的政府數(shù)據(jù)開放實踐中,開放數(shù)據(jù)通常呈現(xiàn)為以電子化、結構化、可機讀格式開放的數(shù)據(jù)集。數(shù)據(jù)集是指由數(shù)據(jù)組成的集合,通常以表格形式出現(xiàn),每一列代表一個特定變量,每一行則代表一個樣本單位,這樣的形式更便于數(shù)據(jù)利用者進行開發(fā)利用。

為推動數(shù)據(jù)的開放和利用,2007年,一群開放數(shù)據(jù)倡導者提出了政府數(shù)據(jù)開放的八項基本原則

第一,完整(Complete)。除非涉及國家安全、商業(yè)機密、個人隱私或其他特別限制,所有的政府數(shù)據(jù)都應開放,以開放為原則,不開放為例外。

第二,一手(Primary)。開放從源頭采集到的一手數(shù)據(jù),盡可能保持數(shù)據(jù)的高顆粒度,而不是開放被修改或加工過的數(shù)據(jù)。

第三,及時(Timely)。數(shù)據(jù)盡可能以最快速度發(fā)布,以保持數(shù)據(jù)的價值。

第四,可獲取(Accessible)。盡可能地拓寬開放數(shù)據(jù)的用戶范圍和利用目的。

第五,可機讀(Machine-readable)。對數(shù)據(jù)進行合理的結構化處理,使之可被計算機自動處理。

第六,非歧視性(Non-discriminatory)。數(shù)據(jù)對所有人都平等開放,無需登記。

第七,非專屬性(Non-proprietary)。數(shù)據(jù)以非專屬格式存在,從而使任何實體都不能獨占和排他。

第八,免授權(License-free)。數(shù)據(jù)不受版權、專利、商標或貿易秘密規(guī)則的約束,除非有合理的隱私、安全和特別限制。

目前,該標準已被國際開放數(shù)據(jù)領域廣泛接受。

六、面對疫情的政府數(shù)據(jù)開放當大有作為

面對疫情,公眾只有掌握了充分的信息,才能做出更理性的決定,采取更有利的行動。有量化研究表明,媒體的報道量增加十倍,傳染病的感染數(shù)將會減少33.5%。在互聯(lián)網(wǎng)和社交媒體已如此發(fā)達的數(shù)字社會,公眾如果不能及時獲得來自政府的權威數(shù)據(jù),而只能在網(wǎng)上看到各種真真假假的小道消息,只會增加他們的恐慌感。

因此,讓公眾在疫情初期就能獲得充分的信息,從而加強自我防護,減少出行聚會,有利于政府防控疫情。反之,片面地以避免社會恐慌為出發(fā)點,采取“外松內緊”的策略,即政府雖然在內部努力防控,但卻沒有將疫情信息充分告知社會,會造成公眾在不知情的情況下,繼續(xù)毫無防護地四處游走,最終反而助長疫情的傳播。

進入大數(shù)據(jù)時代,社會公眾的信息需求也發(fā)生了變化。面對疫情,公眾想知道的不僅僅是自我防護知識、官方疫情通報、相關政策通知,還想獲得權威的、完整的、一手的、準確的、及時的數(shù)據(jù)。顯然,目前各級政府相關部門在各個渠道上發(fā)布的碎片化的、不連續(xù)的、不完整的數(shù)據(jù),還不能滿足公眾的數(shù)據(jù)需求。

傳統(tǒng)的信息公開主要以非結構化的、文本的形式提供,而在大數(shù)據(jù)時代,公眾希望能獲得結構化的、可機讀的數(shù)據(jù),便于其理解和加工利用。政府數(shù)據(jù)開放由此走上前臺,將開放的對象推進到了信息的底層——數(shù)據(jù)層。

而且,防控疫情也不能只靠政府一方來孤軍奮戰(zhàn),還需要整個社會的充分參與。政府將自己掌握的疫情數(shù)據(jù)作為一種基本的原料開放給社會,然后社會力量可以將這些數(shù)據(jù)開發(fā)成各種應用,更好地滿足公眾的數(shù)據(jù)需求。最終,政府和社會之間可以實現(xiàn)協(xié)同治理,控制疫情,讓廣大民眾受惠于大數(shù)據(jù)帶來的便利。

近年來,我國中央和地方層面已出臺了多項有關公共數(shù)據(jù)開放的政策法規(guī)。2017年2月,中央全面深化改革領導小組第三十二次審議通過了《關于推進公共信息資源開放的若干意見》,要求推進公共信息資源開放,促進信息惠民,著力推進重點領域公共信息資源開放,釋放經(jīng)濟價值和社會效應。2018年1月,中央網(wǎng)信辦等多部委聯(lián)合印發(fā)了《公共信息資源開放試點工作方案》,確定在北京、上海、浙江、福建、貴州開展公共信息資源開放試點,并要求試點地區(qū)著力提高開放數(shù)據(jù)質量、促進社會化利用,探索建立制度規(guī)范。

2019年8月,上海市政府第61次常務會議審議通過了我國第一部專門針對公共數(shù)據(jù)開放的地方政府規(guī)章《上海市公共數(shù)據(jù)開放暫行辦法》。該辦法要求上海市各級公共管理和服務機構向社會提供具備原始性、可機器讀取、可供社會化再利用的公共數(shù)據(jù)集。

近年來,我國的政府數(shù)據(jù)開放工作也正在穩(wěn)步推進。根據(jù)復旦大學數(shù)字與移動治理實驗室近期發(fā)布的《中國地方政府數(shù)據(jù)開放報告(2019年下半年)》,自上海市于2012年6月上線了我國第一個地方政府數(shù)據(jù)開放平臺后,截至2019年下半年,我國內地已有102個地級以上的地方政府推出了數(shù)據(jù)開放平臺,國家公共數(shù)據(jù)開放平臺也將于近期上線。

然而,當前的政府數(shù)據(jù)開放仍然面臨著很多挑戰(zhàn)和難點問題。例如,政府數(shù)據(jù)開放,在字段和顆粒度上做到多細才合適?怎樣開放數(shù)據(jù)才能既滿足公眾知情權,有利于社會對數(shù)據(jù)進行開發(fā)利用,又能維護社會安定和個人隱私?怎樣防止數(shù)據(jù)在開放后被人濫用,以保護公共利益和第三方利益?如何才能在數(shù)據(jù)開放利用全過程的事前、事中、事后各個階段既促進數(shù)據(jù)利用,又加強安全防護?如何面向不同人群,針對不同類型的數(shù)據(jù),以不同的方式分級分類地開放?這些問題都還需要各地各級政府進一步探索和研究。

無論如何,面對疫情,政府數(shù)據(jù)開放還有很大空間可以作為。

    責任編輯:李旭
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋