中國防疫神器“健康碼”是怎麼運轉的?

一張巨大的由算法引擎織成的細密的網,是口罩、核酸檢測與隔離之外,中國阻止新冠病毒複製傳播的另一大利器。到了新冠肆虐的第三個年頭,這個數字防禦長城已趨近完善。在有14億人口的中國,每個人都能通過智能手機調取一張健康碼。

001OBdwBly1gyox0aguztj62dc35skjm02.jpg

“數據宇宙”中的健康碼

本刊記者/苑蘇文

發於2022.1.24總第1030期《中國新聞周刊》

這是在紅黃綠間變化的二維碼或條形碼,三種顏色在後台由大數據算出,提示持碼人不同的感染風險狀態。不同地方的健康碼還展示不同的其他信息,有的展示照片,有的提示行程,還有的標識着打了幾針疫苗,為防止截屏偽造,大多數都嵌入動畫和定時刷新。

除了對外展示感染風險,健康碼還負責採集更精準的位置信息。中國遵循“動態清零”政策,每個人要為自己的出行和潛在的病毒傳播負責。在大多數城市,當你出入公共場所,會被要求在門口掃碼登記,而手動的掃碼登記,比被動的手機基站定位誤差更小。

健康碼由各地政府主導開發,企業提供技術支持。毫無疑問,用以檢測每個人健康風險的“底層數據”,涉及大量個人隱私。但接受《中國新聞周刊》採訪的政府相關部門及企業人士都保證,對於這些隱私信息,企業僅提供技術支持,並簽署了嚴格的保密協議。而自2021年9月1日起施行的《中華人民共和國數據安全法》,也為數據的安全上了一道“緊箍咒”。

快速上線背後的大數據戰略

健康碼的第一行代碼已經寫進了歷史,更準確地說,它已經成為中國國家博物館的館藏。玻璃櫃里的那行代碼,創建於2020年2月13日晚8點34分,是浙江省健康碼引擎的開端,並在40個小時後上線測試,這是全國第一個省級健康碼,脫胎於幾天前的杭州餘杭區健康碼和杭州健康碼。

杭州市餘杭區,是阿里巴巴公司西溪園區所在地。2020年2月4日,餘杭區就提出探索復工復產時疫情防控的數字化方案,“全人群覆蓋+全流程掌辦+全領域聯防”。公開報道顯示,依託於支付寶、釘釘、阿里雲的技術力量保障,2020年2月5日凌晨5點,誕生了餘杭健康碼的第一個版本,在以小時計算的迭代升級中,健康碼在24小時內推廣至杭州,又在幾天內推廣至浙江省。防疫新理念“病毒式”傳播,一周之內已經落地超過100城。到了2月15日,國務院辦公廳電子政務辦指導支付寶、阿里雲加速研發全國一體化政務服務平台疫情防控健康碼系統,加速了健康碼走向全國。

各地在健康碼探索中,並不全都依賴“互聯網大廠”。在杭州往西南1650公里的貴州省貴陽市,雲上貴州大數據(集團)有限公司(下稱“雲上貴州”)承擔了貴州健康碼的開發。雲上貴州是貴州省國資委控股的國企,其業務指導單位是貴州省大數據發展管理局。

從2020年2月13日到2月18日,雲上貴州團隊只用了6天完成貴州健康碼的全省上線。“貴州很低調。”雲上貴州黨委副書記、董事、總經理魏巍曾在公開場合表示,六天開發上線的貴州健康碼,第一批接入了國家系統,“我們當時是最簡化,也是最全”。

萬永波是雲上貴州技術開發部副總經理,帶領團隊完成貴州健康碼的開發。他告訴《中國新聞周刊》,在開發健康碼的前兩天,他與團隊成員通宵達旦地向貴州省大數據發展管理局、省政府辦公廳、衛健委和以公安廳為主的貴州省疫情防控領導小組社會防控組(簡稱“社防組”)部門溝通,收集需求。“白天去各個部門,晚上回來匯總需求,由領導統籌方案,第二天白天再去彙報”。

調研工作結束后,就是緊密鑼鼓的部署開發,既包括應用系統的部署,也包括數據收集的部署,其中,數據收集採用了最原始的方式,派人去各政府單位“駐點”。

“信息流轉非常難,我們純用人力去跑,派了很多人到大數據局、辦公廳、衛健委和公安局去駐點,拿到他們的數據之後傳回公司。”萬永波的數據處理團隊有六個人,三人分為一組,12小時工作制,兩班倒,“只要那邊數據來了,這邊就馬上處理入庫”。

在貴州健康碼最初的後台數據庫,會根據數據的不同,將居民判定為五種狀態,在健康碼展示中分為紫、紅、橙、黃、綠五種顏色,其中紫色需要集中治療,紅色需要集中隔離觀察,橙色需要居家隔離,黃色需要定期做核酸檢測自我觀察,綠色則為無風險。萬永波介紹,數據進行初步處理后,由研發團隊將其合併入“大數據集群”,再向健康碼提供服務,而小程序的開發也在同時進行,在第五天時,這些工作基本結束,第六天小程序進行了壓力測試,第七天正式上線。

能在幾天之內將政府數據全部聚攏,得益於貴州省的數據發展戰略。2014年,“雲上貴州”註冊成立,2016年,貴州省成為首個國家大數據綜合實驗區,並成立了省大數據管理髮展局,其致力於打造“一雲一網一平台”,等到了2020年,已經擁有了打通政府各部門“數據孤島”的基礎。

大數據已成為國家戰略。在2021年12月29日,國家發展改革委等部門下發通知,加速推進國家“東數西算”工程,啟動建設全國一體化算力網絡國家樞紐節點,節點共有八個,分別是貴州、甘肅、內蒙古、寧夏,以及京津冀、長三角、成渝、粵港澳地區。西部發展大數據,有成本低的好處。記者獲悉,貴州健康碼的開發和運營,至今僅投入1500萬元,不及東部某省該項目投入的1/10。

數據收集邏輯

疫情陰霾下,健康碼的後台服務器是永不停歇的大腦,不斷計算着每個人的健康狀態。貴州數據寶網絡科技有限公司產品研究院院長、華東江蘇大數據交易中心副主任李可順告訴《中國新聞周刊》,每個人的健康狀態以字節的方式存儲於健康碼的服務器中,並隨着防疫政策和疫情形式的改變不斷刷新,當居民出示健康碼時,只是從後台調取這個狀態,並顯示為不同顏色的二維碼。

二維碼於20多年前由日本人發明,隨着移動支付的興起,成為近幾年移動設備上最流行的編碼方式,它比傳統條形碼能存更多的信息。李可順指出,大多數城市選擇不同顏色的二維碼展示居民健康狀態,目的是為了保護隱私數據安全。“健康碼的小程序一般依靠微信或支付寶等第三方平台,只顯示二維碼可以保證隱私數據掌握在政府手上,不易泄露”。

健康狀態經由哪些數據判定?李可順介紹,健康碼背後包括四大數據,第一是公安部門的戶籍信息;第二是自己申報的健康數據,比如體溫及當前癥狀;第三是行程數據,既包括通信管理部門協調運營商提供的手機信令位置,也包括鐵路和航空交通出行數據,以判斷是否到達過風險地帶;第四是由衛健疾控部門提供的就診信息,及判斷是否與確診者有交集。

貴州省大數據管理局應用推廣處處長洪浩告訴《中國新聞周刊》,在貴州健康碼的運營過程中,主要關注重點人群,其中包括通信管理局推送來的與確診者或密切接觸着的“時空伴隨”人員、社防辦排查推送的高風險地區入境人員,以及衛健系統推送的確診人員或密接和次密接。重點人群被分成高風險人員和中風險人員,獲得這些人員信息后,健康碼會響應,並與省社防辦聯動,開啟進一步的排查和處置。

防疫變得越來越精細化。過去,中高風險區域往往以城市為單位,通信管理局將有過這些風險區軌跡的人員悉數推送來,人數眾多。但現在提出了“時空伴隨”概念,風險範圍進一步縮小。

“時空伴隨”主要靠手機信令來定位。它的規則是,在方圓800米的範圍內,與風險人員的手機信令共同停留大約10分鐘時間,就會判定可能會有接觸,會被標記為風險人員的時空伴隨人員。時空伴隨人員的計算不屬於地方,由國家工信部信管局牽頭,幾大運營商根據基站和信號進行綜合定位,這需要更多的算力。最終的目的是減少了防疫擴大化,將方圓幾十甚至幾百公里的封鎖範圍縮小至幾百米。

洪浩解釋說,時空伴隨數據由運營商完成計算后,統一交給工信部,再由後者向各地統一分發。“運營商的管控精度要高一些。”他說,原則上沒有大需求的時候,工信部每天會推送時空伴隨人員數據,而對於一些重點區域的時空伴隨人員,“實際上是實時更新的”,比如對最近暴發疫情的陝西、天津等地,對於離開那些區域的人員,如果要進入貴州,他們的時空伴隨情況就會被快速推送過來。

李可順指出,儘管目前各地數據已共享至全國統一平台,但仍是以省為單位在服務器後台分析數據。在重點區域,則不斷通過刷新,更新每個人的最新動向與健康狀態。刷新頻率和當地是否存在疫情傳播風險有關。“就像我們刷網頁,刷新是耗流量的,就得花錢,所以如果沒有疫情刷新就慢,如果在重點區域就會不斷刷新,監控人員流動可能帶來的風險。”他指出,像是上海浦東機場這類出入境人員較多的地方,每人信息的刷新應該“特別快”。

在大多數地方,除了要亮健康碼,還需要亮出行程卡。行程卡是由工信部推出,基於運營商的基站數據,判斷人14天內的行程,如果有城市存在中高風險區,城市名稱上會用星號來標識。李可順指出,實際上行程卡基於手機信號基站定位的位置數據,在健康碼的數據中是包含的,但之所以開發行程卡作為輔助工具,主要是因為健康碼沒辦法展示近十四天的行程信息。

“目的就是為了更精準地定位。”李可順說,疫情之下,健康碼給人員流動提供了保障,讓人們能安心復工和通行於公共場所。“健康狀態掌握在政府手裡,假如有感染風險,馬上就能定位到此時此刻的位置,然後再進行網格化的處理,有一整套響應機制和流程。”

各顯神通

在健康碼推行初期,各地單獨立項製作健康碼,信息採集標準也有所不同,因此難以達成互認。李可順指出,主要是各省單獨立項製作健康碼,標準和數據使用維度都不同,甚至在後台留存的居民健康狀態,也使用不同的字節去記載,這令各地相互轉碼也很困難。在同一個省,也出現了省會和其他城市用兩套健康碼,比如在陝西就並存“西安一碼通”和“陝西一碼通”。

各地用健康碼定位的方式也不一樣。不同於許多地方在進入公共場所時需掃描場所碼進行登記,貴州省的貴州健康碼只需要打開,就會自動上傳定位。洪浩介紹,貴州健康碼設計之初,就確定以“最快通行”作為原則。儘管掃描場所碼登記,可以對人員所進入的公共場合精準確認,但亮出貴州健康碼時所發送的定位,誤差也不會超過10米範圍,儘管無法確定在哪家店,但如果出現感染者,同樣可以將周圍的密切接觸者排查出來。省去場所碼登記這一環,可增加通行速度。“如果流程太複雜的話,防控上反而容易有疏漏了,刻意追求定位的精準,反而可能帶來新的風險”。

在2020年上半年,各省健康碼數據沒有共享平台。洪浩回憶,2020年3月前後,貴州省聯繫了人員來往密切的廣東和浙江,進行了數據定向交換。到了2020年下半年,國家設立了“全國一體化政務服務平台”,各省就將數據上傳至國家的平台上,推送更新內容也是每日一次。

為實現各地的健康碼信息互通互認,國家還制定了統一的數據採集標準,其中既包括數據採集的類型和維度,也包括數據字段的標識,以便數據互通。根據國家統一標準,貴州健康碼從五色變為三色。將紫色和紅色歸集為紅色,橙色保留,將黃色納入綠色進行管控。萬永波介紹,貴州健康碼上線之初到現在,已經經歷了150多次迭代升級。其中包括增加了核酸檢測預約登記功能、疫苗接種查詢功能,以及健康碼和行程卡共同顯示。

近些天來,一些地方進行全城核酸檢測時,健康碼崩潰,引發熱議,萬永波指出,與許多其他地區的健康碼不同,貴州健康碼在核酸檢測、疫苗查詢和健康碼亮碼三個方面,採用獨立的技術架構。

“據我了解,西安的健康碼之所以崩潰,是因為核酸檢測系統的查詢量並不能承載健康碼查詢的併發量,導致核酸檢測系統查不出數據了。為了避免這種情況,我們貴州健康碼使用了中間庫。”萬永波說,將核酸檢測分離為獨立的系統,檢測數據收集出來后,將會被傳遞到中間數據庫,當健康碼用戶需要查詢核酸結果,再連接到中間庫去讀取,“在這種情況下,假如核酸檢測系統宕機了,也不會影響健康碼系統的正常運行”。

萬永波還介紹,為了減少服務器宕機時的影響,他們在服務器集群採用了“高可用”形式,即將幾十台服務器建立成為集群,這其中若出現一台或多台服務器宕機,並不影響整體集群的使用。另外,他們還在聯通和移動兩個節點分別部署了健康碼後台,當一個節點出現故障,能夠迅速切換到另一個節點。根據最新的壓力測試,貴州健康碼的核酸檢測系統,每秒能完成1萬人的核酸檢測,“一分鐘就是60萬,完全能承受貴陽市的800萬人口”。

不過,儘管如今各地數據已經打通,但在核酸檢測方面,仍不能做到異地同時查詢。其中一個原因,與國家信息平台數據更新速率有關。這意味着,當你到達新的地方,此前的核酸檢測報告有可能無法同步在當地健康碼上,仍要按照當地政策重新檢測。

隨着健康碼系統的愈發完善,疫情防控也將愈發精準。根據相關政策,國家要求不能以區縣以上為單位賦碼,要精準賦碼,避免“一刀切”。如今,風險區的劃分也越來越小,多以小區為主。不久前在上海,甚至將一家佔地面積20多平方米的奶茶店劃為中風險地區,被成為“史上最小”,與之一牆之隔的理髮店都可以正常營業。

但健康碼仍有漏洞。對於不使用智能手機的兒童和老年人,目前採用登記為同行人的方式,如果老人單獨出門,則使用打印的紙質二維碼。李可順說,目前業內正在研究公路交通中以車為主的通行碼,加強來自風險地區的道路管控。另外,廣西等地,已經推出不需要聯網即可查詢的健康碼,“類似於緩存機制。”他說,健康碼小程序會有個定期輪詢個人健康碼狀態,存在手機,聯網時查後台實時健康碼,斷網時直接提取緩存的健康碼。

李可順說,未來健康碼還將可能富集更多功能,比如綁定銀行卡進行支付,以及在醫院就診。等到疫情過去,健康碼的使命並不會結束。“我們做了這麼多底層數據的工作,肯定是有用的,有價值的。”他說,只要維持核心的數據狀態,持續將各方面數據打通,就能實時監控每個人的疫情狀態,如果沒有疫情,這些新的機制和經驗,也可用在其他應急事件上,“比如搶險救災,再比如追蹤資產和逃犯”。

(0)
上一篇 2022-01-25 10:10
下一篇 2022-01-25 10:10

相关推荐