大數據殺熟仍未絕跡 工程師:公開“黑盒”算法幾乎不可能

“電視里放着關於故宮的紀錄片,打開手機電商App首頁就被推送大量文創類商品。”喜歡看歷史節目的云云(化名)說道。“手機‘偷聽’+算法推薦”似乎已經成為網民們見怪不怪的平常事,“比你自己更了解你”的各種互聯網應用在消費端變幻出五花八門的玩法,只為滿足你的所謂“需求”。

近日,上海制定發布的《上海市網絡交易平台網絡營銷活動算法應用指引(試行)》(以下簡稱《指引》)提出了多種存在風險的網絡營銷活動算法應用方式,包含了數據處理、參數設置、消費者畫像、差別待遇、信息推送或商業營銷等。

同時,《指引》也提出了相關合規管理建議,其中“鼓勵平台經營者通過公開算法原理、目的意圖、決策規則、可能產生的影響等信息,提供算法應用結果解釋等方式提升公眾對算法應用的理解”值得關注。

價格“私人定製”

“大數據殺熟”一詞進入大眾的視野可以追溯到2018年,成為當時年度社會生活類十大流行語之一。

“大數據殺熟”的主要表現形式在於“不同人不同價”。北京市消協曾發布的“大數據殺熟”問題調查結果顯示,88.32%的被調查者認為“大數據殺熟”現象普遍或很普遍,沒有被調查者認為“大數據殺熟”現象不存在。此外,還有56.92%的被調查者表示有過被“大數據殺熟”的經歷,而網購平台、在線旅遊、網約車類移動客戶端或網站是“重災區”。

 圖源:北京市消協
圖源:北京市消協

《IT時報》記者在黑貓投訴平台輸入“大數據殺熟”,一共出現了1882條投訴信息,排在前10條的幾乎都和2021年“雙11”有關。“本人在某商城領取優惠券購買商品最終價格1349元,而用另一個不常用的賬號領取相同優惠券,最終價格1249元。主號和不常用的號最終價格相差100元”;“原價3.8元的坐墊,從購物平台的簽到頻道進去購買,同一個店鋪的同一款商品變成5.8元”。

比起價格上的顯性差異,有些“大數據殺熟”則是潛移默化的。“因為‘大數據殺熟’,所以我一直不買某自營生鮮平台的會員。”嘉嘉(化名)告訴記者,“正因為我不是會員,所以經常可以收到平台給我發放的大額優惠券,比如‘99減50’‘199減100’等。而我的同事辦了會員之後就收不到這類優惠券了,大多是會員每月領取的‘79減5’‘109減7’之類。不過,由於我使用次數增多,現在這種大額優惠券也很少收到了。”

中南財經政法大學數字經濟研究院執行院長、教授盤和林在接受記者採訪時指出:“‘大數據殺熟’是互聯網平台收集特定用戶的信息,對用戶進行畫像。比如如果你經常買奶粉,系統就給你貼上一個‘媽媽’的標籤;如果你經常買貴的奶粉,系統就給你貼上一個‘購買力強’的標籤;如果算法判定你的價格敏感度低,算法就推送較高的報價,從而抬高產品售價。這裡的關鍵是精準性,也就是‘大數據殺熟’必須是算法針對個人做出的精準報價,其前提是算法通過個人用戶的數據收集而完成對個人用戶的定位。”

對此,《IT時報》記者測試同時在某網購平台搜索“兒童鞋”,並按照價格升序排列。相比之下,年輕媽媽因為經常搜索兒童類產品,所以最低價格的鞋子為33元;而另一位記者從未搜過兒童類產品,最低價為21元,相差12元。隨後兩位記者又用“兒童舞蹈裙”關鍵詞進行了測試,得到了類似的結果,年輕媽媽得到的推薦商品更貴。

從未搜過兒童產品的用戶
從未搜過兒童產品的用戶的搜索頁面

大數據殺熟仍未絕跡 工程師:公開“黑盒”算法幾乎不可能

經常搜索兒童產品的年輕媽媽的搜索頁面

“不能說的秘密”

“大數據殺熟”的前提是通過各種渠道收集用戶數據,而技術的成熟,使得算法在互聯網行業大規模應用成為現實。

算法工程師阿石(化名)在一次算法研討會上提及:“有一次客戶提出想讓我們提高部分用戶對曾經購買過產品的回購次數,如口紅、酒等。客戶提供用戶的相關數據,讓我們定位用戶信息,給用戶做合適的推送。針對這樣的要求,我們的團隊就要考慮這樣做合不合適,要不要接單。”

某互聯網公司軟件測試工程師阿蔚(化名)告訴《IT時報》記者:“很多算法是數據互通的,尤其在屬於同一公司產品時比較明顯。說白了就是用戶被A平台搜集的數據,被B平台檢索到,B平台也能直接掌握你的喜好、習慣等,並嘗試精準推送,採集到的數據越多,推送就會越精準。”

對消費者來說,他們往往無法掌握規則,雖然質疑互聯網平台存在“大數據殺熟”行為,但又沒有明確證據。

《指引》指出,鼓勵平台經營者提供算法應用結果解釋等方式提升公眾對算法應用的理解。對於算法公開,算法從業者阿林(化名)告訴《IT時報》記者:“算法分為‘白盒’與‘黑盒’。‘白盒’算法比較直接,程序員編寫程序代碼后能夠知道輸出的結果。而‘黑盒’算法則根據獲得的數據自動升級,數據越多升級越快,一直都處於更改狀態,而最後輸出的結果程序員自己也不清楚,也不可控。相比之下,‘黑盒’算法運用更多,也很難公開。”

盤和林表示,對於平台來說,一方面擔憂算法機制泄露降低自身競爭能力,因為算法公開需要大量調出長期累積的算法數據,這也是平台技術能力的一部分;另一方面,平台也擔心算法公開后引起爭議,比如某些數據在用戶看來是很敏感的,由於恐懼隱私泄露,大多數人會選擇不要推薦。

互聯網行業自律的平衡點

“大數據殺熟”是由互聯網平台實施差異化營銷導致的。在日常生活中,我們經常會碰到這類營銷方式。比如點開一個視頻網站,系統根據用戶平時的觀看種類、時長等推薦一些影片,避免用戶在海量影庫中搜索。如果推薦影片正好用戶喜歡,用戶就願意花錢購買。這種差異化營銷既使得平台營收增加,又節約了用戶的搜索時間。

在很長一段時間裡,社會和產業對“大數據殺熟”的定義邊界並沒有那麼清晰。有的時候用戶希望獲得相關推薦;當算法推薦損害利益的時候,用戶又希望能夠通過一些手段阻止;更多的時候,“大數據殺熟”是無形的,用戶並不確定自己是否正在被殺熟。

上海申倫律師事務所律師夏海龍在接受媒體採訪時表示:“‘大數據殺熟’和差異化營銷的真實關係是一體兩面,站在企業的角度是差異化營銷,站在用戶的角度就是被殺熟。”

“算法規則的制定並不是針對具體的某個人,但算法在執行過程中可能傷害到了某些人群。”同濟大學CIMS研究中心副研究員馬雲龍認為,“‘大數據殺熟’並不是一個互聯網化的概念,但是互聯網平台利用它的壟斷地位,掌握大量的用戶數據實現利益最大化,造成的交易不公平侵害了個人消費者的權益。這次上海出台的《指引》是希望互聯網行業能夠從自律的角度去找到一個平衡點。”

《指引》更多鼓勵網絡交易平台經營者根據自身業務類型、規模大小等,建立相適應的算法應用合規管理制度,加強對算法應用的風險防控和隱患排查治理。

電子商務研究中心主任曹磊也認為:“由於數據掌握在平台手中,對於數據的處理方式外人不得而知,對於殺熟現象的規避還要依靠企業的自覺,只有平台正視大數據的價值,對其進行合理的管理與應用,才能更好地服務消費者。”

(0)
上一篇 2021-11-26 19:17
下一篇 2021-11-26 19:17

相关推荐