中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

為什么圖計算能正面硬剛黑色產(chǎn)業(yè)薅羊毛?

2022-07-22 13:36
來源:澎湃新聞·澎湃號·湃客
字號

原創(chuàng) 親愛的數(shù)據(jù) 親愛的數(shù)據(jù)

原創(chuàng):譚婧

全文審核專家:朱小坤

場景一:電商給新用戶的補貼,黑產(chǎn)賬戶薅走了。

場景二:每當競爭店鋪花錢打廣告,就立刻雇傭黑產(chǎn)賬戶一頓瘋狂惡意點擊,競爭店鋪在線廣告費一會就花沒了。

場景三:一個不咋地的商品,好評一千條,虛假評論誤導(dǎo)消費,我瀏覽完商品評價,都差點信了,好在兜里沒錢,買不了。

數(shù)字時代,黑色產(chǎn)業(yè)團伙就在身邊,伺機而動,假賬戶,薅羊毛,刷流量。

要像破案一樣,掌握黑產(chǎn)行動規(guī)律,得用圖計算技術(shù)。

頭部電商APP的注冊賬號可以高達四億以上,不免混入不明身份之輩,比如黑產(chǎn)操控的賬戶。

從幾億賬戶中找到“異?!辟~戶談何容易,而一個很好用的破案線索叫作“關(guān)系”。

“找關(guān)系”的本質(zhì)是在圖這種數(shù)據(jù)結(jié)構(gòu)上挖掘信息,也可以稱呼為“圖挖掘”。

黑產(chǎn)賬戶常常團伙作案,且早學(xué)會了偽裝。除了作假,黑產(chǎn)賬戶會有正常的瀏覽和購買,專門迷惑人。

可以說,這些黑產(chǎn)賬戶有智商,但不高。

它們的“智商”足以讓常規(guī)系統(tǒng)無法辨別。

如何用圖挖掘技術(shù)“找到”它們呢?

用一個想法巧妙的圖挖掘算法。

這一算法原理好比濃縮咖啡。把一大杯咖啡,濃縮成一小杯。記住“濃縮”這個動詞,很關(guān)鍵。

濃縮的過程,是把不可疑的用戶從圖里不斷移出來。

把一張全局大圖濃縮出最可疑的小圖,黑產(chǎn)控制的賬戶就藏匿在里面。

電商場景的圖里可以有很多類別的頂點,商店,商品,賬號,品牌,設(shè)備等等。

我們只選兩種頂點,一種是商品,一種是購買商品的所用的設(shè)備(手機,筆記本電腦都行)。

最開始,建一個“下單手機”和“商品”的二部圖(只含有兩類頂點的圖)。

在某個電商APP里面下過單的所有手機都以編號的形式 “畫”在圖里。

下單手機和商品之間的關(guān)系包括購買,瀏覽,收藏,加購。

第二步,引入“可疑度”來量化每個下單手機作弊的可能性。

下單手機的可疑度怎么計算呢?一臺手機下單的次數(shù)(也稱頂點入度),計算每個頂點的可疑度。

算法設(shè)計可疑度的巧妙之處,就是能分辨得出作弊和非作弊的邊界,從而找到作弊團體。

最開始的時候,圖里既有作弊的賬戶,也有正常消費者的賬戶。畢竟,作弊的人是少數(shù)。

一個用戶關(guān)心的商品占平臺商品總量的很少很少一部分,所以呈現(xiàn)出一張稀疏的二部圖。

電商的二部圖的全局規(guī)模很大,頂點數(shù)量可達到幾十億,邊數(shù)量可達幾百億。當之無愧工業(yè)級圖數(shù)據(jù)。

我們的目的,就是找到那張“邊”最密集的局部圖。

我要用一個與頂點數(shù)量無關(guān)的量來刻畫最后的結(jié)果。就好比,液體濃度和盛液體的容器沒有關(guān)系。

不斷刪除可疑度最低的頂點。相當于,在不斷地濃縮可疑度的濃度。

第三步,再用貪心算法的思路,動態(tài)刪除最小可疑度頂點。

于是,可疑度小的頂點被一一刪除,留下那些可疑度大的頂點。

這個圖挖掘算法叫啥名字?

這是Fraudar算法,來源于2016年的KDD會議,是美國卡耐基梅隆大學(xué)克里斯托·法拉特(Christos Faloutsos)教授團隊論文,并獲得了當年的最佳論文獎。

圖計算正面硬剛黑產(chǎn)薅羊毛的行動還在繼續(xù),隨之而來的是圖深度學(xué)習(xí)技術(shù)的燦然一新。

作弊手法絕不會一成不變,F(xiàn)raudar算法不能抓到所有的黑產(chǎn)賬戶。

Fraudar算法只用到了圖結(jié)構(gòu)的信息,還有更多信息沒有用起來。

有的賬戶頻繁切換IP,頻繁切換手機的操作系統(tǒng)等等,這些都是逃避”抓捕“的異常行為。

加入特征,用圖深度神經(jīng)網(wǎng)(比如GraphSAGE)做分類任務(wù),區(qū)分“好人”“壞人”,這樣就能找到更多黑產(chǎn)賬號。

最后,多輪分析和驗證,證明抓出來的賬戶是黑產(chǎn)賬戶,以免誤傷好賬號。

圖深度學(xué)習(xí)一種強有力的工具,用于反黑產(chǎn)時,像一面照妖鏡。

能把圖深度學(xué)習(xí)用得好的企業(yè),那都是高手。根據(jù)親愛的數(shù)據(jù)可靠消息,你手機里的那些知名的APP,淘寶,支付寶,京東商城,小紅書等等都在使用這一技術(shù)。

(完)

全文審核專家:

 

最后,再介紹一下主編自己吧,

我是譚婧,科技和科普題材作者。

為了在時代中發(fā)現(xiàn)故事,

我圍追科技大神,堵截科技公司。

偶爾寫小說,畫漫畫。

生命短暫,不走捷徑。

個人微信:18611208992

還想看我的文章,就關(guān)注“親愛的數(shù)據(jù)”。

原標題:《為什么圖計算能正面硬剛黑色產(chǎn)業(yè)薅羊毛?》

閱讀原文

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋