close

本文章中所有內容僅供學習交流,不可用於任何商業用途和非法用途,否則後果自負,如有侵權,請聯繫作者立即刪除!

隨着技術的不斷演變,大廠也是不斷的更新風控策略,讓爬蟲工程師們頭疼不已。並發沒幾分鐘,全掛了,都不知道是哪裡的問題,比較搞心態。

風控的全稱應該是風險控制,為了解決和預防將要發生,或者可能發生的一些危險情況,從而減輕損失。

看了惜老關於風控的文章,受益匪淺,鏈接:

https://bbs.pediy.com/thread-273838.htm

以及這篇文章:

https://bbs.pediy.com/thread-273759.htm

我也和 風和自由 聊了下關於風控對抗的思路,整理成文檔,供大家參考:

1.風控還好,只要沒有行為識別就簡單

2.需要保證對單個線程的環境乾淨

3.ip最好是自建,因為有能識別代理的防水牆,然後賬號也有辦法,比如郵箱註冊就自建郵箱服務器,批量註冊賬號等。

4.現在風控第一輪基本上是刷代理,指標高你一個都進不去,低的,同段代理一起來就可以識別其他請求是否為機器人

5.第二輪就是客戶機環境,第三輪就是行為檢測

6.第三輪通過他們的數據模型判定是不是機器人,還有記錄你的行為樣本給機器學習。這兩個步驟是同步的。

7.代理有一個很好鑑別的辦法,你請求過去,ipv4正常來說普通用戶現在都沒有外網地址,如果他們的風控指標高的話,同段ip超過一定數量,他們會對這個ip段進行端口掃描。數量超過百分之多少,整段拉黑。然後恰好,運營商開外網給vps的代理,都是整段開,這整段必然是代理。然後不管怎麼撥號,這個地區本來就只能在這個段內來回橫跳,不能超出去,然後時間久了,自然就全部拉稀。

8.基本上在代理上面這些風控花的心思太多了

9.一般風控都是玄學,他可能知道你是機器人,然後他不會立馬給你弄死,他只是讓你搶不到東西,其他一切正常,讓你產生錯覺。

10.外面那些人為啥說老號容易搶,其實不是老號容易搶,是因為老號有行為軌跡,有白名單,能少過幾層風控。

11.從開發的角度來講,每個網站的數據上報,經過數據清洗,最終就會整合同步到每個防護上面。只是看同步時間是多久,但是毋庸置疑他們是共享的

12.風控就是結合實際情況猜出來的,基本保證每個指標的乾淨,就沒啥問題,除了行為檢測,其他的都不智能,都是硬指標

13.風控是經驗的累積,跟技術無關,反正風控就是一句話,你要保證能讓服務端知曉的一切信息,都要保證他們的合理性

14.你提交的鼠標軌跡不僅要進ai模型,還要入庫,每次你提交過去都會對比,不做干擾要百萬條才行。就是在裡面插抖動和回退,每次取出來都做,然後做等比縮放或者放大。當然,還有其他的干擾項,比如時間差值等。

某個做過風控大佬揭露的秘密:

1.現在很多風控 其實是沒有風控,採用的都是隨機拒絕的策略。

2.風控部門的利益一般和公司運營的指標是衝突的,只關心如何安慰客戶少被投訴。

歡迎大家繼續補充,有不對的地方還請指出。


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()