Cách chặn crawler tương đối

Discussion in 'Thảo Luận Chung' started by Thanh Nguyen, Jun 2, 2019.

  1. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    Site mình bt lượng user direct tầm 2k / ngày. Tự dưng mấy hôm nay vọt lên ~10k/ngày. Mình nghi có thánh nào cũng đang crawler site mình. Mình chặn theo IP (1 IP nếu truy cập quá nhiều trong một thời gian ngắn thì mình sẽ block trong vòng 24h) thì nó đỡ đc 1 ngày về lại 2k sau đó thì lại đâu vào đấy. Chắc nó dùng cả list proxy rồi. Pro nào đã từng bị và có giải pháp có thể cho e chút thông tin với ạ. Thank kiu!!!
     
  2. no-reply

    no-reply Bang Chúng

    Theo ngu ý của e thì dùng cloudflare under attack {feel_good}
     
  3. Nai

    Nai MiddleMan Staff Member

    Nó crawl hết là nó nghỉ à
     
  4. sincos

    sincos Bang Chúng

    Tôi vừa bị lụt Bandwith HP suspended mẹ nó VPS. Nhưng cũng kệ, vì mình cũng là thằng crawler mà.

    Còn muốn ăn thua thì dùng như này cũng dc. Mặc dù nó thiệt mình cũng thiệt.
     
  5. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    Chính vì cùng là dân crawler nên e chỉ muốn chặn được ở mức tương đối thôi (Lưu ý là tương đối thôi. E có ghi rõ ở tiêu đề rồi nhé). Chứ nếu để vậy thì hao tf quá. Không khéo chưa hết tháng đã hết mẹ nó băng thông {beat_shot}{beat_shot}{beat_shot}
     
  6. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    Hi vọng là nó crawl xong sớm thôi cụ {big_smile}{big_smile}{big_smile}
     
  7. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    {beat_brick}{beat_brick}{beat_brick} Cách này của cụ đúng là ngu ý thật. E đã từng thử trước đây kết quả là tụt cmn cả search
     
  8. sincos

    sincos Bang Chúng

    Nếu detect dc.... thay vì chặn thì cho crawler của nó ăn bả.

    Nó fix hết hơi.
     
    Thanh Nguyen and Nai like this.
  9. RockSoft

    RockSoft Culi Manager Staff Member

    Tóm lại là 2 chú backup data rồi gởi cho mình (nhớ zip nhé)! Mình sẽ ra thông báo cho 500 ae tắt bot không cần crawl nữa. Win-win nha :)
     
  10. money

    money Hương Chủ

    Rút dây mạng + tắt nguồn điện vẫn là cách chống crawl tốt nhất đó giờ.
     
  11. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    Ý này hay này. Nhưng mà làm ntn vậy cụ. Khó nhất là khâu detect kia kìa
     
  12. Nai

    Nai MiddleMan Staff Member

    Thì thay vì chặn như bác đang làm thì bác show mấy cái bậy bạ cho nó crawl
     
  13. pipapipo

    pipapipo Sơ Nhập Giang Hồ

    bác check header, chặn hết user sử dụng proxy đi hoặc là viết đoạn code limit số lần request mỗi 5s thử xem
     
  14. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    Nhưng mà làm sao để chỉ show với mình bọn crawl mới khó bác ak. Hiện e đang chặn theo ip request nhiều trong thời gian ngắn. Cái này không đúng cho lắm
     
  15. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

  16. sincos

    sincos Bang Chúng

    Vậy mới nói kệ nó đi... nâng cấp BW lên.
     
  17. Nai

    Nai MiddleMan Staff Member

    Chặn cũng tương đối thì show cũng tương đối thôi :D
    Nếu sợ chặn nhầm user thì thêm cái captcha vô cái mớ hố lốn đó để móc ra hàng thật
     
  18. Thanh Nguyen

    Thanh Nguyen Bang Chúng

    kaka. Pro ấy crawl xong rồi thì phải {big_smile}{big_smile}{big_smile}. Hôm nay trở về bình thường rồi
     
  19. RockSoft

    RockSoft Culi Manager Staff Member

    Dm xui vãi! Vừa chém ku trên xong thì đến site mình bị từ hôm qua đến nay crawl mãi chưa xong :(

    @money @sincos tăng thread bot lên crawl nhanh nhanh giùm cái :)
     
  20. money

    money Hương Chủ

    Éo