mình lấy site người ta.

Discussion in 'Hỏi Đáp Kỹ Thuật' started by hoangvn92.it, Aug 10, 2018.

  1. hoangvn92.it

    hoangvn92.it Sơ Nhập Giang Hồ

    Chào các bác,

    mà bị cloudflare 5s "Checking your browser before accessing" giờ làm sao lách qua cái này dc nhỉ ?

    cám ơn các bác nhiều <3
     
  2. xmenvn2510

    xmenvn2510 Moderator + MiddleMan Staff Member

    site của bạn hay của ai. của bạn thì vào tắt cái security đi. Để là off. Ah của ng ta thì có cách đó.
     
  3. hoangvn92.it

    hoangvn92.it Sơ Nhập Giang Hồ

    site của người ta chứ. :( mình đi lấy site ng ta mà giờ bị cái này
     
  4. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Thím xài cái gì để query tới, mỗi cái sẽ có cách bypass khác nhau
     
  5. hoangvn92.it

    hoangvn92.it Sơ Nhập Giang Hồ

    mình dùng c# dùng HtmlAgilityPack.

    nhưng mình nghĩ nếu khó quá. thì dùng php đưa lấy site người ta về dạng HTML kiểu "view-source" á rồi bóc tách
     
  6. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Nếu dùng C# thì có thể đọc bài nầy, http://cafemmo.club/threads/crawl-site-dang-dung-cloudflare.825/ có chỉ cách bypass bằng 1 thư viện thứ 3 giả lập js đó, Thím có thể thử gg thêm. KO dùng php để lấy dc đâu, vì phải có cookies gen từ javascript rồi mới show content html, nên curl chịu chết thôi
     
    hoangvn92.it likes this.
  7. mylovehg

    mylovehg Tân Thủ Thôn

    thím làm 1 vòng lặp while, khi nào title của nó ko còn là title của cloudflare nữa thì thoát vòng lặp rồi bóc tách html để lấy data thôi