Cafemmo Club
← Quay lại danh sách

Bắt nhập captcha khi bot crawl content

thetrue02/11/20182644 lượt xem14 bình luận
Lúc trước em hay crawl content của Lazada bằng simple_html_dom (để lấy giá làm site so giá). Gần đây LZD làm web lại, có chức năng phải vượt captcha khi detect có bot crawl (không biết detect như nào). Có khi F5 trang nhiều lần bằng trình duyệt cũng hem thấy hiện captcha gì cả, nhưng chỉ cần request 1 lần đến bằng simple_html_dom là lập tức dính captcha, thử file_get_content hay curl của php cũng bị y hệt. Có thể lzd nó check cookie hay gì đó?
 

    $ch = curl_init(); 
    curl_setopt($ch, CURLOPT_URL, "https://www.lazada.vn/dien-thoai-di-dong"); 
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
    $output = curl_exec($ch); 
    curl_close($ch);

Code đại ý như trên. Cần cao nhân giúp vượt captcha. Đội ơn anh em đã xem ^^

Bình luận

Đang tải...

Đang kiểm tra đăng nhập...

Bắt nhập captcha khi bot crawl content · Cafemmo Club