Lúc trước em hay crawl content của Lazada bằng simple_html_dom (để lấy giá làm site so giá). Gần đây LZD làm web lại, có chức năng phải vượt captcha khi detect có bot crawl (không biết detect như nào). Có khi F5 trang nhiều lần bằng trình duyệt cũng hem thấy hiện captcha gì cả, nhưng chỉ cần request 1 lần đến bằng
simple_html_dom là lập tức dính captcha, thử file_get_content hay curl của php cũng bị y hệt. Có thể lzd nó check cookie hay gì đó?
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "https://www.lazada.vn/dien-thoai-di-dong");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$output = curl_exec($ch);
curl_close($ch);

Code đại ý như trên. Cần cao nhân giúp vượt captcha. Đội ơn anh em đã xem ^^