Tình hình là em đang muốn sử dụng API này https://data.similarweb.com/api/v1/data?domain=github.com nhưng bị chặn bởi captcha nếu request liên tục (ảnh bên dưới). Đã thử sử dụng puppeteer nhưng puppeteer cũng lúc được lúc không. Mong các bác giúp đỡ chứ em hơi gà mờ vụ này.
À mình cũng có thử dùng proxy chạy bằng Tor nhưng không được nên không biết sử dụng private proxy khác có được không
Tor chỉ chạy ba cái vớ vỉn thôi chứ mấy thằng ngon ngon nó chặn Tor hết rùi. Nếu dùng proxy của Tor mà cào ngon thì mấy thằng bán proxy phá sản hết rùi bạn
Ra vậy! Để mai mình thử mua của stormproxy coi sao . --- Double Post Merged, Oct 14, 2021, Original Post Date: Oct 14, 2021 --- Ps : đã thử stormproxy cũng vẫn phát xịt phát được
Stormproxy bạn xài gói nào? Residental nó mới cho tỉ lệ thành công cao nhất nhé. Proxy ngon là cho tỉ lệ thành công cao hơn chứ ko có cái nào thành công 100% đâu. Ngoài ra, nếu bạn dùng proxy chỉ để cào thì có mấy service API chỉ dùng cho cào, giá rẻ hơn dạng đa dụng như Stormproxy, search "scraper proxy" ra cả đống.
À mình đang dùng gói 59$ dedicated proxies của nó. Do yêu cầu nên mình đang dùng trực tiếp thành ra ưu tiên tốc độ và ổn định. Nếu dùng mấy dạng scraper proxy thì chắc tốc độ không được cao lắm nhỉ ?