Nêu sử dụng gi để fake IP khi crawl dữ liệu?

Discussion in 'AutoBlog' started by Nguyen Tuan Anh, Dec 26, 2017.

  1. Nguyen Tuan Anh

    Nguyen Tuan Anh Khách Qua Đường

    Cả nhà cho mình hỏi giờ muốn crawl 1 website mà cứ 30-40 cái là hiện captcha, giờ muốn fake IP liên tục thì nên sử dụng gi: SSH, proxy, VPN....
    Thank nhiều
     
  2. Nai

    Nai MiddleMan Staff Member

    Mình chua dùng ssh bao giờ. Nhưng thấy dùng proxy khá dễ. Bỏ 10$ ra mua 1 gói 10IP dùng 1 tháng, mà cứ 30=40 cái hiện cái captcha thì chắc bác mua gói 1000$ mới may ra đủ dùng.
     
    Vito_King and Nguyen Tuan Anh like this.
  3. thetrue

    thetrue Sơ Nhập Giang Hồ

    Proxy mua ở trang nào vậy bác Nai. Rồi dùng tool để đổi hay đổi trong code luôn?
     
  4. Nai

    Nai MiddleMan Staff Member

    http://instantproxies.com/
    Mình dùng curl, đổi trong code luôn.
     
    Vito_King and thetrue like this.
  5. Nguyen Tuan Anh

    Nguyen Tuan Anh Khách Qua Đường

    SSH thì rẻ nhưng chất lượng không được tốt lắm