E cần thuê người cào dữ liệu

laogiavn · Oct 15, 2022

E đang cần thuê người cào dữ liệu cho 1 vài site e cần yêu cầu bypass cloudflade
inbox hoặc telegram @bamamvoz e gửi site

noenmo · Oct 15, 2022

Thấy bác này hỏi khá nhiều trên forum nhưng hình như vẫn chưa tìm được giải pháp thì phải
bác xem qua topic này xem có giải quyết được vấn đề của bác không?
https://cafemmo.club/threads/lay-du-lieu-cua-site-bao-ve-boi-cloudflare.3256/page-2

--- Double Post Merged, Oct 15, 2022, Original Post Date: Oct 15, 2022 ---

demo cho bác một giải pháp như video bên dưới là em crawl nettruyen

Và giới thiệu với bác một số thư viện xử lý việc bypass cf
+ python: cfscrape
ex:
Code:
import cfscrape
scraper = cfscrape.create_scraper()
a=scraper.get("https://www.nettruyenme.com/truyen-tranh/dai-quan-gia-la-ma-hoang-219482").content
print(a)
+ php: Em search trên github thì thấy nhiều mà chưa thử thằng nào, bác thử xem
Code:
https://github.com/IhsanDevs/cloudflare-bypasser
https://github.com/GuardIran/CloudHound
node thì em thấy hình như là rất nhiều thư viện hỗ trợ nhưng theo kiểu headless nó không tiện cho multithreads lắm, bác có thể tham khảo các thư viện kiểu như puppeteer
bác nên tham khảo qua một số topic trên forum, có rất nhiều chia sẻ liên quan đến vấn đề này rồi.
Chúc bác vượt cf thành công

sincos · Oct 15, 2022

@noenmo các thư viện kia out-of-date hết rồi bác.

laogiavn · Oct 16, 2022

e tìm đc rồi nhé cảm ơn ae

noenmo · Oct 17, 2022

sincos said: ↑

@noenmo các thư viện kia out-of-date hết rồi bác.
Click to expand...

mình không dùng python nhưng cái lib python mình test vẫn ok mà nhỉ

takeda · Oct 17, 2022

Mình thì cào không dùng headless mà qua cái API không quá phổ biến của Cloudflare, cũng dùng mấy năm nay rồi chưa thấy bị fix gì cả, cái khổ là cứ 1 tháng phải cho nó query tạo lại API key mới, so với headless chắc là tiện hơn vì headless bản chất là mở cả cái Chrome to bự ra cào, nặng vãi.

huvo6789 · Oct 17, 2022

takeda said: ↑

Mình thì cào không dùng headless mà qua cái API không quá phổ biến của Cloudflare, cũng dùng mấy năm nay rồi chưa thấy bị fix gì cả, cái khổ là cứ 1 tháng phải cho nó query tạo lại API key mới, so với headless chắc là tiện hơn vì headless bản chất là mở cả cái Chrome to bự ra cào, nặng vãi.
Click to expand...

API nào thế bác ơi. bác có thể share ko? e đang cào 1 web mà đang vướng Cloudflare. dùng cfscrape thì không gắn proxy được

Thị Nở · Dec 22, 2022

các bác có cách nào để bypass cf mới không.
Em đang dùng headless, cũng tắt đủ option rồi nhưng mà ăn CPU ko chịu được

Log in or Sign up

E cần thuê người cào dữ liệu

laogiavn Sơ Nhập Giang Hồ

More Threads in same category

noenmo Sơ Nhập Giang Hồ

sincos Bang Chúng

laogiavn Sơ Nhập Giang Hồ

noenmo Sơ Nhập Giang Hồ

takeda Khách Qua Đường

huvo6789 Tân Thủ Thôn

Thị Nở Tân Thủ Thôn

Log in or Sign up

E cần thuê người cào dữ liệu

laogiavn Sơ Nhập Giang Hồ

More Threads in same category

noenmo Sơ Nhập Giang Hồ

sincos Bang Chúng

laogiavn Sơ Nhập Giang Hồ

noenmo Sơ Nhập Giang Hồ

takeda Khách Qua Đường

huvo6789 Tân Thủ Thôn

Thị Nở Tân Thủ Thôn

Useful Searches