Em đang học làm auto bằng selenium. Em đang xài chromedriver và chrome phiên bản mới nhất. Mà thấy nó chậm với tốn tài nguyên quá. Bác nào rành tư vấn giúp em là nên xài version nào để chạy nhẹ, ổn định với. Với cả làm cách nào để fake giống người nhất. ví dụ http header, UA, click random.... Em cảm ơn trước
Thằng Puppeteer so với Imacros thì thằng nào hiệu năng hơn các bác. E chạy thấy Imacros chạy lâu cũng chậm vãi luôn. Nó tốn Ram quá
Chắc Puppeteer thôi, thằng này hiện tại là nhanh nhất rồi, nó chạy k cần bật trình duyệt thì sẽ nhẹ hơn các dạng imacros.
mình đang chạy selenium headless chrome driver. chạy 80 thread trên con vps 4 core, 8G ram mà hay bị scrash quá. Muốn kiếm cái nhẹ để chạy được nhiều thread hơn
Mấy pé crawl cái gì mà phức tạp vậy? Laptop anh chạy 100 thread để crawl google với 10 proxies trên 1 line internet Viettel. Chưa bao giờ lăn tăn.
em làm auto view chứ ko phải craw. làm click chuột, lăn lên lăn xuống các kiểu. Đang xài selenium chromedriver mà thấy nặng quá.
phải hiểu dc bản chất muốn bơm site thì cần thông tin gì, đừng làm mò mà mất time, làm như thật làm này kia.. làm ai xem, làm cho hệ thống nào tracking..
Mình có vài app với selenium, hồi đầu cũng hay bị đơ và khi crash tạo ra rất lắm rác tràn cả ổ cứng. Sau này hết. Điểm cơ bản là theo mình bạn không nên dựa hẳn vào selenium để lấy thông tin, ví dụ nếu bạn viết code kiểu var elements = seleniumDoc.Elements là sẽ đơ, khả năng là selenium sẽ load toàn bộ elements vào bộ nhớ. Thay vào đó theo mình bạn nên dùng kết hợp với một API phân tích html nào đó khi cần lấy thông tin, ví dụ với .net có thể dùng htmlAgilityPack. Như vậy khi cần lấy thông tin của một element nào đó trước hết bạn lấy html source từ selenium, sau đó load vào htmldocument của htmlAgilityPack và từ đó tách thông tin. Chỉ khi nào bạn cần thao tác của browser, thí dụ click một thành phần nào đó thì bạn mới dùng selenium cùng với một selector nào đó - mình hay dùng XPath, để click đúng thành phần đó. Mình thử theo phương pháp này và thấy chạy hiệu năng nói chung là ổn, nhưng mình chỉ test trên 1 thread duy nhất. Tuy nhiên việc ngụy tạo selenium thành người dùng thì theo mình ko khả thi đâu, nó giống như đuổi theo bóng ma vậy