Nay kiểm tra trong webmaster tool thấy ông google báo Đã tìm hiểu - hiện không được lập chỉ mục và Đã thu thập dữ liệu - hiện không được lập chỉ...
bigdump đẻ insert file dung lượng lớn không bị lỗi
Chắc là down cái store của nó, vào xong nó bắt down tiếp app từ cái store
Em thấy site dạng này lạ này http://id.9apps.co.id về chủ đề app trên android, hình như craw từ google play Không craw bài viết vào site theo cat...
ở đây nè bác: http://cafemmo.club/threads/bi-mat-cach-tao-hang-tram-trieu-tags-cua-soi-ca.95/
Mình thấy ThacPham có hướng dẫn code tại đây: https://thachpham.com/wordpress/wordpress-tutorials/cach-lay-anh-host-ben-ngoai-lam-anh-thumbnail.html
Em mới craw một ít tag về blog wordpress của em nhưng cái theme em dùng hiển thị tag hơi cùi một chút nên mọi người có thể share em cái theme nào...
Chặn xong vài hôm có ông nữa lên forum hỏi dùng proxy để craw dữ liệu bị chặn
Lúc trước e có dùng, nó có api để upload tiện vãi ra nhưng có thời điểm trong ngày ảnh lag tung đích ko xem được
Ở đây có 1thím hướng dẫn insert vào DB wordpress rồi nè: http://cafemmo.club/threads/hoi-cach-import-bai-sieu-nhanh-vao-wordpress.717/ Còn cronjob...
để chạy cái insert ấy, mình insert từng bài chứ không insert 1 đống 1 lần
Em hay viết cái script tự động crawl rồi insert thẳng vào DB của wordpress xong thì set cronjob cho nó tự động chạy
Chắc bị lỗi mã hóa rồi, lúc tạo DB có set mã hóa Uft-8 không
Separate names with a comma.