Chào các bác, hiện tại mình có 1 target site, theo db nó ghi là có 11 triệu record. Các record này gồm cả tiếng Anh lẫn các tiếng "Em" khác. Giao diện site chỉ có khung search, khi search thì chỉ ra max 100 item cho 10 trang, cái này nó có api nên crawl khá sướng. Có vấn đề là không biết làm sao lấy hết được data của nó. Nếu xài char list abc , kết hợp tối đa 3 char là sẽ được khoảng 18000 keyword, query hết số này về site target thì chỉ lấy được tầm 1 triệu. Còn thiếu khá nhiều. Khi search thử 1 word lạ ra cả data tiếng Thái À Site index Google 5M, Organic 90% Các bác có cách nào hay suggest em với.
Split content đã crawl của nó ra các words rồi quẳng vào search tiếp chứ chơi kiểu ghép chữ abc, abd ... nhiều cái ko ra kết quả đâu em, phí công.
Tìm theo search khả năng tìm hết theo em là không có.Thay vì mất công ghép từ anh chuẩn bị một danh sách từ khóa có sẵn(nên dùng database hơn dùng file) đọc theo Em cũng từng thấy một trang kiểu api search tương tự share cùng cho vui ạ contextualwebsearch.com