Chào các bác, em đang tập tành làm autoblog, thấy mọi người kể làm cả trăm site nghe khủng quá Vì hiện tại em đã code lấy data và đăng bài cho 1 trang đã khá tốn thời gian, vì cấu trúc site nguồn khá khác nhau, chưa kể cùng 1 chủ đề thì có nhiều site nguồn và các site đó rất là khác nhau nên để code đẩy về trang của mình cũng khá tốn thời gian. Rồi upload source lên web, chỉnh logo, site title các kiểu cho từng site nữa. Không biết các bác có cách gì đỡ thủ công hơn không ạ? Em thắc mắc ở chổ, về số lượng site, như trên thì em đã có sẵn dữ liệu bài viết cho 1 trang rồi, các bác làm trang tiếp theo mà cùng nội dung thì chỉ cần thay tên miền và cơ sở dữ liệu đó luôn hay lại tiến hành spin lại tiếp và lại thêm vào một cơ sở dữ liệu khác nữa, tức là 2 site thì 2 domain rồi và 2 database thậm chí là 2 code luôn ạ, vậy thì có cách nào cho nhanh không ạ? Các bác làm cả trăm site có phải là cả trăm site cùng nội dung (mỗi trang có xào nấu một ít nhưng vẫn là cùng nội dung không ạ???) Hay là cả trăm site mà lại trăm nguồn dữ liệu và trăm nội dung khác nhau???
Quay tay hết không có cách nào nhanh hoen được. Muốn nhanh thì chỉ có code sao cho nó nhanh. Ví dụ PHP thấy chậm thì chuyển C# hoăc Python cho nhanh. Chỉ có vậy thôi Còn vấn đề thứ 2. Nếu chung chủ đề thì 1 db 1 source host tầm vài chục site vậy cho nó nhanh. Mình đưa ra 2 cái vậy thôi còn thớt chờ mấy cao nhân lên giải thích tiếp
Cấu trúc khác nhau thì phải mất thời gian code là đúng rồi. Để giảm thì nên suy nghĩ lấy sao cho tối ưu. Ví dụ chỉ lấy các thông tin chung giống nhau. Hay lấy từ site có 1 cấu trúc thống nhất cho nhanh. Hoặc chỉ lấy từ GG/Bing như mình để đỡ code parse html riêng. Việc làm 1 db cho N sites hay 1 site là do cách nghĩ và làm database mà ra. Ví dụ cùng 1 công bỏ ra crawl âmazon (vì cấu trúc amz giống nhau cho mọi page), tạo 1 site cũng dc mà tạo mỗi category 1 site cũng được ( vậy là có N sites) Việc làm N db khác nhau (N nguồn dữ liệu khác nhau như bạn hỏi) để tạo 1 site hay N sites cũng là do cách mỗi người tự nghĩ. Mình biết nhiều bạn crawl hàng chục site gốc và mỗi site gốc tạo vài db con, mỗi db con là 1 web. Nhưng mình thì lại gom hết vào 1 db cho 1 site. Điển hình là ngày xưa mình làm danh bạ công ty cho toàn nước Mỹ (crawl yellow pages và manta hay site gì đó ko nhớ chính xác) nhưng bạn mình nó làm danh sách công ty luật ở cali là 1 site, danh sách công ty bảo hiểm ở newyork là site khác (nó chia nhỏ db ra) Còn spin hay không cũng là do cách mỗi người. Cá nhân mình hầu như rất ít spin.
híc, đúng là anh em mình thông nhau quá =)) em mỗi niche 1 sql 1 sql = 1 web hoặc 1 sql = n web hoặc n sql = 1 web
lí tưởng nhất là làm sao mỗi trang auto đều có nội dung khác nhau, để google nó tìm thấy footprint thì die hết cả đám.
Làm auto site chỉ để làm cảnh thôi anh. Nhiều pro auto kéo traffic từ facebook mà, đâu cần index gì đâu. Hóng trend rồi cứ 1 bài đi spam khắp facebook thì y như là tháng đó lên vài triệu traffic, bật qua tab source toàn từ facebook. Nhìn mà ghanh tỵ