Mình có 1 site mới 03 ngày tuổi thì lượng Google Indexed là 85, Bot vào site trong 24h qua như hình sau: So sánh tương quan giữa 2 yếu tố này thì số liệu như thế vừa phải với site auto chưa? Hiện tại, mình ko ping sitemap hay làm gì cả, chỉ thông báo site với SE thôi. Ae có thể chia sẻ thông số các sites mới của ae ko?
Bác cho em hỏi bác đang dùng thống kê gì, và thông báo site với SE là gì vậy bác, em mới tập auto nên k rõ hết các tool và từ viết tắt Bác giúp em nhé
thực tế số page đã crawl và index thì có vấn đề thế này : giả sử bạn thấy số crawl là 1000, còn index mới 500, thực tế 500 còn lai nó đã cho vô list index rồi nhưng vì 1 số lý do mà nó chưa show ra, ở đây google nó không show, chư không hẳn là nó không nằm trong list user search, tức là tuy bạn thấy chưa index, nhưng khi search user nó vẫn có thể hiện ra. còn tại sao biết, thì bạn thử edit 1 số page mà bạn cho là chưa được index nhé, sau vài ngày nữa nó sẽ được show index cái mà bạn nghĩ là nó đã được index thì bạn sẽ nhạn ra rằng content meta chỗ serp nó không update mới ( nhớ dungf meta google fetch để xem preview snipper mà so sánh, hoặc xem last edit time cũng được ), mà nó đã được cập nhật vào db google ở lần crawl đầu tiên. Điều này cho thấy là google crawl và đưa vào chỉ mục index rồi, nhưng vì 1 số lý do mà nó chưa cho hiện ra thôi .
Mình có giả thuyết cho vấn đề này. Có bot google ở nhiều datacenter, quốc gia khác nhau. Mấy con bot cần có thời gian đồng bộ giữa các datacenter, nên nhiều page đã index nhưng vẫn chưa đc thống kê hết.
Ủa sao chỉ có Google Bot, chặn Bing hở @Trí Mén ? Mình cũng đã từng đoán như vậy, dữ liệu nó crawled nhưng show hay không hoặc show chậm thì tùy các yếu tố nào khác.
Cái này anh từng có 1 lần trên group FB nói rồi. Đó là cơ chế Sandbox. Vài năm trở lại đây, các ông thánh SEO hay viết bài này nọ, mọi người đọc rồi hay nghĩ Sandbox là chỉ có khi bị phạt nhưng thực ra Sandbox nó áp dụng cho mọi site. 1 site mới nó crawl xong là cho vào Sandbox để verify dần. Thằng nào pass điểm chất lượng thì nó cho ra khỏi Sandbox, khi đó sẽ thấy trên SERP nếu dùng lệnh: site:domain.com và có rank cho keyword liên quan. Khi nó crawl lại thì nó lại đánh giá tiếp. Nếu ko đạt thì cho vào lại Sandbox và nếu nhiều pages quá thì ăn manual action hay deindex tùy trường hợp. Sandbox thông thường là tính cho từng page nên rất nhiều người nói site tui bị cảnh báo sanbox mà sao vẫn có nhiều key top (search GG chắc sẽ ra 1 số thằng Tây nó bàn luận). Cơ chế này có 1 quyển sách gì đó nói khá rõ, mềnh đọc từ hồi mới vào MMO nên cũng ko nhớ