Thống kê về Pages Crawled và Indexed

Discussion in 'Thảo Luận Chung' started by command, Oct 20, 2017.

  1. command

    command Bang Chúng

    Mình có 1 site mới 03 ngày tuổi thì lượng Google Indexed là 85, Bot vào site trong 24h qua như hình sau:
    [​IMG]

    So sánh tương quan giữa 2 yếu tố này thì số liệu như thế vừa phải với site auto chưa?

    Hiện tại, mình ko ping sitemap hay làm gì cả, chỉ thông báo site với SE thôi.

    Ae có thể chia sẻ thông số các sites mới của ae ko?
     
  2. saivnn

    saivnn Tân Thủ Thôn

    Bác cho em hỏi bác đang dùng thống kê gì, và thông báo site với SE là gì vậy bác, em mới tập auto nên k rõ hết các tool và từ viết tắt
    Bác giúp em nhé
     
  3. Trí Mén

    Trí Mén Moderator Staff Member

    site 8 ngày nè bác gà, index 500-600. Wordpress nó tự ping cho em.
    upload_2017-10-20_17-6-27.png
    upload_2017-10-20_17-7-10.png
     
  4. automan

    automan Hương Chủ

    thực tế số page đã crawl và index thì có vấn đề thế này :

    giả sử bạn thấy số crawl là 1000, còn index mới 500, thực tế 500 còn lai nó đã cho vô list index rồi nhưng vì 1 số lý do mà nó chưa show ra,

    ở đây google nó không show, chư không hẳn là nó không nằm trong list user search, tức là tuy bạn thấy chưa index, nhưng khi search user nó vẫn có thể hiện ra.

    còn tại sao biết, thì bạn thử edit 1 số page mà bạn cho là chưa được index nhé, sau vài ngày nữa nó sẽ được show index cái mà bạn nghĩ là nó đã được index thì bạn sẽ nhạn ra rằng content meta chỗ serp nó không update mới ( nhớ dungf meta google fetch để xem preview snipper mà so sánh, hoặc xem last edit time cũng được ), mà nó đã được cập nhật vào db google ở lần crawl đầu tiên. Điều này cho thấy là google crawl và đưa vào chỉ mục index rồi, nhưng vì 1 số lý do mà nó chưa cho hiện ra thôi .
     
    Nai likes this.
  5. Trí Mén

    Trí Mén Moderator Staff Member

    Mình có giả thuyết cho vấn đề này. Có bot google ở nhiều datacenter, quốc gia khác nhau. Mấy con bot cần có thời gian đồng bộ giữa các datacenter, nên nhiều page đã index nhưng vẫn chưa đc thống kê hết.
     
  6. Nai

    Nai MiddleMan Staff Member

    Không ngờ bác để ý đến từng chi tiết như vậy.{adore}
     
  7. command

    command Bang Chúng

    Ủa sao chỉ có Google Bot, chặn Bing hở @Trí Mén ?

    Mình cũng đã từng đoán như vậy, dữ liệu nó crawled nhưng show hay không hoặc show chậm thì tùy các yếu tố nào khác.
     
  8. Trí Mén

    Trí Mén Moderator Staff Member

    ko có chặn bác ơi, tại tự nó ko vào biết làm sao :|
     
  9. money

    money Hương Chủ

    Cái này anh từng có 1 lần trên group FB nói rồi. Đó là cơ chế Sandbox. Vài năm trở lại đây, các ông thánh SEO hay viết bài này nọ, mọi người đọc rồi hay nghĩ Sandbox là chỉ có khi bị phạt nhưng thực ra Sandbox nó áp dụng cho mọi site. 1 site mới nó crawl xong là cho vào Sandbox để verify dần. Thằng nào pass điểm chất lượng thì nó cho ra khỏi Sandbox, khi đó sẽ thấy trên SERP nếu dùng lệnh: site:domain.com và có rank cho keyword liên quan.
    Khi nó crawl lại thì nó lại đánh giá tiếp. Nếu ko đạt thì cho vào lại Sandbox và nếu nhiều pages quá thì ăn manual action hay deindex tùy trường hợp.
    Sandbox thông thường là tính cho từng page nên rất nhiều người nói site tui bị cảnh báo sanbox mà sao vẫn có nhiều key top (search GG chắc sẽ ra 1 số thằng Tây nó bàn luận).
    Cơ chế này có 1 quyển sách gì đó nói khá rõ, mềnh đọc từ hồi mới vào MMO nên cũng ko nhớ :D
     
    nhat.itsuper and Nai like this.
  10. command

    command Bang Chúng

    Hình chụp từ Cloudflare, SE = Search Engine.

    Bác ko có submit site với Bing à?
     
  11. Trí Mén

    Trí Mén Moderator Staff Member

    ko bác.
    Hôm qua em submit thử thì nó vào thật rồi
    upload_2017-10-21_21-40-57.png
     
  12. thetrue

    thetrue Sơ Nhập Giang Hồ

    ủa hình bot này thống kê ở G.analytics hả bác?
     
  13. Trí Mén

    Trí Mén Moderator Staff Member

    cloudflare đó bác
     
  14. command

    command Bang Chúng

    Haha, thêm cả đóng traffic nữa rồi hớ :)