hỏi về tối ưu Sitemap tốt nhất để bot index web nhanh

Discussion in 'Thảo Luận Chung' started by JOHN YTB, Apr 20, 2022.

  1. JOHN YTB

    JOHN YTB Sơ Nhập Giang Hồ

    mn cho e hỏi cái này với

    về sitemap , site e site truyện tận 660k link
    nên tối ưu sitemap như nào cho hiệu quả index nhanh

    gồm [ 20k link truyện quan trọng ]
    640k link chapter nằm trong link truyện rồi
    giờ sitemap e nên gửi chỉ 20k link truyện đó thôi nó có index nhanh hơn không hay gửi full 660k link lun nhỉ

    do trong từng link truyện nó có chứa các link chapter của bộ truyện đó
    bot google nó vô link truyện sẽ index các url chapter có trong link truyện đó
    nên e nghĩ là cho các link chapter đó vô sitemap ko cần thiết sẽ bị giảm tốc độ index do số lượng url quá lớn
    e nên cho full 660k link vô sitemap lun hay là chỉ 20k link truyện chính đó nhỉ mn ?

    cách nào thì sẽ tối ưu cho sitemap giúp index nhanh hơn

    chứ hiện tại thì 660k link nếu giải nén file ra thì tổng nặng 100MB , còn nén rồi thì tổng chỉ 5MB sitemap
    sitemap Chia làm tầm 250 file nhỏ (.xml.gz) mỗi file chứa 2500 link

    với mn cho hỏi làm cách gì cho index nhanh giờ
    số lượng link lớn nó index chậm quá , mặc dù traffic search tầm 10k 1 ngày rồi , nhưng index vẫn chậm rì , làm cách nào cho nó index nhanh giờ ngoài ADS/gg news
    search traffic nhiều r ko cần chạy ADS chi nữa chả có tác dụng

    Mn giúp e phát
     
  2. congloi

    congloi Sơ Nhập Giang Hồ

    theo em thì bác submit full link (660k), làm sitemap là để giới thiệu url cho gg biết, tại sao phải đợi nó cào qua 20k link truyện rồi chờ nó quét rồi index thêm chapter?
    mỗi sitemaps tối đa 50k link mà, 660k link thì tầm 14 cái sitemaps là xong.

    Còn nhanh hay chậm thì hỏi thằng gg á, cái nớ chịu :)
     
  3. JOHN YTB

    JOHN YTB Sơ Nhập Giang Hồ

    ụa cái tối đa 50k link là file nhỏ [ .xml.gz ] trong sitemap mà bác
    e bỏ 660k link vô 1 sitemap gửi lên search console vẫn dc

    này thì mỗi file .xml.gz e chỉ bỏ 2k5 link vô thôi , ko đạt max 50k

    do 660k quá nhiều link và nặng quá nên không biết làm như nào cho tối ưu tốt , chứ bỏ full 660k link vô vẫn dc mà
     
  4. congloi

    congloi Sơ Nhập Giang Hồ

    ý bác là sao hè. ở trên bác nói 50k link ở file nhỏ .gz, ở dưới bác bảo chỉ bỏ 2k5 link?

    sao ko bỏ luôn 50k link vô file .gz đó, rồi làm cái sitemap index list 14 link .xml.gz ra.

    hay ý bác là khác nữa.

    cả chuẩn sitemaps và google đều bảo ko quá 50k url trong cùng 1 file mà bác bỏ 660k url trong 1 file thì đòi nó index sao cho nhanh
     
  5. firefox

    firefox Bang Chúng

    dễ lắm, bạn làm 2 site, 1 site để 20k, site kia để 660k :D
     
  6. Nai

    Nai MiddleMan Staff Member

    đó giờ mình toàn để 500 link post/tag cho 1 sitemap thôi nhỉ. Tương tự sitemap tổng cũng để 500 link, nếu nhiều hơn cho nó gọi cái index_sitemap2 ở cái url thứ 500
     
  7. JOHN YTB

    JOHN YTB Sơ Nhập Giang Hồ

    ý là 660k mình để trong 1 url sitemap
    trong đó chia ra 250 file nhỏ .xml.gz ý

    cái 50k là bảo giới hạn 50k url này là nói giới hạn ở trong file .xml.gz phải ko

    1 file .xml.gz mình chỉ bỏ 2k5 link thôi và tổng 250 file
     
  8. kenyc

    kenyc Tân Thủ Thôn

    E thấy yahoo để file chính kiểu này:

    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
    <loc>https://answers.yahoo.com/sitemaps/sitemap-us-2006-00.xml.gz</loc>
    <lastmod>2019-08-26T04:52:46Z</lastmod>
    </sitemap>
    <sitemap>
    <loc>https://answers.yahoo.com/sitemaps/sitemap-us-2006-01.xml.gz</loc>
    <lastmod>2019-08-26T04:52:46Z</lastmod>
    </sitemap>
    <sitemap>
    <loc>https://answers.yahoo.com/sitemaps/sitemap-us-2006-02.xml.gz</loc>
    <lastmod>2019-08-26T04:52:46Z</lastmod>
    </sitemap>
    <sitemap>
    <loc>https://answers.yahoo.com/sitemaps/sitemap-us-2006-03.xml.gz</loc>
    <lastmod>2019-08-26T04:52:46Z</lastmod>
    </sitemap>
    ...

    Mỗi file con nó để tầm 50k link.
     
  9. money

    money Hương Chủ

    Để vậy đúng rồi.
    Cái file chứa 250 file nhỏ gọi là sitemap index
    File nhỏ chứa các link bài viết gọi là sitemap
    Mỗi file sitemap index hay sitemap đều được tối đa 50K links. Như vậy tổng link trong 1 website theo sitemap là 2 tỉ rưỡi.
    Từ đầu đến cuối thớt này ai nói cũng đúng mà không dùng thuật ngữ chung nên hiểu sai ý của nhau.
     
    JOHN YTB likes this.
  10. JOHN YTB

    JOHN YTB Sơ Nhập Giang Hồ

    ok tks bác
     
  11. leonardo_17

    leonardo_17 Tân Thủ Thôn

    E có hơn 30k posts ném sitemap cho gồ (chia nhỏ sitemap 1000link/ cái), đợi cả tháng rồi nó ko chịu index cho đây =_=, mới quét tầm vài trăm là dừng