Cách kiểm tra site victim có bài post mới bằng php

Discussion in 'Hỏi Đáp Kỹ Thuật' started by lqhoang1910, Jan 14, 2020.

  1. lqhoang1910

    lqhoang1910 Tân Thủ Thôn

    E có 1 vấn đề là ngoại trừ content họ đã post thì khi họ post bài viết mới làm sao mình xác định được bằng php các bác nhỉ. Hiện tại e dùng html dom parser để lấy content của họ, có trường ngày tháng nhưng định dạng nó khác với kiểu DATE trong mysql, nếu muốn so sánh ngày tháng để lấy post mới thì phải có bước chuyển ngày tháng của post mới theo định dạng của databse mình, rồi so sánh nếu ngày post của họ lớn hơn thì mới lấy.
    Còn cách nào tối ưu hơn ko các bác nhỉ.
     
  2. Dang

    Dang Bang Chúng

    Tùy theo cấu trúc mỗi trang, thường thì mình lưu lại url hoặc id của post.
     
  3. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Thím có thể lấy cái danh sách mới nhất title bài viết của nó xong so sánh trong db của mình. Qui cả 2 ra md5 xong so củng dc
     
  4. thanh858036

    thanh858036 Sơ Nhập Giang Hồ

    get lưu lại id rồi kiểm tra thôi
     
  5. Lanh Đồng

    Lanh Đồng Trưởng Môn

    Cái này vẻ muốn làm giống như Báo Mới đây @Hoa Mãn Lâu lộ skill ta thịt
     
  6. wpresources

    wpresources Bang Chúng

    Theo mình thay vì cố so sánh thời gian,trang bạn sắp xếp theo ngày thì nên làm kiểu sau
    +Thêm trường md5 cho url để tiện check trùng
    +Khi đọc từ trang crawl bắt đầu nếu url đã tồn tại thì dừng chương trình lại.
    Đợi đến thời gian cần crawl lần sau,như vậy bạn sẽ lấy được bài viết mới nhất
     
  7. I Love Php

    I Love Php Bang Chúng

    mình thường làm là lưu lại url đã crawl
     
  8. lqhoang1910

    lqhoang1910 Tân Thủ Thôn

    Với trang ko có id post thì e lấy url rồi chuyển thành md5 như bác @Hoa Mãn Lâu rồi ạ. Cảm ơn các bác