Làm Sao Tìm Tất Cả Những Website Dùng Chung Mã Nguồn?

Discussion in 'Hỏi Đáp Kỹ Thuật' started by AkuVn, Apr 29, 2020.

  1. AkuVn

    AkuVn Hương Chủ

    Như gợi ý của 1 bro thì em có biết tới trang này: https://builtwith.com

    Nhưng ko biết làm sao để trả lời được câu hỏi "Làm Sao Tìm Tất Cả Những Website Dùng Chung Mã Nguồn?"

    Rất mong các cụ có kinh nghiệm chỉ điểm!
     
  2. 2ndCapricorn

    2ndCapricorn Sơ Nhập Giang Hồ

    Dùng GG dork tìm đặc điểm riêng chỉ có trên mã nguồn đó. Ví dụ tìm site WP thì gõ:
    Code:
    inurl: /wp-content/
     
    wpresources likes this.
  3. AkuVn

    AkuVn Hương Chủ

    Giả sử như những site giống medium thì sao? Những site giống Blogspot thì tìm kiểu gì?
     
  4. 2ndCapricorn

    2ndCapricorn Sơ Nhập Giang Hồ

    Bạn thử tìm nhưng điểm giống nhau giữa 2 site blogspot coi, mình không dùng nên không rõ.
     
  5. AkuVn

    AkuVn Hương Chủ

    Tức là view source 2 site blogspot xong tìm điểm chung ạ?
     
  6. 2ndCapricorn

    2ndCapricorn Sơ Nhập Giang Hồ

    Kiểu như vậy, bạn có thể tìm hiểu về cách tìm kiếm nâng cao với GG tại đây: http://www.googleguide.com/advanced_operators_reference.html
    Cố gắng tìm hiểu về cấu trúc url của loại mã nguồn đang muốn tìm, hoặc là những câu nào được lặp lại trong các trang chung mã nguồn.
     
    AkuVn likes this.
  7. Dang

    Dang Bang Chúng

    Tìm tất cả thì khó, mò footprint cần nhiều yếu tố kết hợp. Theo kinh nghiệm ít ỏi của em thì có thể kết hợp "mò" theo 1 số cách :
    - Tìm theo tên theme ở chân trang (phần nhiều với Wordpress)
    - Blogger thì tìm theo "powered by blogger".
    - Tìm theo cấu trúc url chung của 1 số mã nguồn.

    * Ngoài ra bác có thể truy cập publicwww[.]com và tìm 1 đoạn mã html. Trang này em kiểm tra thấy khá hay đối với các site EN, còn site VI cũng tương đối. Bản trả phí của nó thì đầy đủ hơn.

    * Còn tìm theo chủ site thì có thể kết hợp với publicwww hoặc tìm theo ID của Google Analytic (nhớ bỏ các ký tự từ dấu trừ phía sau) hoặc ID của Gà.

    Tạm thời em nhớ bấy nhiêu đó ...
     
    AkuVn likes this.
  8. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    HÌnh như nó dùng bot để craw các site về rồi đọc mã nguồn và tìm footprint trên đó. Nhưng củng có % nó detect sai như hồi xưa site của Thạch Phạm nó detect ra none wp do lão ấy mod lại khá nhiều, rp nó mới sửa lại ấy