Em đang cần tính toán tốc độ index bài mới của 1 website thuộc 1 trong 3 case sau. 1. Site index bài mới trong 1 ngày 2. Site index bài mới trong 1 tuần 3. Site index bài mới trong 1 tháng Vậy làm sao để em gõ 1 website bất kì là biết dc nó thuộc dạng nào trong 3 case trên ạ Em đang đi theo hướng dùng cache google để kiểm tra lần bot vào cuối cùng. Nhưng có 2 vấn đề gặp phải 1. là làm sao biết được link nào là link cuối cùng dc google index nếu ko dùng google search. Vì em làm số lượng lướng vài chục ngàn site nên search google query thật sự ko hiệu quả. Cần tìm 1 hướng đi khác query dc tốt hơn 2. Nếu các website mà rất lâu rồi ko có bài mới thì tính làm sao được tốc độ index bài mới của nó Nhờ ae cho ý kiến
Hóng cao nhân. @Hoa Mãn Lâu cho hỏi tí bro: có nên dùng chính user truy cập site để ping sitemap không hả bro.
Nếu site nghiêm túc thì nên, còn site ko nghiêm túc thì nên che footprint lại. Như 4rum mình nè. Site nghiêm túc nên cứ add bằng mail chính chủ thôi
À làm công việc khác chứ ko phải về auto, nên cần tính toán thời gian index hoặc cập nhật bài viết mới nhất là bao lâu đó mà thím. Với lại cái em đang mần là với 1 site bất kì em ko có wmt thì check sao dc cụ Quay tay thì ko sao đâu, add thoải mái thôi
Dễ ợt. Nếu bác dùng IIS thì cho nó write log file vào SQL Server, sau này khi muốn search thì search trong database đó: search trên field Server Name (s-computername) + URI Stem (là domain và url của cái post của bác) compare với User-Agent nếu match googlebot là chính nó từ đó sẽ lấy được Date và Time của cái record đó, chính là lúc bot vào. Quánh index cho tốt vào là search sẽ nhanh như điện thôi mà. ================================================= W3C Logging Fields Dialog Box Use the W3C Logging Fields dialog box to select the information that you want to include in log files. This dialog box is available only when you select W3C from the Format drop-down list on the Logging feature page. Element Name Description Date (date) Logs the date on which the request occurred. Selected by default. Time (time) Logs the time, in Coordinated Universal Time (UTC), at which the request occurred. Selected by default. Client IP Address (c-ip) Logs the IP address of the client that made the request. Selected by default. User Name (cs-username) Logs the name of the authenticated user who accessed the server. Anonymous users are indicated by a hyphen. Selected by default. Service Name (s-sitename) Logs the Internet service name and instance number that was running on the client at the time that the incident was logged. Server Name (s-computername) Logs the name of the server on which the log file entry was generated. Server IP Address (s-ip) Logs the IP address of the server on which the log file entry was generated. Selected by default. Server Port (s-port) Logs the server port number that is configured for the service. Selected by default. Method (cs-method) Logs the HTTP method, such as GET, that is used in the request. Selected by default. URI Stem (cs-uri-stem) Logs the Uniform Resource Identifier (URI) that is the target of the action, such as Default.htm. Selected by default. URI Query (cs-uri-query) Logs the query, if any, that the client was trying to perform. A URI query is necessary only for dynamic pages. Selected by default. Protocol Status (sc-status) Logs the HTTP status code. Selected by default. Protocol Substatus (sc-substatus) Logs the HTTP substatus code. Selected by default. Win32 Status (sc-win32-status) Logs the Windows status code. Selected by default. Bytes Sent (sc-bytes) Logs the number of bytes that the server sent. Bytes Received (cs-bytes) Logs the number of bytes that the server received. Time Taken (time-taken) Logs the length of time that the action took in milliseconds. Selected by default. Protocol Version (cs-version) Logs the protocol version, HTTP or FTP, that the client used. Host (cs-host) Logs the host header name, if any. Note The host name that you configure for your website might appear differently in the log files because HTTP.sys logs host names by using the Punycode-encoded format. User Agent (cs(User-Agent)) Logs the browser from which the request came. Selected by default. Cookie (cs(Cookie)) Logs the content of the cookie sent or received, if any. Referer (cs(Referer)) Logs the site that the user last visited. This site provided a link to the current site.
@Gà Quay chắc thớt hỏi site ko chính chủ chứ site của mình thì dễ ợt. @Hoa Mãn Lâu search last 24h mà có index là index nhanh. Hoặc custom range. Việc site lâu rồi ko có bài viết mới thì chịu, chỉ có chủ site mới biết chứ người ngoài sao biết.
Bản thân việc check index của chính site mình đã ko ổn định rồi nên khó mà tìm ra giải pháp giải quyết được câu hỏi của thớt