Chả là copy nd nhà người ta, nhưng image thi bị cloudflare chặn. trước e nhớ có 1 bài nói về cái này mà quên mất. bác nào chỉ giáo em với What happened? The owner of this website (www.xxxx.com) does not allow hotlinking to that resource (/xxxxxx.jpg).
Không hiểu ý bác lắm. Bác crawler nhưng lúc tải ảnh về thì bị cloudflare chặn ?. Nếu đúng vậy thì bác thử cái này xem https://github.com/GoogleChrome/puppeteer
vâng. em diễn giải kém lắm. là em copy nguyên nd của nó về, nhưng ảnh thì bị cloudflare chặn, không hiện lên.
http://prntscr.com/np8bvl Ảnh vẫn hiện bt với mình có bị chặn đâu. Theo mình hiểu thì ảnh bạn lấy từ thằng linuxtechi. com. Thằng này nó bật chức năng ddos attack của cloudflare nên lần đầu vào sẽ bị chặn. B chỉ cần vào domain l inuxtechi. com trước rồi vào lại web kia là ok. Còn nếu b muốn crawler hay tải ảnh về thì sử dụng cái lúc trên mình đưa. Giải quyết đc hết
Cách 1: Dùng meta tag này <metaname="referrer" content="no-referrer"> Cách 2: Tạo 1 file img.php trên host với nội dung như sau: Code: <?php function _get($key) { return isset($_GET[$key])?$_GET[$key]:false; } $url = _get('url'); if(!filter_var($url, FILTER_VALIDATE_URL)) exit('Invalid url'); $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); $user_agent = empty($_SERVER['HTTP_USER_AGENT']) ? 'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0' : $_SERVER['HTTP_USER_AGENT']; curl_setopt($ch, CURLOPT_USERAGENT, $user_agent); curl_setopt($ch, CURLOPT_IPRESOLVE, CURL_IPRESOLVE_V4); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $result = curl_exec($ch); $result_mine_type = strtolower(curl_getinfo($ch, CURLINFO_CONTENT_TYPE)); curl_close($ch); header('Content-type: '.$result_mine_type); echo $result; Sau đó replace link trong bài viết thay: Code: https://www.linuxtechi.com/wp-content/uploads/2019/05/Welcome-Screen-After-Fedora30-Installation.jpg Thành Code: http://healthbeautiful.pw/img.php?url=https://www.linuxtechi.com/wp-content/uploads/2019/05/Welcome-Screen-After-Fedora30-Installation.jpg Chúc ngon miệng
E nghĩ thêm rewrite nữa thì giống như cái proxy image luôn đó anh. Cái này cấu hình trong nginx là ok. Triển khai mau lẹ nhưng bị cái ko crop, resize, roate các kiểu như proxy image . Mà cách này ko biết victim có detect ra ai lấy hình ko nữa
Crop/resize/nén image ... code thêm vài dòng nữa là ok. Victim biết chứ sao ko. Vẫn là 1 request đến host, nếu nó monitor là ra hết nhưng nói chung tụi nó ko để ý (hoặc do anh chưa crawl các site bảo vệ ảnh kỹ nên chưa thấy)
Site ít traffic chơi tạm cái này thôi. Site lớn thì dùng nginx là ngon nhất. Tuy vậy, mình vẫn ủng hộ việc lưu trữ hơn.