Như tiêu đề, e có cwarl content của mấy website khác nhưng khi lấy về xong r import vào wp thì nó lại chơi luôn 1 đường chữ thẳng hàng, ko xún dòng, các thẻ h1 h2 của nó cũng trộn vào lun, nhìn ko khác gì đống rác h làm cách nào để tinh chỉnh sao cho giống với sự sắp xếp của các website mà mình lấy vậy ạ, với hình khi lấy về thì toàn link của nó, mình phải xử lí như nào để thành link của mình vậy. Em cảm ơn Hình minh họa đây ạ
Dùng tool gì để lấy content về vậy. Có phần chỉnh sữa html sau khi lấy đó. Remove hết mấy cái html thành phần xong thay bằng <br> cho xuống dòng.
Làm 1 cái hàm, bắt đám link có trong bài viết rồi replace lại thành link mình muốn hoặc xóa luôn củng dc mà. Tool tự code thì mấy cái nầy dễ mà
Plaintext thì nó remove HTML là đúng rồi . Sài outertext đi bạn. Hoặc innert text bên trong lấy được cả nội dung nó đã rồi mình mới remove HTML replace br bằng hàm n2lbr nếu bạn sài PHP nhé.
Còn nói về phần ảnh thì quan trọng bạn lấy về làm ảnh đại diện hay ảnh trong bài . Ảnh đại diện thì bắt random 1 ảnh img trong bài rồi resize các kiểu thôi . Còn vấn đề ảnh trong bài thì bạn bắt được thẻ img lấy url ảnh file_get_contents lưu về folder mình rồi insert cái link ảnh của mình vào db thôi đơn giản mà.