Các bác cho em hỏi là e dùng code php ( simple html dom ) để cwarl content từ các site khi e dùng plaintext thì content lấy về nó loại bỏ hết các html của website đó nhưng nó không giữ được cấu trúc bài của site mà mình lấy ( như hình ạ )

- đây là khi em dùng plaintext đã xóa hết các html của nó

còn đây là em ko dùng gì cả, cấu trúc thư mục của nó vẫn còn nguyên, nhưng ko loại bỏ các thành phần html ( trừ hình vì e đã lấy vào máy ạ )
- Thế bây h em phải làm gì để content lấy về vẫn giữ được cấu trúc nhưng vẫn loại bỏ đc các html ạ
E bít 1 tí về php, html vs css thì cơ bản, mong các bác giúp e ạ 🧱🧱