WebHarvy Web Scraper: cào tự động text, image, link, email từ các website

Discussion in 'Chia Sẻ Tool & Bot' started by buiductrong, Oct 31, 2018.

?

Bạn đã sử dụng phần mềm nào tương tự WebHarvy không?

  1. Không, tôi chỉ dùng WebHarvy

    28.6%
  2. Không, tôi còn không biết có những phần mềm này

    42.9%
  3. CÓ, để tôi giới thiệu ở comment bên dưới nhe

    28.6%
  1. buiductrong

    buiductrong Tân Thủ Thôn

    Hôm nay, mình xin chia sẻ với mọi người cái tool này: WebHarvy Web Scraper

    WebHarvy có thể dễ dàng trích xuất dữ liệu từ các phần tử Text, HTML, Image, URL & Email từ các website, chỉ cần dữ liệu trên website là WebHarvy có thể trích xuất ra được, sau khi trích xuất được các dữ diệu thì phần mềm có thể lưu chúng thành định dạng cho Database hoặc Excel.
    • Cực kỳ dễ sử dụng, bắt đầu cào dữ liệu sau khi xem xong hướng dẫn dài 3 phút.
    • Hỗ trợ tất cả các thể loại website.
    • Trích xuất dữ liệu từ nhiều trang, theo chuyên mục và theo từ khoá.
    • Lên lịch cào, hỗ trợ sử dụngProxy/VPN...
    Hệ điều hành: Windows

    Phiên bản mới nhất: v5.3.0.160 (ngày 24/10/2018) (cám ơn @thitgaluoc đã share)

    Link tải phần mềm ở bên dưới:
    v5.2.0.155: https://mega.nz/#!KppzQaYZ!0m9fRiJRAitZv-PkVh1OztIc8ZJeLpcSPbRM2wGpan0
    v5.3.0.160: https://mega.nz/#!T1wyCCrK!2FnzuEXgbXNpEeCSrDhCGdr2erxnHJII1lXCbONGe-o

    Best Regards.
     
    Last edited: Nov 1, 2018
    Le Hieu, love, slowboy and 4 others like this.
  2. thitgaluoc

    thitgaluoc Trưởng Lão

    ngon, em hay dùng scrapy với requests
     
    buiductrong likes this.
  3. thitgaluoc

    thitgaluoc Trưởng Lão

    buiductrong likes this.
  4. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Quá ngon, Thanks thím :3
     
  5. Blue Dragon

    Blue Dragon Sơ Nhập Giang Hồ

    Mình từng dùng Web Harvy nh ưng hiện tải chuyển sang Content Grabber vì nó ngon hơn, tiện hơn nhất là khi cào nhiều danh mục khác nhau của một trang web (nhiều lúc chỉ cần thay link là xong). Em nó đây cho bác nào quan tâm.
    PS: Em vào forum nó out liên tục rồi k post được link nữa dù đã cách ra rồi :p
    https :// downmienphi . com/windows/download-content-grabber-premium.2110/field?field=1
     
    Dung Le and money like this.
  6. money

    money Trưởng Môn

    Không ngờ cụ còn nằm vùng ở 4r này.
    Cụ check remember password cho đỡ bị out.
     
    Blue Dragon likes this.
  7. Dung Le

    Dung Le Hương Chủ

    Mình có sử dụng thằng này nhưng đúng là mù vụ sử dụng Proxy gì đó, bác có cái cờ líp nào hướng dẫn thêm proxy vào để crawl về được không ?
     
  8. Blue Dragon

    Blue Dragon Sơ Nhập Giang Hồ

    Nằm vùng gì đâu bác ơi. Nhảy vào nhóm fb rồi biết cái này và cũng tham gia chém gió mà. Bác bận quá nên k thấy thôi :p
     
  9. Blue Dragon

    Blue Dragon Sơ Nhập Giang Hồ

    Để dùng Proxy thì làm như sau:
    1. Chuyển sang tab Agent setting
    2. Chọn Proxy source phù hợp
    3. Chọn biểu tượng như dấu cộng để cài đặt
    4. Chọn Activate (Biểu tượng như cái phích cắm điện) để kích hoạt.
    5. Done.
     
  10. buiductrong

    buiductrong Tân Thủ Thôn

    cám ơn bác đã giới thiệu, mình đã đăng một bài viết khác về nó :p
     
  11. vipkhongtin

    vipkhongtin Hương Chủ

    Thanks thớt và cụ Thịt Luộc
    Cho e hỏi có import vào wp được ko nhỉ?
     
  12. buiductrong

    buiductrong Tân Thủ Thôn

    cần chỉnh sửa lại mới import được thím nhé
     
    vipkhongtin likes this.
  13. vipkhongtin

    vipkhongtin Hương Chủ

    ví dụ chuyên mục A thì sẽ gồm các bài viết BCD.
    Trong bài viết BCD thì có bài con EFGH...
    Soft này chỉ quét đc chuyên mục và bài viết, còn bài con thì ko hoặc nếu dùng folow link thì mỗi page chỉ được 1 bài
    ko biết mình cấu hình chưa chuẩn đoạn nào. Bro nào thông cho mình phát
     
  14. vipkhongtin

    vipkhongtin Hương Chủ

    PS: anh em nào dùng WP thì nên xài scrapes nhé.
    Mình đang dùng và thấy nó hoàn hảo nhất trong số plugin cùng thể loại
     
    vansulich likes this.
  15. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Có link ko share đê thím
     
  16. vansulich

    vansulich Khách Qua Đường

    bác dùng bản nào vậy ạ? em thử vọc mà nó không chạy gì cả, cũng chả lưu lại luôn, mong bác share
     
  17. vipkhongtin

    vipkhongtin Hương Chủ

    E xài bản mới nhất
    Hỗ trợ translate
    Sorry e ko share đc vì mất tiền mua
    Lát e share bản cũ 1,3
    Còn bản mơi e sell 5$/ 1 ng ạ, mua về dùng đc nhiều website
     
  18. buiductrong

    buiductrong Tân Thủ Thôn

    mình cũng có Scrapes như bạn nói, chắc mua chung nguồn quá : ))
     
  19. vipkhongtin

    vipkhongtin Hương Chủ

    9.99$ mà bác. bán lấy gốc
    nhưng bác có công nhận là plugin này ngon ko :D
    mình thấy nó ăn đứt mấy soft này.
     
    Dung Le likes this.
  20. buiductrong

    buiductrong Tân Thủ Thôn

    cái plugin này dành riêng cho wordpress thôi, còn nếu nhu cầu của mình là cào dữ liệu để phân tích hoặc website sử dụng công nghệ khác thì cái plugin này chào thua.
    mình có dùng qua, nhưng có vẻ nó không hợp với cái VPS của mình hay sao ấy, để có thời gian mình cài lại test, hiện tại mình sử dụng plugin khác để làm nhiệm vụ giống Scrapes :)