Help: Phân loại sản phẩm vào danh mục

Discussion in 'Hỏi Đáp Kỹ Thuật' started by longhcm, Jan 23, 2021.

  1. longhcm

    longhcm Sơ Nhập Giang Hồ

    Mình có file .csv khoản 1.000.000 sản phẩm nhưng danh mục thì loạn cả lên, có cái có danh mục, có cái không có danh mục. Danh mục thì không giống phân chia như danh mục của mình.
    Giờ có cách nào phân chia hay nhận dạng sản phẩm để sắp xếp vào danh mục nhanh và đúng không.
    Mình làm tay mất 3 ngày rồi chưa xong (1 ngày 8h).
     
  2. dkmvkl

    dkmvkl Sơ Nhập Giang Hồ

    Excel thì cứ filter rồi lọc dần thôi
     
  3. Định Phong Ba

    Định Phong Ba Khách Qua Đường

    Tạo một danh sách danh mục(dm).Đọc file cái nào chưa có danh mục thì đọc thông tin liên quan trong mô tả hay tiêu đề có từ nào là giống với dm thì cập nhât.Không có lưu riêng ra làm thủ công.Mà với hình thức cập nhật kiểu này thì nên lưu sql hay hơn csv
     
  4. Nai

    Nai MiddleMan Staff Member

    Nếu được thì cũng tương đối thôi thớt ơi. Theo mình nghĩ danh mục thì phải chính xác, cái nào không có danh mục bác cho nó vào 1 danh một others thôi.
    Mình cũng gặp trường hợp như vậy, nhưng sản phẩm mấy trăm k ai rảnh đâu mà lọc tay, nên breadcrumb 1 là không để cho các sản phẩm như vậy, còn 2 là random cho khỏe, đỡ mệt óc :D.
    Còn trường hợp thứ 3 nếu sản phẩm ko quan trọng mình xóa luôn để lần sau curl lại thì cập nhật.
     
  5. Cháu dì Sáu

    Cháu dì Sáu Bang Chúng

    longhcm likes this.
  6. longhcm

    longhcm Sơ Nhập Giang Hồ

    Qua đó xem chút bị ngáo luôn.
    Có cái gì đơn giản dễ hiểu hơn không?
    --- Double Post Merged, Jan 28, 2021, Original Post Date: Jan 26, 2021 ---
    Run mấy cái code đó sao không thấy cái nào xài được, toàn lỗi không.
     
  7. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Pác cần học 1 ít về mấy cái máy học hoặc đủ nhạy mới xài dc mấy cái tool đó
     
  8. longhcm

    longhcm Sơ Nhập Giang Hồ

    Giờ học và làm không biết lúc nào xong.
    Bác nào làm được inbox mình cái giá với.
    (Chỉ nhận dang text: title và desc để ra category)
     
  9. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Up thử lên demo 10-20 cái title và desc ae xem thử có khi có người nhận làm đó cậu
     
  10. longhcm

    longhcm Sơ Nhập Giang Hồ

    Cái này thuộc dạng machine learning. python cực mạnh xử lý cái này.
    --- Double Post Merged, Feb 3, 2021, Original Post Date: Jan 29, 2021 ---
    Link đây có mẫu luôn
    htt[1]ps://github.com/shashank31mar/Product-Classification
    ht[1]tps://github.com/gallib2/product-categorization
     
  11. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Xài 2 cái link trên là done dc job của cụ rồi phải ko?
     
  12. longhcm

    longhcm Sơ Nhập Giang Hồ

    Một trong 2 cái
     
  13. firefox

    firefox Bang Chúng

    bác có sample tầm 100 sp không ạ, nếu không ngại thì hộp kín em nghịch thử. Em có làm qua vài cái tương tự về classification nhưng bên xử lý ảnh, c# .netcore
     
  14. longhcm

    longhcm Sơ Nhập Giang Hồ

  15. firefox

    firefox Bang Chúng

    data này không cần train đâu bác, mapping bình thường là được rồi, tốn tầm buổi sáng
    mà cũng lạ, file train không có category còn file test lại có nhỉ :D
     
  16. longhcm

    longhcm Sơ Nhập Giang Hồ

    Vậy là xong rồi phải không ?
    --- Double Post Merged, Feb 5, 2021, Original Post Date: Feb 4, 2021 ---
    Theo mình hiểu:
    - File train là file cần làm
    - File test là để máy học
    - Sau khi máy học thì tạo ra file kết quả.
    Vì vậy file train nó không có category vì đó là cái cần làm.
    Còn kết quả chính xác bao nhiêu % là do thuật toán và file test quyết định.
    --- Double Post Merged, Feb 19, 2021 ---
    Có AE nào làm được cho mình xin cái giá nhé.
     
  17. Hoa Mãn Lâu

    Hoa Mãn Lâu Trưởng Môn

    Món này chắc ít ae nghiên cứu, có làm thì đa phần theo nhu cầu cá nhân nên chưa chắc là có thể giúp dc thớt