Hỏi về cách tìm kiếm sản phẩm giống W So Sánh

Discussion in 'AutoBlog' started by Nam, Aug 25, 2017.

  1. Nam

    Nam Sơ Nhập Giang Hồ

    Chào các bác! Chắc các bác cũng biết tới 1 auto site Nghiêm túc đó là websosanh (WSS)

    Có 1 số vấn đề em chưa biết, mong các bác cho ý tưởng.
    (Dấu cộng Xanh là đã làm được, mong có cao kiến tối ưu hơn. Dấu cộng đỏ là chưa làm đc, hoặc làm chưa tốt, mong nhận thêm cao kiến)

    + Việc cào dữ liệu như họ, thì em nghĩ cũng đơn giản, đa số các bác đều rành. (Hoặc import csv, hoặc crawl từ từ về)

    + Việc cấu trúc, bố trí bảng cột thì nghĩ cũng đơn giản gồm Tên SP, link đến, giá, hình ảnh (Cái này tải file csv về import 1 phát là xong)

    + Việc xây dựng website: có vẻ hơi lâu nhưng cũng như trang bán hàng thông thường

    + Việc tối ưu làm sao 10 triệu sản phẩm và load vẫn nhanh > Bác nào có cao kiến làm sao lưu 10triệu mà bấm trang nào ra trang nấy. Bấm chuyên mục nào thì list ra vài triệu sản phẩm trong 1 nốt nhạc.
    Lưu và index thế nào để load nhanh như vậy, bác nào biết không ạ.
    *** Em đang dùng cách cổ điển: "chuyen_muc":123 và index cột này. Khi bấm vô chuyên mục thì lấy hết sản phẩm ra thôi

    + Việc tìm kiếm đưa ra các gợi ý: Gõ iphone 7 ra danh sách các từ khóa có thể tìm kiếm mà bạn muốn. Các bác có thể cho em từ khóa hoặc mô hình/ quy trình nào đó để làm cái này không ạ.

    Giải pháp của em: Hay dùng trò tự tạo keyword của bác @Sói http://cafemmo.club/threads/bi-mat-cach-tao-hang-tram-trieu-tags-cua-soi-ca.95/

    [​IMG]

    + Việc tìm kiếm Full text search trên ô tìm kiếm của trang WSS:
    Khi chúng ta thử tìm "iphone 7" thì họ sẽ Nhóm lại đc các sản phẩm gần giống nhau được cho là iphone 7 và

    hiện kết quả Nhóm: iphone 7 đen 32GB có 16 nơi bán, iphone 7 nhám 32GB có 12 nơi bán,

    [​IMG]

    => Các bác có cao kiến gì để nhóm sản phẩm được như vậy không. Có nhiều ốp lưng, sạc cáp cũng có từ khóa iphone 7, mà sao họ ưu tiên điện thoại lên trước, gom nhóm lại. Vì mỗi trang cào dữ liệu có tên sản phẩm khác nhau, họ nhóm lại GẦN GIỐNG tên thôi.

    *** Giải pháp của em: Dùng k-means để phân nhóm dựa vào tên. Hoặc mấy cái kỹ thuật Data Mining

    + Việc tạo tag thì bác @Sói đã chia sẻ rồi :D http://cafemmo.club/threads/bi-mat-cach-tao-hang-tram-trieu-tags-cua-soi-ca.95/

    Xin cảm ơn các bác
     
    Last edited: Aug 25, 2017
  2. Nai

    Nai MiddleMan Staff Member

    Mình nghĩ ko đơn giản là 1 mình bác có thể làm được.
    Mà thôi lót dép hóng chơi vậy {boss}
     
    Nam likes this.
  3. Nam

    Nam Sơ Nhập Giang Hồ

    Các vấn đề dấu cộng màu xanh là em đã làm được :D hoặc có hướng làm.
    WSS lấy nhiều trang quy mô lớn, em làm quy mô nhỏ ở lzd, tiki adr, lotte, aeon :D
    Em muốn từ cơ bản lên nâng cao ạ :D
     
  4. Nai

    Nai MiddleMan Staff Member

    Nếu vậy thì đúng là 1 người coder làm được
     
  5. gu gồ

    gu gồ Administrator Staff Member

    Bao Nam hình như đang chơi accesstrader à ?
     
    Nam likes this.
  6. Wowwow

    Wowwow Tân Thủ Thôn

    Chấm {boss}
     
  7. Nam

    Nam Sơ Nhập Giang Hồ

    Bác lôi tên em nhanh thế =)) Cái gì em cũng chơi hết, có xiền là chơi :)) VN chơi với hasoffer, masoffer, accesstrade, ở nước ngoài thì chơi như các bác hay chơi :d cj, shareasale đồ.
     
  8. gu gồ

    gu gồ Administrator Staff Member

    ko cần sáng tạo, clone nó
     
    Nam likes this.
  9. Nam

    Nam Sơ Nhập Giang Hồ

    em ham học hỏi, làm auto site nghiêm túc mờ bác =))))))))))))
     
  10. money

    money Hương Chủ

    Định chỉ nhưng mà nghĩ lại nếu chỉ thì chắc 2 năm nữa pé thớt cũng ko ra dc site nào, còn nếu ko chỉ may ra pé ấy làm đại cái site rồi quẳng lên có khi lại kiếm ra tiền. Thôi tốt nhất im lặng.
     
    Nam likes this.
  11. Nam

    Nam Sơ Nhập Giang Hồ

    Cảm ơn bác :D em có vài site con, chạy ngách, mỗi site tầm 1M product, đang đẻ tiền cho em mỗi ngày. Do Em muốn phát triển hơn, làm 1 trang lớn để đời, tập trung chuyên tâm làm đàng hoàng thôi ạ.
    Mong bác chiếu cố, cho em từ khóa cũng đc :D

    P/s: Em có cập nhật giải pháp hiện tại của em, em nghĩ nó chưa tốt :d nên mong các bác có cao kiến giúp em mở rộng kiến thức :D
     
    Last edited: Aug 25, 2017
  12. gu gồ

    gu gồ Administrator Staff Member

    ^^
    <?php echo "Silence is golden"; ?>
     
  13. dinhthangbkvn

    dinhthangbkvn Khách Qua Đường

    Việc nào dễ thì làm trước nhé. Xong cái khó làm sau. H ngồi nghĩ cái khó thì không bao giờ xong đâu.
     
    Nam likes this.
  14. Nam

    Nam Sơ Nhập Giang Hồ

    Dạ cảm ơn bác :D em làm nhiều site rồi :D tất cả đều sinh ra tiền rồi ạ. Em muốn làm site lớn lớn kiếm nhiều hơn thôi ạ :D
     
  15. dinhthangbkvn

    dinhthangbkvn Khách Qua Đường

    Nam likes this.
  16. Nam

    Nam Sơ Nhập Giang Hồ

    Mấy cái kia, ví dụ ô search suggest cũng từ cái vụ gom nhóm kia show ra thôi :D

    Vậy ý tưởng của em là dựa vào tên, từ đó chia ra các nhóm giống nhau, lưu vào 1 bảng riêng:

    ví dụ
    key = iphone . value = 21,7,4,2
    key = plus, value = 21,4,2,9,12
    key = iphone plus . value = 21,4,2

    Từ đó kết quả tìm kiếm là tìm kiếm vô cái bảng đã nhóm sẵn như thế này. mà 10 triệu sản phẩm thì cái bảng này chắc cũng to dữ lắm.

    Ý tưởng em có được không :D
     
  17. dinhthangbkvn

    dinhthangbkvn Khách Qua Đường

    Thông thường với hệ thống này họ sẽ không xử lý dữ liệu realtime mà xử lý dữ liệu theo batch.
    VD với trường hợp này với title mình xử lý "nhặt" ra các keyword chính
    "iphone", "7s", "128G"
     
    Nam likes this.
  18. Nam

    Nam Sơ Nhập Giang Hồ

    nhưng vẫn có lưu cụm từ: "iphone 7s", "iphone 128G", "7s 128G", đúng không bác để tìm kiếm :D chứ họ search iphone 7s mà ra chỉ iphone (có ip4, ip5) chắc chết :D
    Chắc bảng này to lắm bác nhỉ.
    Cuối ngày chạy 1 lần
     
  19. Yang Long

    Yang Long Khách Qua Đường

    Kinh....tài giỏi cỡ nào chưa biết nhưng nói chuyện nghe kinh voãi linh hồn.... :). Tránh ra cho bạn thể hiện nào (y).
     
  20. dinhthangbkvn

    dinhthangbkvn Khách Qua Đường

    Ah mình đang nói tới việc chọn các từ khóa để mapping cùng 1 sản phẩm được bán từ các store khác nhau. Tiêu chí từ khóa là nó có nghĩa khi đứng 1 mình. với các đánh từ khóa này thì nó ít hơn số sản phẩm rất nhiều. VD 10.000.000 sản phẩm thì chắc cần khoảng 10k từ khóa. :D