Hỏi về cách tìm kiếm sản phẩm giống W So Sánh

Discussion in 'AutoBlog' started by Nam, Aug 25, 2017.

  1. DuyNK

    DuyNK Khách Qua Đường

    Ahihi... Bác nóng quá! Bác ấy chắc trình master nên mới phán thế! gà gà ai nói zậy! {bye}
     
  2. TNA90

    TNA90 Sơ Nhập Giang Hồ

    Ôi dào các bạn cứ nghĩ cao siêu làm gì.
    + Cái nhóm sản phẩm theo store đơn giản là nó kiểm tra những sản phẩm có tên giống nhau thì cho vào làm 1 thôi. Các bạn cứ để ý, tên sản phẩm hầu hết các store đều để giống nhau, nên trong mớ vài chục database từ các shop thì việc có nhiều sp tên trùng lặp là đương nhiên. Cứ thế mà nhóm vào 1.
    + Cũng có thể nó ko lấy tên trùng 100% mà có xây dựng công thức tính nào đó, kiểu thấy sản phẩm tên giống nhau đến 99% thì coi là 1.
    + Mà mình cá là bọn wss này nó làm hẳn 1 database đã nhóm tên sản phẩm rồi, trong đó có sẵn thông tin các shop nào bán, giá cả,vv.... Khi nào search thì chỉ query trong cái database đó thôi. Chứ để lúc search mới bắt đầu query để lọc nhóm sp thì chết.
    + Bọn wss này nó nó gửi đơn tới các đơn vị cộng tác, muốn sản phẩm đc hiện lên web của nó thì các bên phải cung cấp database sản phẩm cho nó. Từ các database này wss nó tự xây dựng các database con dùng cho các mục đích của web. Khi đó việc load query sẽ nhanh hơn nhiều do database sau khi đọc lọc nhỏ hơn nhiều so với gốc.
    VD: tổng database raw có 30tr sp từ các shop khác nhau, trung bình mỗi sp có 5 shop bán thì sau khi lọc sẽ chỉ còn 6tr sp thôi. Khi query search theo tên sp thì kết quả có được sẽ có sẵn thông tin có bn shop cùng bán rồi nên load sẽ nhanh hơn.
     
    Nam likes this.
  3. Sói

    Sói Administrator Staff Member

    Ôi tại hạ vô cùng xin lỗi vị huynh đài này. Tất cả là do cái tính của tại hạ hay đùa giỡn nên vô tình làm huynh đài nóng mắt, mong huynh đài bỏ quá cho ạ. Và cũng mong huynh đài giúp đỡ tại hạ trong việc quản lý forum bằng cách hãy comment vui vẻ, đừng khích bác nhau làm gì mất vui vì nói thật là tối qua đi nhậu vitamin Gâu Gâu, 2 thằng uống hết 4 chai Vodka Men Sheriff (1 chai lớn và 3 chai nhỏ - kỉ lục đó giờ), hiện tại vẫn còn đang lơ mơ và đang nóng máu phết đấy {brick}{brick}{brick}

    @Nam tặng thớt tấm hình làm động đực nhưng anh vẫn giữ quan điểm là anh không chỉ đâu :D Mấy cái đó làm dc hết nhưng theo anh thì đừng làm. Rảnh thì scale up cái đám site và đám data đang có, kiếm tiền nhiều hơn.
    products.png
     
    Nam likes this.
  4. Nai

    Nai MiddleMan Staff Member

    {big_smile}{big_smile} Lần sau lấy acc @money comment như thế này cho nó ngầu anh. Làm vậy ai vào sau nghĩ có 2 đại cao thủ, nhưng thực chất là 1. Làm vậy lộ hết {beauty}
     
    Nam likes this.
  5. Sói

    Sói Administrator Staff Member

    Quên không "KHOE" là tốc độ query trong hình trên được thực hiện trên máy Core i7 dòng chip U nhé, và dùng ổ SSD.
    Note luôn cho ai chưa biết: chip U là 1 loại chip tồi tệ nhất trên đời và sau cái máy này (lỡ mua rồi, ko có tiền mua máy khác :( ) mình sẽ ko bao giờ mua máy nào chip U nữa. Nên nếu trên lap mình còn query như thế thì lên server đảm bảo nhanh hơn nhiều.
     
    Nam likes this.
  6. Sói

    Sói Administrator Staff Member

    Kakaka tại 1 mình đóng hai vai nhân vật, nhân vật nào cũng diễn sâu nên quên mất đang đứng ở vai diễn nào
     
    Nam likes this.
  7. dinhthangbkvn

    dinhthangbkvn Khách Qua Đường

    I cần tối ưu sao cho chạy câu query trên với DB 12M sản phẩm nhanh hơn của bác Sói thì inbox nhé. :D
     
    Nam likes this.
  8. gu gồ

    gu gồ Administrator Staff Member

    Bụt trên toà sao gà mổ mắt kakaka
     
    Nam likes this.
  9. money

    money Hương Chủ

    Câu query đó là 125 mili giây, tối ưu xuống còn 25 mili giây cũng đâu có ích gì vì con người ko cảm nhận dc khác biệt của 0.1 giây đâu. Mình cũng là dân coder nên hiểu cái "bệnh hoàn hảo" đó lắm, mãi mới bỏ được :D
     
    Nam likes this.
  10. Nai

    Nai MiddleMan Staff Member

    em ko phải coder nhưng bệnh này đúng là gây tốn thời gian thật anh à =.=. Nếu mà biết nữa chắc làm 1 site 1 tháng chưa xong =))
     
    Nam likes this.
  11. chungmatdo

    chungmatdo Khách Qua Đường

    thấy bảo websosanh có mấy trăm nhân viên nhập liệu.
    em nghĩ các bác nên craw thẳng thằng websosanh về vì nó đã làm cho mình hết rồi.
     
    Nam likes this.
  12. console

    console Bang Chúng

    @money đồng quan điểm là không nên bâu vào mấy cái này tốn thời gian công sức và tiền bạc ;) tốt nhất ném thăng data lên và đi chăm sóc cái mặt cho đẹp trai là được
     
    Nam likes this.
  13. Nam

    Nam Sơ Nhập Giang Hồ

    Cảm ơn bác :D
    Em cũng đang có ý tưởng là nếu 2 tên giống 80% thì gom vào 1 group hihi :D
    Em cũng có 1 shop online. Hổm bữa wss cũng liên hệ, hợp tác, họ cung cấp 1 đoạn code đặt trên host mình. Sau đó họ sẽ tự động lấy sản phẩm từ api họ đặt ở đó. Mỗi tháng trả tiền cho họ để sản phẩm mình lên top của wss :))
     
  14. Nam

    Nam Sơ Nhập Giang Hồ

    Cảm ơn bác đã chỉ giáo :D

    Product dữ thật :)) 12M mà query vèo vèo

    Khi em lên 5M ~10M là thấy nó hơi chậm chậm.

    còn ở ngưỡng dưới 5M em không lo lắm

    [​IMG]

    Chắc do máy cùi, ram 4GB, nâng ram lên là lại chạy nhanh.

    Cảm ơn lời khuyên của bác. Em vẫn tối ưu và đẩy mạnh web hiện tại. Có thời gian nghiên cứu thêm cái này. Vì em yêu khoa học, thích cái mới hihi :D
     
  15. Nam

    Nam Sơ Nhập Giang Hồ

    dạ, em đã hiểu ý bác :D ke ke
    để em chơi liều mạng thử xem . thấy 10k từ hơi ít :p vì em nghĩ còn có cụm từ nữa :D
     
  16. money

    money Hương Chủ

    Tốc độ query ngon như vậy còn lo gì nữa
     
    Nam likes this.
  17. Nam

    Nam Sơ Nhập Giang Hồ

    12M mà query như bác @Sói mới khủng kìa :D em có 2 triệu mới vậy chứ lên trên 5M là điên điên ngay :D hihi :D
     
  18. money

    money Hương Chủ

    À, tại ko thấy total records :D Nhưng mà cứ vã usd vào là nhanh ngay ấy mà. Con WSI mình xài 30$/tháng ssd 240gb, ram vs cpu ko nhớ là nhanh hơn như trên khá nhiều.
     
    Nam likes this.
  19. PhuongPhi

    PhuongPhi Tân Thủ Thôn

    Em có
    Documents: 18,334,649
    Primary Size: 22.0GB
    Query time
    Query Total: 79,944,669
    Query Time: 21:58:28
    Vậy là nhanh hay chậm vậy hở các bác, tính tới tính lui thấy kì kì.
    Edited: 0.000378819s /query
    Nãy tính nhân thêm *24 thấy chậm ghê. Query có sorting và paging
     
  20. Gà Quay

    Gà Quay Bang Chúng

    À thì ra sói & money là 1 người. Clone nick gồi, admin đâu thả chó tiễn khách!