Như title, em có chút vấn đề hỏi các bác, ai biết chia sẻ em chút keyword em research nhé, thử kmean cluster mà có vẻ không đúng. Đại loại em có bài toán thế này key1 có các number n1, n2, n3 ... n(n) key2 có các number n1, n2, n3 ... n(n) key3 có các number n1, n2, n3 ... n(n) . . . key(n) có các number n1, n2, n3 ... n(n) với key1 ... key(n) là chuôi hash n1, n2, ... n (n) là number dạng xx.yy ví dụ 10.01, có thể trùng nhau. Cái em cần là muốn mô hình đối tượng để tìm ra chỗ tập trung nhiều nhất dãy number. Ví dụ key1 thì num 10.00-14.00 là xuất hiện nhiều nhất. key2 thì 13.00 - 14..00 key3 thì 11.00 - 14..00 . . . key(n) thì .... Em có thể trích được ra chuỗi num 13-14 là tầng xuất nhiều nhất từ chuỗi input ban đầu Với nhu cầu bài toán vậy thì dùng gì để làm hả các bác
"chỗ tập trung nhiều nhất dãy number" ==> không hiểu lắm. Bác cho ví dụ cụ thể để minh hoạ được không?
ví dụ có rồi mà, Ví dụ key1 thì num 10.00-14.00 là xuất hiện nhiều nhất. key2 thì 13.00 - 14..00 key3 thì 11.00 - 14..00 . . . key(n) thì .... /////// nói đơn giản là chỗ giao nhau đấy, nhưng có n-key thì không chắc sẽ có giao nhau hết, nhưng chỗ giao nhau lớn nhất cũng được, ví dụ chuỗi number 10-15 là chỗ giao nhau của (n-m) key cũng được, với xác suất các số 10-11-12-13-14-15 xuất hiện nhiều nhất khu đó
Thuật toán clustering thì phải có tiêu chí trước mới có thuật toán tương ứng để áp dụng. Điển hình là cần theo số cluster hay bán kính. Kiểu như tìm ra bao nhiêu cluster có mật độ cao nhất (vượt 1 ngưỡng nào đó) hoặc trong bán kính R=5 thì tìm ra cluster có mật độ cao nhất. Bài toán này có lẽ dùng density based model clustering thì phù hợp hơn. Giống như tìm heatmap. Mathlab có thư viện sẵn để làm.
Mà nói chung, dân auto ko nên giải quyết bài toán tổng, tốt nhất nên giải quyết bài toán cụ thể sẽ nhanh và dễ hơn nhiều (trừ khi thớt đang làm luận văn về vấn đề này ) Bài toán cụ thể thì cứ nói thẳng ra yêu cầu --> tìm cách giải quyết cho 1 mình nó, không cần thuật toán, không cần lý thuyết. Như vậy vừa dễ mà đỡ tốn công suy nghĩ.
cái này không liên quan auto anh, liên quan về game, em đang cần mô hình hóa lại xác suất number để coi độ freq của nó rơi vào chỗ nào