Mam wygenerować 1e6 wektorów 1000 wymiarowych i użyć na nich prostego k-means, dzieląc dane na 1000 grup. Moje algorytmy działają, ale na tak dużych danych nie przechodzą. Sparse matrices nie pomagają.
Obliczanie odległości zajmuje za dużo czasu. Co robić? Da radę usprawnić?
PS. oczywiście mogę przybliżyć wynik nie obliczając wszystkich danych. Pytanie brzmi, czy da radę usprawnić to w przypadku ogólnym.