Fuzzy K-fürtözés Mahout-ban

Ez a blog bemutatja a Fuzzy K-Means csoportosítását az Apache Mahout-ban.



A Fuzzy K-Means pontosan ugyanaz az algoritmus, mint a K-mean, ami egy népszerű egyszerű klaszterezési technika. Az egyetlen különbség az, hogy ahelyett, hogy csak egy klaszterhez rendelne pontot, valamiféle homályosság vagy átfedés lehet két vagy több fürt között. Az alábbiakban bemutatjuk a Fuzzy K-Means leírását:



  • A kemény fürtöt kereső K-Means-szal ellentétben, ahol az egyes pontok egy-egy klaszterhez tartoznak, a Fuzzy K-Means a puhább klasztereket keresi az átfedés érdekében.
  • Egy puha klaszter egyetlen pontja több klaszterhez is tartozhat, bizonyos affinitási értékkel az egyes pontok felé.
  • Az affinitás arányos az adott pont és a klaszter centroid távolságával.
  • Hasonlóan a K-Means-hoz, a Fuzzy K-Means olyan objektumokon is működik, amelyeknek meg van határozva a távolságméret, és amelyek a n- dimenziós vektortér.

Fuzzy K-Means Map Csökkentse az áramlást

Nincs sok különbség a MapReduce K-Means és a Fuzzy K-Means áramlása között. Mindkettő megvalósítása Mahout-ban hasonló.

php mysql_fetch_

Következik a alapvető paraméterek a Fuzzy K-Means megvalósításához:



  • A bevitelhez vektoradat-készletre van szükség.
  • A kezdeti k klaszterek beágyazásához a RandomSeedGeneratornak kell lennie.
  • A távolságméréshez a SquaredEuclideanDistanceMeasure szükséges.
  • A konvergenciaküszöb nagy értéke, például –cd 1.0, ha a távolságmérés négyzetértékét használták
  • A maxIterations értéke alapértelmezett értéke -x 10.
  • A normalizációs együttható vagy a fuzziness factor, -m 1,0-nél nagyobb értékkel

Van egy kérdésünk? Említse meg őket a megjegyzések részben, és mi kapcsolatba lépünk Önnel.

különbség a felülbírálás és a túlterhelés között a java-ban

Kapcsolódó hozzászólások



java-nak van egy kapcsolata

Felügyelt tanulás az Apache Mahout-ban