Hierarchisches Clustering (scipy.cluster.hierarchy)#

Diese Funktionen schneiden hierarchische Clusterings in flache Clusterings oder finden die Wurzeln des Waldes, der durch einen Schnitt gebildet wird, indem die flachen Cluster-IDs jeder Beobachtung bereitgestellt werden.

fcluster(Z, t[, criterion, depth, R, monocrit])

Bildet flache Cluster aus dem hierarchischen Clustering, das durch die gegebene Linkage-Matrix definiert ist.

fclusterdata(X, t[, criterion, metric, ...])

Cluster-Beobachtungsdaten unter Verwendung einer gegebenen Metrik.

leaders(Z, T)

Gibt die Wurzelknoten in einem hierarchischen Clustering zurück.

Dies sind Routinen für agglomeratives Clustering.

linkage(y[, method, metric, optimal_ordering])

Führt hierarchisches/agglomeratives Clustering durch.

single(y)

Führt Single-/Min-/Nearest-Linkage auf der kondensierten Distanzmatrix y durch.

complete(y)

Führt Complete-/Max-/Farthest-Point-Linkage auf einer kondensierten Distanzmatrix durch.

average(y)

Führt Average-/UPGMA-Linkage auf einer kondensierten Distanzmatrix durch.

weighted(y)

Führt Weighted-/WPGMA-Linkage auf der kondensierten Distanzmatrix durch.

centroid(y)

Führt Centroid-/UPGMC-Linkage durch.

median(y)

Führt Median-/WPGMC-Linkage durch.

ward(y)

Führt Ward's Linkage auf einer kondensierten Distanzmatrix durch.

Diese Routinen berechnen Statistiken über Hierarchien.

cophenet(Z[, Y])

Berechnet die kophänetischen Distanzen zwischen jeder Beobachtung in dem hierarchischen Clustering, das durch die Linkage Z definiert ist.

from_mlab_linkage(Z)

Konvertiert eine von MATLAB(TM) erzeugte Linkage-Matrix in eine neue Linkage-Matrix, die mit diesem Modul kompatibel ist.

inconsistent(Z[, d])

Berechnet Inkonsistenzstatistiken auf einer Linkage-Matrix.

maxinconsts(Z, R)

Gibt den maximalen Inkonsistenzkoeffizienten für jeden Nicht-Singleton-Cluster und seine Kinder zurück.

maxdists(Z)

Gibt den maximalen Abstand zwischen beliebigen Nicht-Singleton-Clustern zurück.

maxRstat(Z, R, i)

Gibt die maximale Statistik für jeden Nicht-Singleton-Cluster und seine Kinder zurück.

to_mlab_linkage(Z)

Konvertiert eine Linkage-Matrix in eine MATLAB(TM)-kompatible.

Routinen zur Visualisierung von flachen Clustern.

dendrogram(Z[, p, truncate_mode, ...])

Plottet das hierarchische Clustering als Dendrogramm.

Dies sind Datenstrukturen und Routinen zur Darstellung von Hierarchien als Baumobjekte.

ClusterNode(id[, left, right, dist, count])

Eine Baumknotenklasse zur Darstellung eines Clusters.

leaves_list(Z)

Gibt eine Liste von Blattknoten-IDs zurück.

to_tree(Z[, rd])

Konvertiert eine Linkage-Matrix in ein einfach zu verwendendes Baumobjekt.

cut_tree(Z[, n_clusters, height])

Gibt den Schnittbaum basierend auf einer Linkage-Matrix Z zurück.

optimal_leaf_ordering(Z, y[, metric])

Ordnet den Schnittbaum basierend auf einer Linkage-Matrix Z und Distanz neu an.

Dies sind Prädikate zur Überprüfung der Gültigkeit von Linkage- und Inkonsistenzmatrizen sowie zur Überprüfung der Isomorphie von zwei flachen Clusterzuweisungen.

is_valid_im(R[, warning, throw, name])

Gibt True zurück, wenn die übergebene Inkonsistenzmatrix gültig ist.

is_valid_linkage(Z[, warning, throw, name])

Überprüft die Gültigkeit einer Linkage-Matrix.

is_isomorphic(T1, T2)

Bestimmt, ob zwei verschiedene Clusterzuweisungen äquivalent sind.

is_monotonic(Z)

Gibt True zurück, wenn die übergebene Linkage monoton ist.

correspond(Z, Y)

Prüft die Korrespondenz zwischen Linkage- und kondensierten Distanzmatrizen.

num_obs_linkage(Z)

Gibt die Anzahl der ursprünglichen Beobachtungen der übergebenen Linkage-Matrix zurück.

Dienstprogramme zum Plotten

set_link_color_palette(palette)

Setzt eine Liste von matplotlib-Farbcodierungen, die von dendrogram verwendet werden.

Dienstprogrammklassen

DisjointSet([elements])

Disjoint-Set-Datenstruktur für inkrementelle Konnektivitätsabfragen.