Datensätze (scipy.datasets)#

Methoden für Datensätze#

ascent()

Gibt ein 8-Bit-Graustufenbild mit einer Bittiefe von 512 x 512 zurück, das einfach für Demos verwendet werden kann.

face([gray])

Gibt ein 1024 x 768 Farbbild eines Waschbärgesichts zurück.

electrocardiogram()

Lädt ein Elektrokardiogramm als Beispiel für ein 1D-Signal.

Hilfsmethoden#

download_all([path])

Hilfsmethode zum Herunterladen aller Datensatzdateien für das Modul scipy.datasets.

clear_cache([datasets])

Bereinigt das Cache-Verzeichnis der SciPy-Datensätze.

Verwendung von Datensätzen#

SciPy-Datensatzmethoden können einfach wie folgt aufgerufen werden: '<dataset-name>()'. Dies lädt die Datensatzdateien einmal über das Netzwerk herunter und speichert den Cache, bevor ein numpy.ndarray-Objekt zurückgegeben wird, das den Datensatz repräsentiert.

Beachten Sie, dass die zurückgegebene Datenstruktur und der Datentyp für verschiedene Datensatzmethoden unterschiedlich sein können. Weitere Beispiele zur Verwendung finden Sie in der Dokumentation der jeweiligen Datensatzmethode oben.

Wie Datensatzabruf und -speicherung funktionieren#

SciPy-Datensatzdateien werden in einzelnen GitHub-Repositories unter der SciPy GitHub-Organisation gespeichert und folgen der Namenskonvention 'dataset-<name>'. Zum Beispiel befinden sich die Dateien für scipy.datasets.face unter scipy/dataset-face. Das Untermodul scipy.datasets nutzt und hängt von Pooch ab, einem Python-Paket zur Vereinfachung des Abrufs von Datendateien. Pooch verwendet diese Repos, um die entsprechenden Datensatzdateien beim Aufrufen der Datensatzfunktion abzurufen.

Ein Verzeichnis aller Datensätze, im Wesentlichen eine Zuordnung von Dateinamen mit ihrem SHA256-Hash und ihren Repository-URLs, wird gepflegt, das Pooch zum Verwalten und Überprüfen der Downloads bei Funktionsaufrufen verwendet. Nach dem ersten Herunterladen werden die Dateien im systemweiten Cache-Verzeichnis unter 'scipy-data' gespeichert.

Die Speicherorte des Datensatz-Caches können auf verschiedenen Plattformen variieren.

Für macOS

'~/Library/Caches/scipy-data'

Für Linux und andere Unix-ähnliche Plattformen

'~/.cache/scipy-data'  # or the value of the XDG_CACHE_HOME env var, if defined

Für Windows

'C:\Users\<user>\AppData\Local\<AppAuthor>\scipy-data\Cache'

In Umgebungen mit eingeschränkter Netzwerkverbindung aus verschiedenen Sicherheitsgründen oder auf Systemen ohne ständige Internetverbindung kann der Cache der Datensätze manuell geladen werden, indem die Inhalte des Datensatz-Repositorys im oben genannten Cache-Verzeichnis platziert werden, um Fehler beim Abrufen von Datensätzen ohne Internetverbindung zu vermeiden.