Freigeben über


Workspace Feature Store (veraltet)

Hinweis

In dieser Dokumentation wird der Feature Store des Arbeitsbereichs behandelt. "Der Feature Store des Arbeitsbereichs ist nur für Arbeitsbereiche verfügbar, die vor dem 19. August 2024, 16:00:00 Uhr (UTC) erstellt wurden."

Der Workspace Feature Store ist veraltet. Databricks empfiehlt die Verwendung von Feature Engineering in Unity Catalog.

Der Feature Store des Arbeitsbereichs ist vollständig in andere Komponenten von Azure Databricks integriert und bietet die folgenden Vorteile:

  • Erkennbarkeit. Über die Benutzeroberfläche des Feature Store, auf die Sie vom Databricks-Arbeitsbereich aus zugreifen können, können Sie vorhandene Features durchsuchen und suchen.
  • Linie Wenn Sie eine Featuretabelle in Azure Databricks erstellen, werden die zur Erstellung der Featuretabelle verwendeten Datenquellen gespeichert und sind zugänglich. Für jedes Feature in einer Featuretabelle können Sie auch auf die Modelle, Notebooks, Aufträge und Endpunkte zugreifen, die das Feature verwenden.
  • Integration mit Modellbewertung und -auslieferung. Wenn Sie Features aus dem Featurespeicher verwenden, um ein Modell zu trainieren, wird das Modell mit Featuremetadaten verpackt. Wenn Sie das Modell für Batch-Bewertung oder Online-Inferenz verwenden, ruft es automatisch Features aus dem Feature Store ab. Der Aufrufer muss diese nicht kennen oder eine Logik zum Suchen oder Verbinden von Features einfügen, um neue Daten zu bewerten. Das macht die Modellimplementierung und -aktualisierung viel einfacher.
  • Zeitpunktabfragen Der Feature Store unterstützt Zeitreihen und ereignisbasierte Anwendungsfälle, bei denen Punktgenauigkeit in der Zeit erforderlich ist.

Der typische Machine Learning-Workflow mit Feature Store folgt diesem Ablauf.

  1. Schreiben Sie Code, um Rohdaten in Features zu konvertieren und einen Spark-DataFrame zu erstellen, der die gewünschten Features enthält.
  2. Schreiben Sie den DataFrame im Feature Store des Arbeitsbereichs als Featuretabelle.
  3. Trainieren Sie ein Modell unter Verwendung von Merkmalen aus dem Feature-Store. Wenn Sie dies tun, speichert das Modell die Spezifikationen von Features, die für Trainings verwendet werden. Wenn das Modell für den Rückschluss verwendet wird, werden automatisch Features aus den entsprechenden Featuretabellen verknüpft.
  4. Registrieren des Modells in der Modellregistrierung.

Anschließend können Sie das Modell dazu nutzen, um Vorhersagen für neue Daten zu treffen. Für Batchanwendungsfälle ruft das Modell automatisch die benötigten Features aus dem Feature Store ab.

Workflow des Feature Stores für Batch-Machine-Learning-Anwendungsszenarien

Veröffentlichen Sie die Merkmale für Echtzeitanwendungsfälle in einem Online-Store. Siehe Databricks Online Feature Stores.

Zum Zeitpunkt der Inferenz liest das Modell vorab berechnete Merkmale aus dem Online-Store und verknüpft sie mit den Daten, die in der Clientanfrage an den Bereitstellungsendpunkt des Modells übermittelt werden.

Feature Store-Workflow für bereitgestellte Machine Learning-Modelle

Starten Sie mit der Nutzung des Workspace Feature Stores

Probieren Sie zunächst diese Beispiel-Notebooks aus. Im grundlegenden Notebook erfahren Sie, wie Sie eine Feature-Tabelle erstellen, sie zum Trainieren eines Modells verwenden und anschließend Batchbewertungen mithilfe des automatischen Feature-Lookups durchführen. Außerdem wird die Feature Engineering-Benutzeroberfläche vorgestellt und gezeigt, wie Sie damit nach Features suchen und verstehen können, wie Features erstellt und verwendet werden.

Beispiel-Notebook für den grundlegenden Workspace-Feature Store

Notebook abrufen

Das Beispiel-Notebook „Taxi“ veranschaulicht den Prozess der Erstellung von Features, ihrer Aktualisierung und ihrer Verwendung für das Modelltraining und die Batch-Inferenz.

Taxibeispiel-Notebook für Feature Store im Arbeitsbereich

Notebook abrufen

Unterstützte Datentypen

Unterstützte Typen finden Sie unter Unterstützte Datentypen.