Freigeben über


Hinzufügen von Miningmodellen zu einer Struktur (Analysis Services - Data Mining)

Gilt für: SQL Server 2019 und frühere Analysis Services Azure Analysis Services Fabric/Power BI Premium

Von Bedeutung

Data Mining wurde in SQL Server 2017 Analysis Services verworfen und ist in SQL Server 2022 Analysis Services eingestellt worden. Die Dokumentation wird nicht für veraltete und nicht mehr unterstützte Features aktualisiert. Weitere Informationen finden Sie unter "Analysis Services-Abwärtskompatibilität".

Eine Miningstruktur soll mehrere Miningmodelle unterstützen. Daher können Sie nach Abschluss des Assistenten die Struktur öffnen und neue Miningmodelle hinzufügen. Jedes Mal, wenn Sie ein Modell erstellen, können Sie einen anderen Algorithmus verwenden, die Parameter ändern oder Filter anwenden, um eine andere Teilmenge der Daten zu verwenden.

Hinzufügen neuer Miningmodelle

Wenn Sie den Data Mining-Assistenten zum Erstellen eines neuen Miningmodells verwenden, müssen Sie standardmäßig zuerst eine Miningstruktur erstellen. Der Assistent bietet Ihnen dann die Möglichkeit, der Struktur ein erstes Miningmodell hinzuzufügen. Sie müssen jedoch kein Modell sofort erstellen. Wenn Sie die Struktur nur erstellen, müssen Sie keine Entscheidung darüber treffen, welche Spalte als vorhersagbares Attribut verwendet werden soll, oder die Verwendung der Daten in einem bestimmten Modell. Stattdessen richten Sie einfach die allgemeine Datenstruktur ein, die Sie in Zukunft verwenden möchten, und später können Sie data Mining-Designer verwenden, um neue Miningmodelle hinzuzufügen, die auf der Struktur basieren.

Hinweis

In DMX beginnt die Anweisung CREATE MINING MODEL mit dem Miningmodell. Das heißt, Sie definieren Ihre Wahl des Miningmodells, und SQL Server Analysis Services generiert automatisch die zugrunde liegende Struktur. Später können Sie dieser Struktur weiterhin neue Miningmodelle hinzufügen, indem Sie die Anweisung „ALTER STRUCTURE ... ADD MODEL“ verwenden.

Auswählen eines Algorithmus

Wenn Sie einer vorhandenen Struktur ein neues Modell hinzufügen, sollten Sie zunächst einen Data Mining-Algorithmus auswählen, der in diesem Modell verwendet werden soll. Die Auswahl des Algorithmus ist wichtig, da jeder Algorithmus eine andere Art von Analyse durchführt und unterschiedliche Anforderungen hat.

Wenn Sie einen Algorithmus auswählen, der nicht mit Ihren Daten kompatibel ist, erhalten Sie eine Warnung. In einigen Fällen müssen Sie möglicherweise Spalten ignorieren, die nicht vom Algorithmus verarbeitet werden können. In anderen Fällen nimmt der Algorithmus automatisch die Anpassungen für Sie vor. Wenn Ihre Struktur beispielsweise numerische Daten enthält und der Algorithmus nur mit diskreten Werten arbeiten kann, werden die numerischen Werte für Sie in diskrete Bereiche gruppiert. In einigen Fällen müssen Sie die Daten möglicherweise zuerst manuell korrigieren, indem Sie einen Schlüssel auswählen oder ein vorhersagbares Attribut auswählen.

Sie müssen den Algorithmus nicht ändern, wenn Sie ein neues Modell erstellen. Häufig können Sie sehr unterschiedliche Ergebnisse erzielen, indem Sie denselben Algorithmus verwenden, aber die Daten filtern oder einen Parameter ändern, z. B. die Clustermethode oder die Mindestgröße des Itemsets. Es wird empfohlen, mit mehreren Modellen zu experimentieren, um zu sehen, welche Parameter die besten Ergebnisse erzielen.

Beachten Sie, dass alle neuen Modelle verarbeitet werden müssen, bevor Sie sie verwenden können.

Angeben der Verwendung von Spalten in einem neuen Miningmodell

Wenn Sie einer vorhandenen Miningstruktur neue Miningmodelle hinzufügen, müssen Sie angeben, wie jede Datenspalte vom Modell verwendet werden soll. Abhängig vom Typ des Algorithmus, den Sie für das Modell auswählen, werden einige dieser Optionen möglicherweise standardmäßig getroffen. Wenn Sie keinen Verwendungstyp für eine Spalte angeben, wird die Spalte nicht in die Miningstruktur einbezogen. Die Daten in der Spalte können jedoch weiterhin für Drillthrough verfügbar sein, wenn das Modell sie unterstützt.

Spalten aus der Miningstruktur, die (sofern nicht auf 'Ignorieren' festgelegt) vom Modell verwendet werden, müssen entweder ein Schlüssel, eine Eingabespalte, eine vorhersagbare Spalte oder eine vorhersagbare Spalte sein, deren Werte auch als Eingaben für das Modell genutzt werden.

  • Schlüsselspalten enthalten einen eindeutigen Bezeichner für jede Zeile in einer Tabelle. Einige Miningmodelle, z. B. basierend auf den Sequenzclustering- oder Zeitreihenalgorithmen, können mehrere Schlüsselspalten enthalten. Diese mehrfachen Schlüssel sind jedoch keine zusammengesetzten Schlüssel im relationalen Sinne, sondern müssen ausgewählt werden, damit Zeitreihen- und Sequenzclusteringanalysen unterstützt werden können.

  • Eingabespalten stellen die Informationen bereit, aus denen Vorhersagen erstellt werden. Der Data Mining-Assistent stellt das Feature "Vorschlagen " bereit, das aktiviert ist, wenn Sie eine vorhersagbare Spalte auswählen. Wenn Sie auf diese Schaltfläche klicken, wird der Assistent die vorhersehbaren Werte probieren und bestimmen, welche der anderen Spalten in der Datenstruktur als gute Variablen identifiziert werden können. Sie lehnt Schlüsselspalten oder andere Spalten mit vielen eindeutigen Werten ab und schlägt Spalten vor, die scheinbar mit dem Ergebnis korreliert werden.

    Diese Funktion ist besonders praktisch, wenn Datensätze mehr Spalten enthalten, als Sie wirklich für die Erstellung eines Miningmodells benötigen. Mit dem Feature "Vorschlagen " wird eine numerische Bewertung von 0 bis 1 berechnet, die die Beziehung zwischen jeder Spalte im Dataset und der vorhersagbaren Spalte beschreibt. Basierend auf dieser Bewertung schlägt das Feature Spalten vor, die als Eingabe für das Miningmodell verwendet werden sollen. Wenn Sie das Feature "Vorschlagen " verwenden, können Sie die vorgeschlagenen Spalten verwenden, die Auswahl an Ihre Anforderungen anpassen oder die Vorschläge ignorieren.

  • Vorhersagbare Spalten enthalten die Informationen, die Sie im Miningmodell vorhersagen möchten. Sie können mehrere Spalten als vorhersagbare Attribute auswählen. Clusteringmodelle sind die Ausnahme, dass ein vorhersagbares Attribut optional ist.

    Je nach Modelltyp muss die vorhersagbare Spalte möglicherweise ein bestimmter Datentyp sein: Beispielsweise erfordert ein lineares Regressionsmodell eine numerische Spalte als prognostizierten Wert; Der Naïve Bayes-Algorithmus erfordert einen diskreten Wert (und alle Eingaben müssen ebenfalls diskret sein).

Angeben des Spalteninhalts

Bei einigen Spalten müssen Sie möglicherweise auch den Spalteninhalt angeben. In SQL Server Data Mining teilt die Content Type-Eigenschaft jeder Datenspalte dem Algorithmus mit, wie die Daten in dieser Spalte verarbeitet werden sollen. Wenn Ihre Daten beispielsweise über eine Spalte "Einkommen" verfügen, müssen Sie angeben, dass die Spalte fortlaufende Zahlen enthält, indem Sie den Inhaltstyp auf "Fortlaufend" festlegen. Sie können jedoch auch angeben, dass die Zahlen in der Spalte "Einkommen" in Buckets gruppiert werden, indem Sie den Inhaltstyp auf "Discretized" festlegen und optional die genaue Anzahl von Buckets angeben. Sie können unterschiedliche Modelle erstellen, die Spalten unterschiedlich verarbeiten: Beispielsweise könnten Sie ein Modell ausprobieren, das Kunden in drei Altersgruppen einteilt, und ein anderes Modell, das Kunden in 10 Altersgruppen unterteilt.

Siehe auch

Miningstrukturen (Analysis Services - Data Mining)
Erstellen einer relationalen Miningstruktur
Miningmodelleigenschaften
Miningmodell-Spalten