Was ist Machine Learning Hub?
Die Vision von TrendMiner, die Analytik zu demokratisieren, geht über die Befähigung von Domänenexperten mit Self-Service-Tools hinaus und umfasst auch eine engere Zusammenarbeit zwischen verschiedenen Experten, wenn es um die Lösung von Problemen geht. Einige der komplexesten Probleme erfordern den Einsatz von Datenwissenschaftlern, die spezialisierte Techniken einbringen, die es Unternehmen ermöglichen, die tiefsten Erkenntnisse aus den verfügbaren Daten herauszuholen. Denken Sie an fortgeschrittene Statistik und maschinelle Lernmodelle.
Nach einem sehr erfolgreichen Testprogramm mit Notebooks sind wir stolz, die vollständige Einführung eines neuen industriellen Machine Learning Hub (MLHub) für Zeitreihendaten bekannt zu geben, der die Analyse- und Machine Learning-Funktionen des Produktionsclients von TrendMiner erweitert. Mit MLHub können Data Scientists auf TrendMiner-Daten zugreifen (sowohl auf Rohdaten als auch auf vorverarbeitete und kontextualisierte Daten in TrendMiner-Ansichten) und in der neuen Notebook-Umgebung Hypothesen validieren oder Modelle für maschinelles Lernen erstellen/trainieren/einsetzen, die andere Benutzer über machine learning model tags anwenden und in DashHub visualisieren können.
Wie verwende ich die MLHub Homepage
Wichtiger Hinweis: Auf MLHub kann nur zugegriffen werden, wenn die Zugriffsverwaltung eingerichtet ist, wofür eine separate Lizenz erforderlich ist. Einzelheiten zur Zugriffsverwaltung finden Sie hier. Kontaktieren Sie uns bei TrendMiner, wenn Sie weitere Informationen zur Lizenzierung benötigen.
In der oberen linken Ecke der TrendMiner-Umgebung finden Sie die Schaltfläche Hub-Auswahl. Hier können Sie auswählen, zu welchem Hub Sie navigieren möchten.
Klicken Sie auf die Schaltfläche "MLHub".
In der oberen rechten Ecke finden Sie den Rest der oberen Leiste. Diese bleibt in allen TrendMiner Hubs gleich.
Direkt unter der oberen Leiste befinden sich die Schaltflächen für das Erstellen, Laden und Importieren von Notizbüchern.
Auf der linken Seite Ihres Bildschirms finden Sie Notebook-Snippets. Dies sind vordefinierte Codeblöcke, die Sie in Ihren Notizbüchern verwenden können. Siehe "Codeschnipsel" unten.
Was ist Notebook?
Die Notebook-Funktionalität von TrendMiner ist eine Plattform, die es Anwendern ermöglicht, innerhalb der TrendMiner-Umgebung über die robusten eingebauten Funktionen hinaus erweiterte Tools zu erstellen und damit zu arbeiten.
Warum sollten Sie Notebooks verwenden?
Mit Embedded Notebooks sind Sie in der Lage:
- Laden Sie Daten aus einer TrendHub-Ansicht, die mit den typischen eingebauten TrendMiner-Funktionen vorbereitet wurde (Auswahl einer Reihe interessanter Tags, Auswahl der interessierenden Zeiträume z.B. über die Suche, ...)
- Visualisieren und analysieren Sie Ihre Daten auf verschiedene Arten, die in TrendMiner nicht möglich sind.
- Führen Sie die Automatisierung von Analysen über Skripte durch (z.B. wiederholte Analysen über eine große Anzahl von Assets).
- Erstellen Sie (prädiktive) Tags mit Hilfe benutzerdefinierter Modelle (z.B. neuronale Netze oder Clustering), die von den typischen Notebook-Bibliotheken unterstützt werden.
Sie können die erweiterten Visualisierungsoptionen nutzen, die in das Notebook integriert sind. Das eingebettete Notebook verfügt über eine eigene Notebook-Kachel, so dass Sie Ihre Arbeit auch in ein DashHub-Dashboard einbetten und für Ihr gesamtes Unternehmen zugänglich machen können.
Wie Sie Notebooks verwenden
Hinweis: Interpreter - Der Standardinterpreter der Notebooks ist Python.
Auf der Homepage von MLHub können Sie entweder ein neues Notizbuch erstellen, eine bestehende Notiz laden oder importieren. Ein neues Notizbuch ist immer leer.
Ein Notebook erstellen
- Betreten Sie die Startseite von MLHub
- Klicken Sie auf die Schaltfläche "Neu" oder auf die Anzeige "Notizbuch erstellen". Auf der rechten Seite des Bildschirms erscheint ein Panel.
- Füllen Sie die offenen Felder aus und wählen Sie einen Exportordner zum Speichern Ihrer neuen Notiz.
- Klicken Sie auf die Schaltfläche "Erstellen".
- Wählen Sie die Kernelkonfiguration, die Sie starten möchten.
Wir bieten Vanilla-Notebooks oder Kernel mit vorinstallierten Visualisierungspaketen an. Wir empfehlen Ihnen, mit dem Kernel "Python mit Visualisierungsbibliotheken auf Kubernetes" zu starten.
- Bestätigen Sie Ihre Auswahl, indem Sie auf "Auswählen" klicken.
Es wird ein neues Notebook geöffnet, in das Sie Ihren Python-Code schreiben können. Vielleicht möchten Sie unseren Boiler-Plate-Code einfügen, der dringend empfohlene Pakete lädt, da Sie ihn zum Einlesen der TrendMiner Inhalte benötigen. Sie können diesen Code hinzufügen, indem Sie auf die Snippet-Schaltfläche "Initialisierungsskript" im Snippet-Menü auf der linken Seite klicken.

Laden eines Notebooks
- Öffnen Sie die Startseite von MLHub.
- Klicken Sie auf die Schaltfläche "Laden". Auf der rechten Seite des Bildschirms erscheint ein Panel mit dem work organizer.
- Wählen Sie das Notebook, das Sie öffnen möchten.
- Klicken Sie auf die Schaltfläche "Laden" unten rechts.
Importieren eines Notizbuchs
- Öffnen Sie die Startseite von MLHub.
- Klicken Sie auf die Schaltfläche "Importieren". Auf der rechten Seite des Bildschirms erscheint ein Panel.
- Wählen Sie, ob Sie ein Notebook mit Ihrem lokalen Dateibrowsersystem hochladen oder den Work Organizer verwenden möchten. Es werden nur Jupyter-Notebooks (Dateierweiterung .ipynb) unterstützt.
- Wählen Sie "Importieren".
TrendMiner-Daten als Datenrahmen laden
Hinweis: Ab Version 2022.R2 sind nur noch "TrendHub Views" und "ContextHub Views" als TrendMiner-Inhalte verfügbar. Weitere Inhalte werden in späteren Versionen eingeführt.
Sie können beispielsweise TrendHub- oder ContextHub-Views von guten und/oder abnormalen Betriebsperioden laden und sie dann mit Hilfe der erweiterten Analyse vergleichen und zu Ihrer TRENDMINER CONTENT-Liste hinzufügen.
- Klicken Sie auf die blaue Schaltfläche "+". Es erscheint ein Seitenfenster auf der rechten Seite.
- Wählen Sie das/die gespeicherte(n) Item(s), die Sie als Datensatz hinzufügen möchten.
- Klicken Sie auf "Laden".
Items in der Inhaltsmenüliste können entweder geöffnet oder gelöscht werden. Zum Löschen klicken Sie auf das x im Menü, das sich rechts neben dem zu löschenden Item befindet.
- Klicken Sie auf den neuen Inhalt, um ihn zu öffnen. Dadurch wird der entsprechende Python-Code in eine neue Zelle am Ende des Notebooks eingefügt.
TrendHub Views
Weitere Informationen erhalten Sie, wenn Sie den folgenden Befehl im Notebook ausführen:
help(trendminer.dataframes.data_frames)
load_view( ): Lädt die Zeitreihendaten einer gespeicherten TrendHub-Ansicht in eine Liste von Pandas DataFrames.
- Es wird ein DataFrame pro Ebene in der Ansicht zurückgegeben.
- Für jeden DataFrame kann ein anderer Satz von Tags verfügbar sein.
- Mit dem optionalen Parameter [layer_ids] können Sie nur eine bestimmte Liste von Ebenen laden (identifiziert durch die Layer-IDs, die von der Funktion view_info bereitgestellt werden).
view_info( ): Sammelt Informationen über eine Ansicht basierend auf ihrer ID. Diese Info kann zum Abrufen von Daten aus einer Ansicht verwendet werden: Sie listet alle Ebenen auf, die in der Ansicht enthalten sind. Beim Abrufen von Daten aus der Ansicht können Sie Ebenen auswählen, die in die Daten aufgenommen werden sollen.
Snippets
Derzeit sind die Snippets in Python-Kernels anwendbar, um Modelle für maschinelles Lernen einzusetzen. Weitere Informationen finden Sie hier.
Veröffentlichen der Notebook-Ausgabe in einer Pipeline
Wenn Sie eine Notebook-Ausgabezelle mit einem interessanten Ergebnis oder einer Visualisierung haben, die Sie weitergeben möchten, können Sie diese in einem Notebook-Ausgabeobjekt veröffentlichen.
Schritte:
- Klicken Sie auf die Schaltfläche 'Veröffentlichen' in der oberen rechten Ecke.
- Markieren Sie ALLE Zellen, die für die Ausgabe, die Sie veröffentlichenmöchten, relevant sind, einschließlich der 'Import'-Anweisungen und Variablendeklarationen. Stellen Sie sicher, dass die letzte ausgewählte Zelle eine gültige Ausgabe erzeugt. Sie können eine Zelle auswählen, indem Sie auf eine beliebige Stelle klicken, oder die Kontrollkästchen in den oberen rechten Ecken verwenden.
- Klicken Sie erneut auf 'Veröffentlichen'. Hier können Sie der Pipeline einen Namen geben und einen Speicherort im Work Organizer angeben. Dadurch wird ein 'Pipeline'-Objekterstellt, das eine Art Mini-Notebook ist, das nur die ausgewählten Zellen enthält. Pipelines haben keinen Bezug zu ihren Ursprungsnotebooks, sie sind eine eigenständige Einheit. Wenn Sie das Notebook aktualisieren, müssen Sie auch ein neues Pipeline-Objekt erstellen.
- Klicken Sie unten rechts auf die Schaltfläche 'Veröffentlichen'.
This will create a pipeline object containing the code of the cells you have selected.
DashHub: Notebook Output Kacheln
Mit DashHub kann jede Ausgabe eines Notebook-Absatzes in einer Notebook-Kachel auf dem Dashboard angezeigt werden.
Erstellen einer Notebook-Kachel
- Gehen Sie zu DashHub und erstellen Sie ein neues Dashboard oder öffnen Sie ein zuvor erstelltes Dashboard.
- Klicken Sie auf die Schaltfläche "Aktionen". Ein Dropdown-Menü wird angezeigt.
- Klicken Sie auf "Neue Kachel hinzufügen". Auf der rechten Seite erscheint ein Seitenpanel.
- Klicken Sie auf die Option "Notebook-Ausgabe".
- Geben Sie einen Titel für die Kachel des Dashboards ein.
- Wählen Sie das Pipeline-Objekt im Work Organizer aus.
- Passen Sie bei Bedarf die Aktualisierungseinstellung an.
- Klicken Sie auf "Neue Kachel hinzufügen".
Hinweis: Wenn Sie eine DashHub-Kachel freigeben, müssen auch die zugrunde liegenden Ansichten und Pipeline-Objekte freigegeben werden.
Bemerkungen und bekannte Probleme
Die gemeinsame Nutzung eines Notebooks führt zu einer symbolischen Verknüpfung mit dem Original-Notebook. Das bedeutet, dass der Ersteller weiterhin Eigentümer der Stammdaten des Notizbuchs ist. Änderungen, die an Zellen vorgenommen werden, werden nach dem FIFO-Prinzip gespeichert und erst bei der Bildschirmaktualisierung aktualisiert.
Die veröffentlichten Pipeline-Objekte sind nicht mehr mit den ursprünglichen Notizbüchern verknüpft. Nach der Veröffentlichung wirken sich Änderungen am Notebook nicht mehr automatisch auf das bestehende Notebook-Pipeline-Objekt aus. Auf diese Weise können die Benutzer die Ausgabe der Notebook-Zellen feinabstimmen, ohne dass andere Benutzer/Betrachter davon betroffen sind.
Die Ausführung von Notebooks und Visualisierungen von Notebook-Ausgaben hängt von Ihren Berechtigungen und Privilegien ab. Das bedeutet, dass einige Datenquellen möglicherweise blockiert sind und Sie nur die Daten verarbeiten können, die Ihrer Rolle entsprechen.