Indexierung erklärt

Indexierungsprozess

TrendMiner verwendet einen Caching-Mechanismus (als Indexierung bezeichnet), um eine schnelle, interaktive Visualisierung und Analyse Ihrer Zeitreihendaten zu ermöglichen Dieser Index wird in allen Algorithmen (Suchen, Diagnosen, Monitoring & Prognosen) verwendet. Immer wenn ein Benutzer zum ersten Mal auf ein Tag in TrendMiner zugreift (in der Regel durch Hinzufügen eines Tags zur aktiven Tag-Liste), durchläuft das Tag einen Indexierungsprozess. Sobald ein Tag vollständig indexiert ist, steht dieser Index allen Benutzern innerhalb der TrendMiner-Installation zur Verfügung (natürlich unter Berücksichtigung der Zugriffsberechtigungen). TrendMiner sorgt dafür, dass diese Indexe auf dem neuesten Stand gehalten werden, indem es in regelmäßigen Abständen Daten an den Index anhängt, ohne dass Sie eingreifen müssen. So haben Sie schnellen Zugriff auf aktuelle Daten für Ihre Analysen. 

Indexierung erklärt

Es gibt 2 wichtige, konfigurierbare Parameter für die Indexierung:  

  • die Indexauflösung: bestimmt, wie granular Ihre Analyse sein wird. 
  • der Indexhorizont: bestimmt das Startdatum des zu erstellenden Index. 

Standardmäßig ist die Indexauflösung einer TrendMiner-Installation auf 1 Minute und der Indexhorizont auf den 1. Januar 2015 eingestellt. Beide Parameter können vom TrendMiner-Administrator geändert werden. 

Die folgenden Bilder zeigen eine konzeptionelle Erklärung des Indexierungsprozesses eines analogen Tags und wie sich die Einstellung der Auflösung auf den erstellten Index auswirkt.  Im ersten Bild unten werden die Originaldaten, wie sie in der Datenbank gespeichert sind, für einen Zeitraum von 1 Minute visualisiert. Jeder blaue Punkt steht für einen Wert der Zeitreihe, der in der Datenbank gespeichert ist (je nach den Speichereinstellungen der Datenbank könnte dies bereits eine Komprimierung sein).

IE_1.png

Die konfigurierte Indexauflösung bestimmt, wie viele Datenpunkte TrendMiner von der Datenbank erhält. Bei einer Auflösung von 10 Sekunden fordert TrendMiner Daten in Intervallen von 10 Sekunden an. Die Historian-Konnektoren von TrendMiner sind so konzipiert, dass sie sicherstellen, dass wir die wichtigsten Daten für diese Intervalle erhalten. Für einen OSIsoft PI-Konnektor bedeutet dies, dass wir potenziell 4 Datenpunkte pro Intervall erhalten (d.h. den Start- und Endwert sowie den Maximal- und Minimalwert innerhalb des Intervalls).  

Die großen roten Punkte in den Bildern unten zeigen an, welche Daten schließlich im TrendMiner Index für eine 10-Sekunden-Auflösung (oberes Diagramm) und eine 1-Minuten-Auflösung (unteres Diagramm) zur Verfügung stehen würden.

IE_2.png

Sowohl die Leistung der zugrunde liegenden Datenbanken als auch die konfigurierte Indexauflösung beeinflussen die Geschwindigkeit der Indexierung. Bei einer höheren Indexauflösung muss die Datenbank mehr Datenpunkte übertragen, so dass der Indexierungsprozess länger dauert. Die Definition einer Auflösung ist daher ein Kompromiss zwischen Datengranularität und Leistung.

Die anfängliche Indexierung beginnt immer mit der aktuellen Zeit und wird bis zum konfigurierten Horizont fortgesetzt (dies wird als Rückwärtsindexierung bezeichnet). Wenn viele Tags gleichzeitig indexiert werden, erhalten die neuesten Daten immer Priorität. Dadurch wird sichergestellt, dass Benutzer, die gleichzeitig arbeiten, sofort mit ihrer Analyse der neuesten Daten beginnen können.   

Als Benutzer können Sie den Indexierungsprozess verfolgen, indem Sie den Zustand der Indexierung in den Tag-Details der aktiven Tag-Liste oder in der Kontextleiste überprüfen. Die Kontextleiste wird ausschließlich aus indexierten Daten erstellt. 

Sobald die Tags rückwärts indexiert sind, sorgt TrendMiner dafür, dass diese Indexe auf dem neuesten Stand gehalten werden (d.h. Vorwärtsindexierung), indem Daten in regelmäßigen Abständen an den Index angehängt werden, ohne dass der Endbenutzer eingreifen muss. Auf diese Weise haben die Endbenutzer immer schnellen Zugriff auf aktuelle Daten für Analysen. 

Hinweis: Als Administrator von TrendMiner können Sie auf die Index-Übersichtsseite zugreifen, um sich einen Überblick über alle indexierten Tags und deren aktuellen Zustand zu verschaffen. 

Wie wirkt sich der Index auf die TrendMiner-Funktionen aus? 

Der erstellte Index eines Tags ermöglicht eine schnelle, interaktive Analyse Ihrer Daten und wird in allen Algorithmen verwendet.  

Darstellung 

Für Trenddiagramme (Fokusdiagramm) werden Indexdaten verwendet, um eine schnelle Visualisierung langer Zeiträume zu ermöglichen; genauer gesagt immer dann, wenn der visualisierte Zeitraum größer ist als das 300-fache der Indexauflösung (d.h. 5 Stunden bei einer Indexauflösung von 1 Minute). In anderen Fällen sind die Indexdaten möglicherweise zu grob und die Daten werden direkt aus der Datenbank angefordert, um eine möglichst genaue Darstellung zu gewährleisten. Wenn indexierte Daten noch nicht verfügbar sind, werden die Daten auch direkt von den Historien angefordert. 

Suchen 

Die Suchvorgänge werden ausschließlich auf den indexierten Daten ausgeführt.   

Die Mindestdauer eines Suchergebnisses hängt von der Indexauflösung und dem verwendeten Suchalgorithmus ab.   

  • Bei der wertbasierten Suche, der Digitale Schrittsuche und der Betriebsbereichssuche beträgt die Mindestdauer das 2-fache der Indexauflösung, also 2 Minuten bei einer Standardeinstellung mit einer Auflösung von 1 Minute.  Für Zeiträume, die kürzer als die Mindestdauer sind, verfügt TrendMiner nicht über genügend Daten, um die Suchkriterien zu bewerten, daher kann TrendMiner keine kürzeren Zeiträume abrufen. Die Festlegung einer Auflösung ist also ein Kompromiss zwischen Suchgranularität und Leistung.  
  • Da die Suche in Indexdatenblöcken durchgeführt wird, ist die Dauer der Suchergebnisse immer ein Vielfaches der Indexauflösung. Bei Ähnlichkeitssuchen muss die Länge der Suchanfrage mindestens das 4-fache der Indexauflösung betragen. Außerdem werden bei Ähnlichkeitssuchen nur die indexierten Daten zur Prüfung auf Ähnlichkeit verwendet. Dies führt zu einer schnellen Analyse.  

Für sehr kurze Zeiträume können die Ergebnisse der Ähnlichkeitssuche ungenau erscheinen. Der Suchalgorithmus findet Ergebnisse, bei denen die Indexdaten sehr gut mit den Indexdaten des Abfragezeitraums übereinstimmen.  Bei der Darstellung solch kleiner Zeiträume ruft TrendMiner die Daten jedoch direkt von den Historien ab. Wenn es sich bei diesem Tag um einen hochauflösenden Tag handelt, werden sehr viel mehr Datenpunkte visualisiert, als im Suchalgorithmus verwendet wurden, wodurch sich die beobachtete Abweichung erklärt. 

Tag Builder 

Der Index aller berechneten Tags wird aufgebaut, indem Berechnungen auf dem Index der zugrunde liegenden Tags durchgeführt werden.   

Wenn Sie diese Tags für Zeiträume darstellen, die kleiner als das 300-fache der Indexauflösung sind, werden die Tags direkt aus der Datenbank abgefragt und die berechneten Tags "on the fly" ausgewertet.  

Diagnose 

Die Diagnosealgorithmen verwenden auch indexierte Daten, um Korrelationen und Fingerprint-Abweichungen zu bewerten. 

Parallel zu der Bemerkung für die Ähnlichkeitssuche bedeutet dies, dass die Kreuzkorrelationsanalyse hohe Korrelationszahlen für sehr kurze Zeiträume liefern kann (d.h. Zeiträume, die ungefähr der Indexauflösung entsprechen), obwohl die visualisierten Rohdaten keine oder nur eine geringe Korrelation aufweisen. 

Monitore 

Monitore bauen auf Suchen auf und ermöglichen es Benutzern, ihre Suchen zu operationalisieren. Monitore verwenden daher dieselben Daten wie die Suchen.

Um sicherzustellen, dass die Ergebnisse des Monitors rechtzeitig eintreffen, wird der Index der Tags, die in dem Monitor verwendet werden (auch die zugrunde liegenden Tags im Falle von Formeln), alle 2 Minuten aktualisiert. 

Enjoying TrendMiner? Share your experience to help the community and receive $25.
Rate TrendMiner