Nachfolgend finden Sie die Funktionen von HP Vertica und warum Sie es unabhängig von den herkömmlichen Datenbankverwaltungssystemen verwenden sollten. HP Vertica ist ein Datenbankprodukt, das für die Verarbeitung großer Datenmengen oder Big Data verwendet wird. Es ist ein relationales Datenbankverwaltungssystem, das für Analysezwecke entwickelt wurde.

Funktionen von HP Vertica:
Diese sind wie folgt:

  1. Spaltenorientierte Ausrichtung:
    In HP vertica werden die Daten in Form von Spalten und nicht zeilenweise gespeichert. Der Hauptgrund für die spaltenweise Speicherung der Daten besteht darin, die Lese- und Schreiboperationen zu minimieren und auch die Abfrageausgabe schneller abzurufen.
  2. Erweiterte Komprimierung:
    Kodierung und Komprimierungstechniken werden verwendet, um die Abfrageleistung zu optimieren und Speicherplatz zu sparen. Performance abfragen und Speicherplatz sparen. Kodierung ist der Prozess der Konvertierung von Daten in ein Standardformat. Kodierte Daten können direkt von Vertica verarbeitet werden.

    Komprimierung ist der Prozess der Umwandlung von Daten in ein kompaktes Format. Komprimierte Daten können nicht direkt von Vertica verarbeitet werden. Daten müssen zuerst dekomprimiert werden. Die am häufigsten verwendeten Kodierungs- und Komprimierungsmethoden sind Run-Length Encoding (RLE), Deltaval-Kodierung und LZO-Komprimierung (Lempel-Ziv-Oberhumer-basiert).



  3. Hochverfügbarkeit:
    Vertica ist auf Hochverfügbarkeit ausgelegt. Hochverfügbarkeit ist die Fähigkeit der Datenbank, weiter ausgeführt zu werden, selbst wenn ein Node ausfällt. Wenn ein Node ausfällt, ist eine Kopie auf einem der überlebenden Node verfügbar, wie unten gezeigt.

    Vertica stellt fehlende Daten automatisch wieder her, indem es andere Node abfragt.

  4. Massive Parallelverarbeitung:
    Vertica ist eine Shared-Nothing-Architektur, die es jedem Node im Cluster ermöglicht, an seinem Teil der Datenbank zu arbeiten, wenn eine Abfrage ausgeführt wird.

    Das öffentliche Netzwerk wird für die Kommunikation mit der Außenwelt verwendet. Das private Netzwerk wird für die Kommunikation innerhalb des Nodes verwendet (Abfragepläne, Abfrageergebnisse, Datenlasten).

    Wir können Daten kontinuierlich in Echtzeit auf jeden Node laden. Die Anforderung wird gleichmäßig verteilt und verwaltet, indem einer der Node zum Initiator der Abfrageausführung und andere zu Ausführenden ernannt werden.

  5. Anwendungsintegration:
    HP Vertica kombiniert die Daten von verschiedenen Standorten oder verschiedenen Datenquellen, was als Anwendungsintegration bezeichnet wird. Die ETL-Tools (Extraction, Transform and Load) werden verwendet, um die Daten aus verschiedenen Datenbanken abzurufen und sie in eine Standardform zu konvertieren und in einem anderen Datenbank-Repository abzulegen.
  6. Automatisches Datenbankdesign:
    Um die Datenbanken effizient automatisch zu entwerfen, verwendet HP Vertica ein Tool, das als Datenbank-Designer bekannt ist. Wenn Daten aus einer Row-Store-Datenquelle in Vertica geladen werden, wandelt Vertica die Daten in spaltenbasierte Projektionen um.

    Hochrechnungen werden nicht beim Erstellen der Tabellen gebildet, sondern beim erstmaligen Laden der Daten in die Datenbanktabelle.