Big-Data-Analyse : EMC stellt Plattform vor

 
27.09.2011
 

Anbieter EMC stellt mit der „EMC Greenplum Modular Data Computing Appliance (DCA)“ eine Komplettplattform für die Analyse großer Datenmengen vor. Hierdurch sollen Unternehmen strukturierte und unstrukturierte Daten nun einfacher analysieren und weiterverarbeiten können.

Die Greenplum DCA ist modular aufgebaut und verbindet eine massiv-parallele Verarbeitungsarchitektur (Massively Parallel Processing, MPP), die Daten über alle Knoten eines Clusters verteilt, mit Apache Hadoop in einer einheitlichen Anwendung. Durch den modularen Aufbau soll sich die DCA Plattform flexibel anpassen und einfach erweitern lassen.

„Die Möglichkeit, große Mengen an strukturierten und unstrukturierten Daten zu analysieren und die Informationen für sich zu nutzen bietet Unternehmen zukünftig Wettbewerbsvorteile und reduziert die Komplexität der IT-Infrastruktur,“ sagt Uwe Weimer, VP Central and Eastern Europe Data Computing Division bei EMC.

Wie der Anbieter angibt, stehen derzeit vier Greenplum Data Computing Appliance Module zur Verfügung:

·Das Greenplum Database Modul ist ein spezielles, hochskalierbares Data-Warehousing-Appliance-Modul, das mit seiner Architektur Datenbank-, Computing-, Storage- und Netzwerk-Funktionalitäten in einem einfach zu implementierenden System vereint.


·Das Greenplum Database High Capacity Modul wurde für das Hosting von mehreren Petabyte Daten ohne den Stromverbrauch, die Kosten oder den Platzbedarfs massiv in die Höhe zu treiben, entwickelt. Unternehmen, die detaillierte Analysen extrem umfangreicher Datenmengen benötigen bzw. ein längerfristiges Archiv implementieren wollen, stellt diese High-Capacity-Version ein Data Warehouse mit den niedrigsten Kosten zur Verfügung.


·Das Greenplum HD Modul bietet ein hochleistungsfähiges Appliance-Modul auf Hadoop-Basis für das Co-Processing von Daten. Es verbindet Hadoop mit der Greenplum Database und ermöglicht damit das echte Co-Processing von strukturierten und unstrukturierten Daten innerhalb einer einheitlichen, nahtlosen Lösung.


·Das Greenplum Data Integration Accelerator (DIA) Modul dient als Hostsystem für Analyse-Applikationen von Partnern, wobei diese denselben hochleistungsfähigen Interconnect mit niedriger Latenz wie die anderen Appliance-Module nutzen. Damit wird marktführende Performance beim Laden von Daten in einem parallelen, skalierbaren Modell erzielt, um Batch-Ladezeiten zu verkürzen bzw. um Micro-Batch-Loading zu implementieren.

msw