direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Analyse verschiedener Speicherorte für Zwischenergebnisse und deren Auswirkung auf die Fehlertoleranz.

Cloud Computing spielt eine zunehmend wichtigere Rolle im Bereich der massiv-parallelen Datenverarbeitung. Die New York Times z.B. hat unlängst ihr 4 TB großes Artikelarchiv mit Hilfe des Datenverarbeitungsframeworks Hadoop in PDF Dateien konvertiert und benötigte dazu weniger als 24 Stunden mit 100 virtuellen Maschinen in der Amazon EC2 Cloud.

Das Fachgebiet CIT entwickelt aktuell im Rahmen des Forschungsprojekts Stratosphere ein neuartiges Framework für massiv-parallele Datenverarbeitung mit dem Namen Nephele, das speziell für den Einsatz in Compute Clouds ausgelegt ist. Die zentrale Aufgabe von Nephele ist das Ausführen von Datenflussprogrammen, die sich als gerichteter azyklischer Graph beschreiben lassen. Zusätzlich gibt es im Nephele System Mechanismen zur Fehlertoleranz die auf dem Speichern von Zwischenergebnissen basiert.

Im Rahmen dieser Bachelorarbeit sollen verschiedene Möglichkeiten von Speicherorten implementiert und analysiert werden. Beispielsweise lokales Speichern, Speichern im Verteilten Dateisystem, spiegeln auf einzelne andere Maschinen, usw. Es sollen umfangreiche Test zu Schreib- und Lesegeschwindigkeit im fehlerhaften und fehlerfreien Fall durchgeführt werden.

Voraussetzungen zum Bearbeiten des Themas sind umfassende Kenntnisse der Programmiersprache Java sowie Grundkenntnisse im Bereich der Verteilten Systeme.

Zusatzinformationen / Extras

Quick Access:

Schnellnavigation zur Seite über Nummerneingabe

Auxiliary Functions

Ansprechpartnerin

Mareike Höger, geb. Strüwing
+49 (30) 314-78946
Room E-N 174