direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Arbeitstitel: Entwicklung eines Tree-logging Algorithmus zur effizienten Fehlertoleranz

Das Fachgebiet CIT entwickelte im Rahmen des Forschungsprojekts Stratosphere ein neuartiges Framework für massiv-parallele Datenverarbeitung mit dem Namen Nephele, das speziell für den Einsatz in Compute Clouds ausgelegt ist. Die zentrale Aufgabe von Nephele ist das Ausführen von Datenflussprogrammen, die sich als gerichteter azyklischer Graph beschreiben lassen. Ausgehend von den Ergebnissen der Forschungsgruppe ist das Apache Flink Framework entstanden.

Im Rahmen dieser Master-/Diplomarbeit sollen Mechanismen zum effizienten Fehlertoleranz entwickelt werden. Nephele bietet die Möglichkeit Zwischenergebnisse zu speichern und im Falle eines Fehlers für den Neustart zu nutzen. Bisher umfassen diese Zwischenspeicher, den gesamten Datenstream von ersten Datum an. Dies kann hohen Speicheraufwand verursachen. Um die Speichergröße zu reduzieren wäre es sinnvoll bereits in anderen Zwischenspeichern repräsentierte Daten zu entfernen. Hierfür soll ein Logging/ Acknowledgment Algorithmus entwickelt werden, der es ermöglicht festzustellen, welche Teile des Inputs breits durch andere Zwischenspeicher abgedeckt sind.

 

Voraussetzungen zum Bearbeiten des Themas sind umfassende Kenntnisse der Programmiersprache Java sowie Grundkenntnisse im Bereich der Verteilten Systeme.

Zusatzinformationen / Extras

Quick Access:

Schnellnavigation zur Seite über Nummerneingabe

Auxiliary Functions

Ansprechpartnerin

Mareike Höger, geb. Strüwing
+49 (30) 314-78946
Room E-N 174