|
| Ankündigung einer Diplomarbeit
|
| Titel |
Komponentenbasiertes Sequenzalignment mit
optimierter Kommunikation für Computational Grids |
| Motivation |
Grid Computing ist ein Schlüsselbegriff der modernen verteilten Datenverarbeitung.
Das Internet ermöglicht globalen, standort- und geräteunabhängigen Zugriff
auf weltweit verteilte Informationsresourcen. Computational Grids sollen
das gleiche für verteilte Rechenresourcen leisten: Jeder Anschluss an
das Internet soll dem Nutzer Zugriff auf zahlreiche weitere angeschlossene Computer
ermöglichen und somit vergleichbare oder möglichst noch mehr Rechenleistung
bereitstellen, als das mit
herkömmlichen, lokalen (und meist sehr teuren) Parallelrechnern möglich ist.
Als Programmiermodelle für Computational Grids etablieren sich derzeit
unterschiedliche Komponentenarchitekturen.
Ziel solcher Architekturen ist es, die Entwicklung von Anwendungen zu erleichtern.
Technische Details werden in wiederverwendbare Komponenten gekapselt, die vom Programmierer
angepasst und zu neuen Anwendungen kombiniert werden können. An der Arbeitsgruppe
PVS wird derzeit eine Komponentenarchitektur für die Programmierung von Grid
Anwendungen mittels Web Services entwickelt.
Programmierer, die auf dieser Architektur aufbauen, können bei der Entwicklung die
Anwendungslogik fokussieren, während die technisch
aufwendige Integration mit den darunter liegenden Basisdiensten (sog. Grid Middleware)
bereits von vorgefertigten Web Services übernommen wird.
Der Abgleich (Alignment) großer Bioproteinsequenzen ist eine Problemstellung
bei man sich Komponenten zunutze machen kann. Eine Grid-taugliche Implementierung
muß dabei die Eingabedaten möglichst geschickt auf alle verwendeten
Rechner verteilen.
|
| Inhalt |
Die Aufgabenstellung für diese Diplomarbeit besteht darin, den Nutzen der am
Lehrstuhl konzipierten Architektur anhand einer Sequenzalignment Implementierung zu
belegen. Im Detail sind folgende Schritte zu bewältigen:
- Einarbeitung in das Konzept der sog.
Higher Order Component-Service Architecture (HOC-SA)
- Implementierung des neuen Komponententyps Alignment-HOC, wobei die Anforderungen an dessen
Funktionalität bereits vorab spezifiziert sind: Neben des standardisierten
Sequenzabgleichs, soll die Komponente, mittels benutzerspezifizierter Anpassungen (Traceback etc.),
auch auf verwandte Probleme (Musterdetektion, Strukturvorhersage, ...) der Bioinformatik
anwendbar sein.
- Die Struktur der neuen Komponente wird sich an parallelen Systemen,
die ohne vergleichbare Komponenten arbeiten orientieren.
Prozeduren, die üblicherweise in lokal begrenzten Architekturen (SMP-Server, Cluster etc.)
zur Kommunikation verwendet werden (Broadcast, Scatter, ...) müssen
für das Grid portiert und den dortigen Anforderungen entsprechend
optimiert werden.
- Durch einen Vergleich mit gängigen Frameworks für Grid Computing
(z.B. ProActive) soll
ermittelt werden, wie sich der Komponentenansatz auf die Performanz der
Implementierung des Alignment-HOC auswirkt.
|
| Voraussetzung |
Diese anspruchsvolle Diplomarbeit erfordert die
sichere Beherrschung der Programmiersprache Java,
sowie Kenntnisse über Datenrepräsentation in XML.
Kenntnisse zu fortgeschrittenen Technologien für verteilte Systeme, die in Forschung und
Industrie derzeit gleichermaßen
gefragt sind (z.B. Web Services und Grid Middleware),
werden nicht vorausgesetzt, sondern können im Rahmen der Diplomarbeit
erarbeitet werden. |
| Betreuer |
Prof. Sergei Gorlatch,
Dipl.-Inf. Jan Dünnweber |
| Status |
Diese Diplomarbeit wurde von Philipp Lüdeking im Sommersemester 2006
erfolgreich bearbeitet und ist inzwischen abgeschlossen.
Die Dokumentation kann hier eingesehen werden. |
|
|