ViCE - Virtual Open Science Collaboration Environment

Projektkurzbeschreibung

Die elektronische Datenverarbeitung hat die Wissenschaft in den letzten 20 Jahren nachhaltig verändert. In jedem Fachgebiet kamen neue,computergestützte Formen der Datenerhebung,und -bearbeitung hinzu. Die zunehmende Nutzung von Virtuellen Forschungsumgebungen (VFU) erlaubt eine einrichtungs- und fächerübergreifende Kollaboration, eine bessere Integration des wiss. Nachwuchses und den Einsatz in der Lehre. In einigen Fachdisziplinen sind die Herausforderungen zur Nutzung von VFUs bereits gelöst, andere wollen den Schritt in diese Richtung vollziehen. Die notwendigen technischen Infrastrukturen sind in der Regel vorhanden. Jedoch ist noch keine standardisierte und breit verfügbare Lösung vorhanden, die Forschenden mit Bedarf an digitalen Workflows einfach zur Verfügung stehen. Diese Lücke soll von zwei Seiten, einmal “von oben” aus Anwendersicht mit ganz konkreten Bedarfen und zum anderen “von unten” aus Rechenzentrumssicht mit passgenauen Angeboten geschlossen werden. Das Projekt verhilft den wissenschaftlichen Rechenzentren zu einem klaren Verständnis der Bedarf der Communities zur besseren Unterstützung heterogener Anforderungen seitens ausgewählter Fachwissenschaften. Indem die Rechenzentren mit den Fachdisziplinen gemeinsame Vorstellungen entwickeln und daraus Planung und Organisation der Infrastrukturen für wissenschaftliche Projekte ableiten, können sie mit beherrschbarem Aufwand wichtige Basisinfrastrukturen und IT-Prozesse bereitstellen. Das bildet die Grundlage für zukünftige Organisationsstrukturen an Rechenzentren für einen dauerhaften Betrieb, nachhaltige Geschäftsmodelle und proaktive Beratung neuer Communities.

Föderierte Kollaborationsplattform für die Wissenschaft

Projektmatrix aus vier Anwender-Communities und drei Service-Providern
Projektmatrix aus vier Anwender-Communities und drei Service-Providern

Die Abstraktion der VFUs durch Virtualisierung von Hardwareressourcen schafft einen ersten, aber wesentlichen Schritt zur Entlastung sowohl der Forschenden als auch der zentralen Beratungs- und Infrastruktureinrichtungen. Die Einführung einer solchen zunächst technischen Abstraktionsschicht schafft zudem die Grundlagen für eine Neuverortung der Trennlinie zwischen der technischen Administration und der anforderungs- und forschungsgetriebenen Kuratierung der eigentlichen Softwareumgebung. Die technische Administration, die sich um die Bereitstellung der notwendigen Storage-, Server- und Compute-Ressourcen kümmert, kann damit die Wissenschaft signifikant von fachfremden Tätigkeiten entlasten. VFUs erlauben eine effizientere Administration, da viele Schritte, wie die Installation von Software, die Einrichtung von Lizenzen und Einrichtung einer Arbeitsumgebung, für eine bestimmte Forschungsfrage nur einmal erfolgen muss und die VFU anschließend beliebig, zum Beispiel als Vorlage für weitere Vorhaben oder den Einsatz in der Lehre, geteilt und genutzt werden kann. Umgekehrt können die jeweiligen Wissenschafts-Communities kooperativ Umgebungen entwickeln und sich auf ihre Kernkompetenzen konzentrieren. Sie greifen hierzu auf die Expertise ihrer Kollegen zurück und stellen gleichzeitig durch die gemeinsame Nutzung einer Umgebung die Weitergabe ihres Know-Hows sicher. Die Abschottung vom Host-System hilft zudem Fragen der Sicherheit zu lösen, die Nutzung persönlicher Geräte zu ermöglichen und eine leichte geografische oder anforderungsgesteuerte Verteilbarkeit auf verschiedene Hostplattformen zu erreichen. Die Tools für Containerisierung oder Virtualisierung bringen wesentliche Werkzeuge für Versionierung, Rollback und Archivierung bereits mit.

Im Projekt wird ein gemeinsames, kollaboratives VFU-Repository entwickelt, welches um Bausteine der Software- und Lizenzverwaltung erweitert wird. In weiteren Entwicklungsschritten kann diese Plattform um Funktionen der Annotierung, Verknüpfung zu Diensten (z.B. MyExperiment) oder Bewertungs- und Feedback-Mechanismen erweitert werden. Diese Kollaborationsplattform bildet dann eine zentrale Anlaufstelle für die einzelnen Fach-Communities, um ihre VFUs zentral zu verwalten, gemeinsam zu Kuratieren und sich über Weiterentwicklungen auszutauschen. Zur Verfügung gestellt wird die Plattform transparent von den drei beteiligten Rechenzentren, wobei gemeinsame Zugangsschnittstellen wie die landesweite IDM-Förderation genutzt werden. Die Rechenzentren übernehmen zentrale Aufgaben der Basisadministration, wie der Einrichtung von Basis-Images, deren Versionierung, Sicherung und Archivierung. Für die kollaborative Nutzung werden zwei Schnittstellen für die Online- und Offline-Kuratierung angeboten. Erstere erlaubt es den Forschenden über eine Remote-Schnittstelle eine bestimmte VFU interaktiv zu bearbeiten und zu annotieren. Das geschieht mittels Webbrowser, ohne hierfür die Umgebung auf die eigene Arbeitsumgebung und wieder zurück übertragen zu müssen.

Die zweite Variante entwickelt eine komfortable Zugangsschnittstelle, die eine Übertragung auf die lokale beziehungsweise persönliche Maschine erlaubt, wo anschließend die Nutzung beziehungsweise Anpassungen erfolgen können. Dieses schafft die Grundlage für die einfache Nutzung aktueller Forschungsumgebungen durch den wissenschaftlichen Nachwuchs und den reibungslosen Einsatz in der Lehre.

Geplante Ziele

Das Projekt ViCE entwickelt nachhaltige Geschäfts- und Steuerungsmodelle für die Kooperation von unterschiedlichsten Fach-Communities mit Rechenzentren auf Basis von VFUs, die dem dynamischen Charakter der Wissenschaften und ihren wechselnden Anforderungen angepasst sind. Es schafft hierzu eine RZ-übergreifende Kollaborations- und Austauschplattform für Virtuelle Forschungsumgebungen, die versioniert, annotiert und einfach geteilt werden können. Die Beschreibung der enthaltenen Tools und Workflows erlaubt die einfache Nachnutzung für neue Forschungsfragestellungen, eine schnelle Einbindung des wissenschaftlichen Nachwuchses und den Einsatz in der Lehre. Notwendige Basisinfrastrukturen der RZs werden so aufbereitet, dass sie abstrakt von verschiedenen Disziplinen, einfach und ohne Startverzögerung eingebunden und verwendet werden können. Hierzu wird Beratungskapazität aufgebaut, die die Wissenschaft in ihren Bedürfnissen unterstützt und eine einfache Ausdehnung auf weitere Communities erlaubt.

Das Projekt verfolgt seine Ziele auf drei Ebenen (vgl. Abbildung): Die Fach-Communities erarbeiten die notwendigen Schritte und entwickeln Konzepte auf der obersten Ebene, um ihre Forschungsfragestellungen optimal auf virtuelle Forschungsumgebungen abbilden zu können. Gemeinsam mit den Rechenzentren werden hierzu die bestehenden technischen Anforderungen und administrativen Hürden aufgearbeitet und die notwendigen Schnittstellen und Anpassungen definiert, damit Infrastrukturanbieter geeignete technische Ressourcen und praktische Unterstützung für den Betrieb von VFUs bereitstellen können. Das Projekt unterstützt die involvierten Fach-Communities beim Aufbau oder Anpassung ihrer Forschungsumgebungen (Anglistik/Amerikanistik sowie Wirtschaftsinformatik und -mathematik) und nutzt hierbei die Expertise der Communities, die bereits über entsprechende Erfahrungen verfügen (Bioinformatik und CMS-Gruppe der Teilchenphysik). Parallel hierzu werden die bereits existierenden oder sich im Aufbau befindlichen VFUs der Bioinformatik und ATLAS-Gruppen schrittweise in die bestehenden RZ- und Landes-Infrastrukturen eingepasst. Das bietet die Grundlage für die Einbindung weiterer Communities außerhalb dieses Vorhabens. Die jeweilige Ausprägung von VFUs kann anwendungs- und community-spezifisch durchaus unterschiedlich sein und hierfür auf Container-Technologien (z.B. Docker, nspawn) oder unterschiedliche virtuelle Maschinen zurückgreifen. Analog werden community-spezifisch Anwendungen, wie Scheduler für VFUs weiterentwickelt. In diesem Zusammenhang soll das Routing von Ressourcenanforderungen nach verschiedenen Kriterien, wie Zuordnung zu Projekten oder Mittelgebern, bearbeitet werden.Die landesweite Einbeziehung von vier unterschiedlichen Fachrichtungen mit ihren jeweiligen Spezifika stellt sicher, dass Projektergebnisse sowohl innerhalb der Communities als auch für weitere Fachwissenschaften nachgenutzt werden können. Dazu werden innerhalb der Fach-Communities Beiträge auf passenden Konferenzen und Workshops erbracht und von Seiten der Rechenzentren regelmäßige Informationsveranstaltungen durchgeführt. Zusätzlich werden die Plattformen von bwHPC-C5, wie das jährliche bwHPC-Symposium im Herbst oder die regelmäßigen bwCloud Projekttreffen genutzt.

Projektstatus

geplante Laufzeit: 1. April 2016 bis 31.3. 2018, das Kick-Off Meeting findet am 18. April 2016 an der Universität Mannheim (Schloss) statt

Partner und Ansprechpersonen

Projektkoordination


Rechenzentrum Universität Freiburg

Dr. Dirk von Suchodoletz, dirk.von.suchodoletz@rz.uni-freiburg.de

Prof. Dr. G. Schneider


Universität Freiburg

Prof. Dr. Markus Schumacher (Teilchenphysik)

Dr. Michael Heinrich (verschiedene Forschungs-Facilities, Bio-Informatik)

Prof. Christian Mair (Anglistik)

Dr. Susanne Mocken (Digital Humanities)


KIT

Prof. Dr. Günther Quast (Teilchenphysik)


Universität Mannheim

Prof. Dr. Heiner Stuckenschmidt (Wirtschaftsinformatik)

Janne Schulz (Rechenzentrum)


Universität Tübingen

Prof. Dr. Erhard Hinrichs (Computer-Linguistik)

Dr. Thorsten Trippel (Computer-Linguistik)


Universität Ulm

Prof. Dr.-Ing. Stefan Wesner (KIZ)