Digitale Reichtümer
Was ist ein Digital Asset Management System und warum braucht die Universität Wien eines?

von Peter Marksteiner (Ausgabe 07/1, März 2007)

 

Jahrhundertelang wurden die Ergebnisse universitärer Lehre und Forschung fast ausschließlich in Papierform produziert. Es ist hauptsächlich Aufgabe der Bibliotheken, diese Schriften aufzubewahren, zu verwalten und zugänglich zu machen. In der langen Geschichte des wissenschaftlichen Bibliothekswesens haben sich hier erprobte Arbeitsweisen und Standards etabliert, sodass die Bibliotheken diese Auf­gaben professionell und zuverlässig erfüllen.

Immer mehr Forschungsergebnisse und Lehrinhalte liegen jedoch ausschließlich in digitaler Form vor. Dabei kann es sich um die elektronische Form von Printmedien handeln (z.B. Electronic Journals), aber auch um Bilddaten, Audio- und Videomaterial, Softwareprodukte, Online-Lehrgänge aus Lernplattformen, Datenbanken und vieles andere.

Vielfach werden Online-Ressourcen jedoch nicht ganz ernst genommen: Was zählt, ist eine Publikation in einer renommierten Zeitschrift, alles andere ist bestenfalls schmückendes Beiwerk. Einerseits liegt das an einer gewissen Trägheit des Wissenschaftsbetriebes bei der Akzeptanz neuer Medien und wohl auch an wirtschaftlichen Interessen (z.B. der wis­senschaftlichen Verlage); andererseits fehlt elektronischen Ressourcen tatsächlich noch einiges, was bei Zeitschriften und Büchern durch die lange etablierten Standards gegeben ist.

Ein Hauptproblem digitaler Ressourcen ist ihre Flüchtigkeit. Während sich an Gedrucktem kaum je etwas ändert, sind Webseiten und andere digitale Datenbestände ständig im Fluss. Eine direkte Konsequenz der Flüchtigkeit ist die mangelnde Zitierbarkeit. Es gibt genaue Regeln, wie wissenschaftliche Arbeiten zu zitieren sind. Findet man z.B. in einer Publikation das Zitat "A. Einstein, Ann. Phys., 17(1905), pp. 891-921", so mag es zwar vielleicht mühsam sein, die Originalarbeit in einer Bibliothek auszuheben, man kann aber sicher sein, die richtige Arbeit - in diesem Fall zu Ein­steins spezieller Relativitätstheorie - zu finden.

Ganz anders verhält es sich bei Zitaten von Webinhalten und anderen digitalen Ressourcen. Hier haben sich noch keine verbindlichen Zitierregeln etabliert, die einfache An­gabe von URLs ist unzureichend: Niemand garantiert, dass beispielsweise www.univie.ac.at/comment/06-2/062_27.html nach fünf Jahren noch immer existiert bzw. dass dort noch dasselbe Dokument zu finden ist wie zu dem Zeitpunkt, als es zitiert wurde.1) Besonders schwierig ist das Zitieren von dynamisch generierten Webseiten bzw. solchen, die sich sehr rasch ändern wie z.B. Wikis.2)

Es wurden verschiedene Lösungen für das Zitieren von On­line-Ressourcen vorgeschlagen, z.B. den kompletten Inhalt von zitierten Webseiten auszudrucken und der Arbeit beizulegen. Andere kommen zu dem Schluss, dass Webzitate überhaupt unzulässig sind und nur auf Papier Gedrucktes wahren wissenschaftlichen Wert hat. Ich finde diese Schluss­folgerung absurd: Anstatt die Existenz von Online-Ressour­cen zu ignorieren und deren wissenschaftlichen Wert zu leug­nen, ist es vielmehr erforderlich, die Werkzeuge zu schaf­fen, mit denen digitale Daten die notwendigen Eigen­schaften wie Beständigkeit, Auffindbarkeit und Zitier­barkeit erhalten - und genau das ist die Funktion eines Digital Asset Management Systems (DAMS).

Anforderungen an ein Digital Asset Management System

Langzeitarchivierung

Die Aufgaben und Herausforderungen bei der Aufbewah­rung geschriebener und gedruckter Dokumente für künf­tige Ge­nerationen sind wohlbekannt. Trotz vieler schmerz­licher Verluste durch Brände, Kriege, Diebstähle oder einfach den "Zahn der Zeit" ist eine beachtliche Anzahl an Schrif­ten aus früheren Jahrhunderten erhalten, und das oft in einem bemerkenswert guten Zustand: Säurefreies Papier über­dauert problemlos mehrere hundert Jahre, so manche Perga­ment-Handschrift aus dem frühen Mittelalter oder der Spät­antike wirkt nach mehr als tausend Jahren so frisch, als hätte sie eben erst das Skriptorium verlassen. Große Bib­lio­theken verfügen über eigene Abteilungen für die Kon­ser­vie­rung und Restaurierung ihrer Bestände.

Bei digitalen Objekten ist die Haltbarkeit des physischen Mediums vermutlich wesentlich kürzer als die Jahrhunderte, die Papier überdauern kann: Festplatten geben nach wenigen Jahren den Geist auf, Magnetbänder reagieren sehr empfindlich auf magnetische Einflüsse, was sie oft sehr schnell un­lesbar macht. Viele digitale Medien (z.B. DVD) sind noch recht neu; über ihre Haltbarkeit ist wenig bekannt.3) Im Gegensatz zu Gedrucktem lassen sich digitale Objekte jedoch verlustfrei kopieren: Es besteht kein Unterschied zwischen Original und Kopie. Deshalb ist die Vergänglichkeit des physischen Mediums nur insofern ein Problem, als ein regelmäßiges Umkopieren auf neue Datenträger erforderlich ist. Bei­spielsweise findet sich auf dem Webserver der Universität Wien (WWW.UNIVIE.AC.AT) so manche Datei aus dem Jahr 1995, obwohl seither mehrmals die Hard­ware getauscht wurde (zuletzt bei der Über­siedlung der Da­ten in das Storage Area Network).

Die wahren Probleme der digitalen Langzeitarchivierung liegen anderswo: Einerseits brauchen digitale Ob­jekte eine "Heimstätte", die dauerhafter ist als die üblichen Webseiten, deren Lebenszeit selten mehr als ein paar Jahre beträgt. Andererseits muss sichergestellt werden, dass die verwendeten Datenformate auch in Zu­kunft noch lesbar sind.

Auch wenn viele ältere Datenträger wie Magnetband-Spulen oder 8-Zoll-Disketten physisch unversehrt sein mögen, so sind die Daten darauf nur mit enormem Aufwand zu lesen, weil es heutzutage fast überall an ent­sprechenden Geräten und Lauf­wer­ken fehlt. So manches Textverar­bei­tungs­pro­­gramm, das Mitte der Acht­zigerjahre des vorigen Jahrhun­derts populär war, ist inzwischen in Ver­gessenheit geraten, sodass Doku­mente, die mit solchen Programmen geschrieben wurden, nur mehr mühsam zu entziffern sind.

Selbstverständlich kann heute niemand wissen, welche Formate noch in hundert Jahren lesbar sein werden. Durch die Beschränkung auf Stan­dard-Formate, die zusätzlich noch möglichst self-contained sein sollen (d.h. bei denen alle erforderlichen Infor­mationen wie z.B. die verwen­deten Schriftarten im Doku­ment selbst enthalten sind), besteht zwar keine Ga­ran­tie, aber immerhin eine hohe Wahr­scheinlichkeit, dass auch unsere Ur­enkel sich noch an den digitalen Schätzen erfreuen können, die wir heute produzieren.

Metadaten: Standards und Schnittstellen

Wollte man ein Buch in einer Bib­liothek ins Regal stellen, aber nicht in den Katalog aufnehmen, so wäre dieses praktisch wertlos. Erst die Auf­nahme von Autor, Titel, Verlag, Jahr­gang, ISBN, Aufstellungsort usw. in den Bibliothekskatalog sowie die Er­fassung von Kategorien und Schlag­wörtern macht das Buch zum Be­standteil einer Bibliothek. Die fehlerfreie Katalogisierung und Beschlag­wortung ist durchaus keine triviale Auf­gabe und erfordert geschultes Fach­­personal.

Ähnliche Anforderungen gibt es bei der Erfassung digitaler Objekte: Zu­sätzlich zum Objekt selbst (beispielsweise eine Bilddatei) muss eine Be­schreibung des Objekts mit Daten wie Autor, Datum der Erstellung usw. abgespeichert werden. Diese Art von Zu­satzinformationen bezeichnet man als Metadaten.

Bei der Beschreibung digitaler Res­sour­cen muss ein Kompromiss gefunden werden: Einerseits ist größtmög­liche Einheitlichkeit und Standardi­sierung gewünscht, was z.B. für globale Suchfunktionen unerlässlich ist. Ande­rer­seits ist hohe Flexibilität erforderlich: Verständlicherweise sind für die Beschreibung von digitalisierten archäologischen Funden ganz andere Metadaten erforderlich (z.B. Fundort) als etwa bei NMR-Spektren von chemi­schen Verbindungen (z.B. chemische Formel, verwendetes Messgerät).

Der wichtigste Metadaten-Standard, der 1994 definiert wurde und sich bereits weitgehend durchgesetzt hat, ist der so genannte Dublin Core-Stan­dard.4) Der Name "Core" deutet bereits an, dass es sich dabei um die Kern-Elemente von Metadaten handelt, die noch durch beliebige Zusatz­informationen erweitert werden können. Zu den 15 Elementen des Dublin Core gehören beispielsweise eine eindeutige Identi­fikation des Objektes, die auch die Zitierbarkeit sicherstellt, die Art des Ob­jekts (Bild, Text, phy­sisches Objekt usw.) und Personen (Autor, Herausgeber).

Besonders wichtig ist das Einhalten von Standards, wenn Daten zwischen mehreren Systemen ausgetauscht werden sollen oder eine gemeinsame Suchfunktion über mehrere Sammlungen von Objekten gewünscht ist. Wer beispielsweise eine Bilddatenbank aufbaut, ohne sich um Metadaten-Standards zu kümmern, mag sich dadurch anfangs einiges an Arbeit ersparen, ohne einen Verlust an Funktionalität zu bemerken. Das rächt sich jedoch, sobald einmal ein Wechsel der Software erforderlich wird oder eine Vereinigung mit anderen Datenbanken gewünscht ist: Durch Standard-For­mate kann man sich in diesen Fällen aufwendige Migrations-Programme ersparen.

Die Bedeutung von Standard-Formaten für die Langzeit­archivierung wurde bereits erwähnt; dasselbe gilt selbstverständlich auch für Metadaten.

Suchen und Finden, Pflegen und Betreuen

Es ist nicht damit getan, digitale Objekte für künftige Generationen ins Archiv zu stellen und dort virtuell verstauben zu lassen: Mindestens genau so wichtig ist der praktische Nutzen für die Gegenwart. Dazu gehört eine effiziente Suchfunktion, wobei durchaus auch Objekte gefunden werden können, die sich physisch anderswo befinden. In einem solchen Fall verwaltet das DAMS nur die Meta­da­ten, anstelle des eigentlichen Objekts enthält es nur einen Verweis, wo dieses zu finden ist.

Weiters gehören zu einem solchen System Werkzeuge, die die Verwendung der digitalen Objekte in Forschung und Lehre ermöglichen. Zwar ist ein DAMS primär kein Content Management System (CMS) und auch keine Lernplattform (Learning Management System, LMS), aber die Funktionen dieser Systeme überschneiden sich teilweise. Welche Werk­zeuge benötigt werden, hängt stark von der Art der Objekte ab: Bei Bilddateien sind das etwa Funktionen wie Ge­ne­rieren verschiedener Qualitätsstufen und Auflösungen, verschiedene Methoden von Darstellung und Projektion usw.

Eine wichtige Komponente sind auch die Hilfsmittel bei der Erfassung und Pflege von Daten: Möglichst automatisierte Generierung von Metadaten aus den Daten selbst5), Metho­den des Ingest, also der massenweisen Übernahme von Daten aus anderen Systemen, Hilfsmittel bei der Qua­litäts­kontrolle usw.

Rechteverwaltung

Die Problematik von Urheber- und Verwertungsrechten digitaler Ressourcen ist ein schwieriges Feld, wo es noch viele ungelöste Fragen gibt. Meistens sind daran drei Par­teien beteiligt: die Urheber (Autoren, Künstler, Forscher); die Inhaber der Verwertungsrechte, die von den Urhebern an diese mehr oder minder freiwillig abgetreten wurden (Verlage, Auftraggeber von Forschungsprojekten, Verwer­tungsgesellschaften)6); die Öffentlichkeit bzw. der Kunden­kreis, der auf die digitalen Ressourcen zugreifen und diese nutzen will. Es ist Aufgabe des Gesetzgebers, einen ge­rechten Ausgleich zwischen den einander widersprechenden, mehr oder minder berechtigten Interessen der drei Be­teiligten zu schaffen - eine Aufgabe, die er wohl noch nicht ganz zur allgemeinen Zufriedenheit gelöst hat.

Es gibt ein breites Spektrum von Meinungen zur digitalen Rechteproblematik. Am einen Ende der Skala stehen die Befürworter des Open Access-Gedankens, die die Meinung vertreten, dass universitäre Forschung von der Öffentlichkeit durch Steuermittel bezahlt wurde und dass daher die Öffentlichkeit das Recht habe, ohne Einschränkungen und weitere Kosten die Ergebnisse dieser Forschung zu nutzen. Am anderen Ende stehen die Verfechter eines restriktiven Digital Rights Management, die den öffentlichen Zugang zu digitalen Ressourcen so weit wie möglich einschränken und bei jeder Nutzung bei den Rechteverwertern - seltener bei den Urhebern - die Kasse klingeln lassen wollen.

Antworten auf diese Fragen zu finden, ist nicht Aufgabe eines Digital Asset Management-Pro­jekts; es gibt vielmehr eigene Arbeitskreise, die sich mit der Rechteproblema­tik beschäf­tigen. Wichtig ist jedoch, dass ein DAMS über ein differenziertes System von Zugriffs- und Bearbeitungs­rechten verfügt und alle gewünschten Lizenzmodelle ab­bilden kann.

Digital Asset Management an der Universität Wien

Das erfolgreiche Projekt UNIDAM ist ein Digital Asset Management System, das durch eine Initiative der Philologisch-Kulturwissen­schaftlichen Fakultät aufgebaut wurde. Zu den ersten An­wendern gehörte das Institut für Kunstgeschichte mit Bild­datenbanken; seither sind viele weitere Inhalte dazuge­kommen. UNIDAM steht zwar prinzipiell allen Universi­tätsinstituten zur Verfügung, wurde aber speziell für die Bedürfnisse der Philologisch-Kulturwissenschaftlichen Fa­kul­tät ausgewählt und erfüllt daher nicht alle Anforderun­gen an ein universitätsweites System.

Vom Projektzentrum Lehrentwicklung, das großes Interesse an einem System zur Verwaltung und Archivierung digi­taler Lehrinhalte hat, ging die Initiative aus, ein universitätsweites DAMS zu schaffen. Gemeinsam mit der Universitäts­bibliothek, die einen dringenden Bedarf an einem System zur Verwaltung digitaler Ressourcen hat, sowie dem ZID, in dessen Kompetenz die technische Betreuung eines solchen Systems fällt, wurde Ende 2005 zu diesem Zweck ein Ar­beits­kreis gegründet.

Im März 2006 wurde ein Fragebogen an alle Institute versandt. Diese Umfrage brachte vor allem zwei wichtige Er­kenntnisse: Einerseits das enorme Interesse an Langzeit­archivierung, andererseits eine überraschend große Menge an nicht-digitalen Beständen, die digitalisiert werden oder in absehbarer Zeit digitalisiert werden sollen. Anhand der Ergebnisse dieser Umfrage wurden verschiedene am Markt verfügbare Produkte evaluiert.

Evaluierung

Digital Asset Management ist eine noch relativ junge Diszi­plin, deshalb ist hier die Auswahl an Softwareprodukten nicht allzu groß. Von allen untersuchten Produkten kamen vier in die engere Wahl, wobei auch Institutionen besucht wurden, in denen sie bereits zum Einsatz kommen:

  • DigiTool: Das bei weitem erfolgreichste kommerzielle DAM-Produkt ist DigiTool der israelischen Firma ExLibris, die auch das an der Universität Wien eingesetzte Biblio­thekssystem Aleph entwickelt hat. DigiTool wird beispielsweise von der Österreichischen Nationalbibliothek verwendet.
  • Fedora: Mehrere interessante Projekte benutzen das Open Source-DAMS Fedora, z.B. die Encyclopedia of Chicago und die Geisteswissenschaftliche Fakultät der Universität Graz.
  • EasyDB: Es wurde auch untersucht, ob die im UNIDAM-Projekt eingesetzte Software EasyDB für ein universitätsweites DAMS in Frage käme, was aber wegen mangelnder Unterstützung wichtiger Aspekte wie Langzeit­archivierung und Einhaltung von Standards nicht der Fall ist.
  • DSpace: Das Open Source-Produkt DSpace, das unter anderem an der Universität Edinburgh zum Einsatz kommt, konnte bei einer Prä­sentation nicht überzeugen.

Fedora

Letztlich standen ein kommerzielles (DigiTool) und ein Open Source-Produkt (Fedora) zur Auswahl. Die Kosten­unterschiede fielen bei der Entscheidungsfindung kaum ins Gewicht: Zwar entfallen bei Fedora die durchaus beträchtlichen Lizenzkosten, doch ist mit höherem Personalaufwand zu rechnen, um zusätzliche Features zu implementieren und das System an individuelle Bedürfnisse anzupassen.

Obwohl DigiTool durchaus allen Anforderungen entsprach (vor allem die Bedürfnisse der Universitätsbibliothek erfüllt es vorbildlich) und auch bei der Präsentation an der Öster­reichi­schen Nationalbibliothek keinen schlechten Eindruck machte, ging Fedora eindeutig als Sieger hervor.

Der große Vorteil von Fedora ist die Flexibilität: Die Kern­funktio­nen von Fedora beschränken sich auf die eines Re­pository, in dem die digitalen Objekte abgelegt werden. Über genormte XML-Schnittstellen (die so genannten Web Services) wird auf die Objekte zugegriffen. Solange diese Normen eingehalten werden, kann der Zugriff auf die Res­sourcen völlig frei gestaltet werden. Diese Fle­xi­bilität ist bei einer großen und heterogenen Universität, wo verschie­dene In­stitute und Forschungsbereiche die unterschiedlichsten An­for­derungen haben, von essentieller Be­deutung.

Implementierung eines universitätsweiten Digital Asset Management Systems

Im Dezember 2006 wurde dem Rektorat ein Projektplan vorgelegt, in dem die Auswahl von Fedora empfohlen wurde und genügend Personalressourcen für Projekt­ma­nagement und Leitung sowie für die Programmierung von Zusatz­features zu Fedora vorgesehen waren. Dieser Pro­jektplan wurde auch bewilligt, sodass Anfang 2007 mit der Umsetzung begonnen werden konnte.

Die ersten Pilotprojekte sollen gemeinsam mit drei Fakul­täten bzw. Zentren (Informatik, Physik, Translationswissen­schaften) durchgeführt werden. Die DLE Bibliotheks- und Archivwesen wird das Digital Asset Management System nicht nur betreiben, sondern auch mit eigenen Inhalten befüllen. Es ist damit zu rechnen, dass das DAM-Projekt der Uni Wien noch heuer zu ersten Ergeb­nissen führt, die allerdings nicht notwendigerweise öffentlich zu bestaunen sein werden - je nach gewählten Zu­griffsrechten werden manche Inhalte frei zugänglich sein, andere jedoch nicht.

Der Erfolg des Projektes hängt in erster Linie von den In­halten ab: Hochwertiger Content - z.B. Digitalisierungs­pro­jek­te, Forschungsergebnisse, die Sie als Aushängeschild der Öffent­lichkeit präsentieren wollen, Lehrinhalte von Lern­platt­formen, die Sie für die Zukunft aufbewahren wollen - ist stets willkommen.

 

Falls Sie Interesse haben, am Digital Asset Management System der Universität Wien teilzunehmen, kontaktieren Sie bitte dams.ub@univie.ac.at.



 

1) In diesem Fall versprechen wir, die URLs von Comment-Artikeln auf unbeschränkte Zeit beizubehalten und den Inhalt nicht nachträglich zu ändern - allerdings kann so eine Garantie von niemandem kontrolliert werden und ist daher von beschränktem Wert.

2) Wikipedia bietet für diesen Zweck die Option des so genannten Permanentlinks, bei der jede Version eines Dokuments gespeichert wird (siehe z.B. http://de.wikipedia.org/w/index.php?title=Idiot&oldid=9847828).

3) siehe dazu z.B. http://www.heise.de/newsticker/meldung/85686

4) www.dublincore.org, siehe auch http://de.wikipedia.org/wiki/Dublin_Core

5) Ein Beispiel für Metadaten, die in den Daten selbst enthalten sind, sind die so genannten EXIF-Einträge, die in praktisch allen von Digitalkameras generierten Bilddateien enthalten sind und An­gaben zur Aufnahme wie Datum und Uhrzeit, Kameramodell u.a. enthalten. Eine komfortable Upload-Funktion eines DAMS wird diese Metadaten automatisch extrahieren.

6) Im Unterschied zu den Verwertungsrechten ist das Urheberrecht ein unveräußerliches Recht und bleibt auf jeden Fall beim Urheber eines Werkes.