Digitale Reichtümer
Was ist ein Digital Asset Management System und warum braucht die Universität Wien eines?
von Peter Marksteiner (Ausgabe 07/1, März 2007)
Jahrhundertelang wurden die Ergebnisse universitärer Lehre und Forschung fast ausschließlich in Papierform produziert. Es ist hauptsächlich Aufgabe der Bibliotheken, diese Schriften aufzubewahren, zu verwalten und zugänglich zu machen. In der langen Geschichte des wissenschaftlichen Bibliothekswesens haben sich hier erprobte Arbeitsweisen und Standards etabliert, sodass die Bibliotheken diese Aufgaben professionell und zuverlässig erfüllen.
Immer mehr Forschungsergebnisse und Lehrinhalte liegen jedoch ausschließlich in digitaler Form vor. Dabei kann es sich um die elektronische Form von Printmedien handeln (z.B. Electronic Journals), aber auch um Bilddaten, Audio- und Videomaterial, Softwareprodukte, Online-Lehrgänge aus Lernplattformen, Datenbanken und vieles andere.
Vielfach werden Online-Ressourcen jedoch nicht ganz ernst genommen: Was zählt, ist eine Publikation in einer renommierten Zeitschrift, alles andere ist bestenfalls schmückendes Beiwerk. Einerseits liegt das an einer gewissen Trägheit des Wissenschaftsbetriebes bei der Akzeptanz neuer Medien und wohl auch an wirtschaftlichen Interessen (z.B. der wissenschaftlichen Verlage); andererseits fehlt elektronischen Ressourcen tatsächlich noch einiges, was bei Zeitschriften und Büchern durch die lange etablierten Standards gegeben ist.
Ein Hauptproblem digitaler Ressourcen ist ihre Flüchtigkeit. Während sich an Gedrucktem kaum je etwas ändert, sind Webseiten und andere digitale Datenbestände ständig im Fluss. Eine direkte Konsequenz der Flüchtigkeit ist die mangelnde Zitierbarkeit. Es gibt genaue Regeln, wie wissenschaftliche Arbeiten zu zitieren sind. Findet man z.B. in einer Publikation das Zitat "A. Einstein, Ann. Phys., 17(1905), pp. 891-921", so mag es zwar vielleicht mühsam sein, die Originalarbeit in einer Bibliothek auszuheben, man kann aber sicher sein, die richtige Arbeit - in diesem Fall zu Einsteins spezieller Relativitätstheorie - zu finden.
Ganz anders verhält es sich bei Zitaten von Webinhalten und anderen digitalen Ressourcen. Hier haben sich noch keine verbindlichen Zitierregeln etabliert, die einfache Angabe von URLs ist unzureichend: Niemand garantiert, dass beispielsweise www.univie.ac.at/comment/06-2/062_27.html nach fünf Jahren noch immer existiert bzw. dass dort noch dasselbe Dokument zu finden ist wie zu dem Zeitpunkt, als es zitiert wurde.1) Besonders schwierig ist das Zitieren von dynamisch generierten Webseiten bzw. solchen, die sich sehr rasch ändern wie z.B. Wikis.2)
Es wurden verschiedene Lösungen für das Zitieren von Online-Ressourcen vorgeschlagen, z.B. den kompletten Inhalt von zitierten Webseiten auszudrucken und der Arbeit beizulegen. Andere kommen zu dem Schluss, dass Webzitate überhaupt unzulässig sind und nur auf Papier Gedrucktes wahren wissenschaftlichen Wert hat. Ich finde diese Schlussfolgerung absurd: Anstatt die Existenz von Online-Ressourcen zu ignorieren und deren wissenschaftlichen Wert zu leugnen, ist es vielmehr erforderlich, die Werkzeuge zu schaffen, mit denen digitale Daten die notwendigen Eigenschaften wie Beständigkeit, Auffindbarkeit und Zitierbarkeit erhalten - und genau das ist die Funktion eines Digital Asset Management Systems (DAMS).
Anforderungen an ein Digital Asset Management System
Langzeitarchivierung
Die Aufgaben und Herausforderungen bei der Aufbewahrung geschriebener und gedruckter Dokumente für künftige Generationen sind wohlbekannt. Trotz vieler schmerzlicher Verluste durch Brände, Kriege, Diebstähle oder einfach den "Zahn der Zeit" ist eine beachtliche Anzahl an Schriften aus früheren Jahrhunderten erhalten, und das oft in einem bemerkenswert guten Zustand: Säurefreies Papier überdauert problemlos mehrere hundert Jahre, so manche Pergament-Handschrift aus dem frühen Mittelalter oder der Spätantike wirkt nach mehr als tausend Jahren so frisch, als hätte sie eben erst das Skriptorium verlassen. Große Bibliotheken verfügen über eigene Abteilungen für die Konservierung und Restaurierung ihrer Bestände.
Bei digitalen Objekten ist die Haltbarkeit des physischen Mediums vermutlich wesentlich kürzer als die Jahrhunderte, die Papier überdauern kann: Festplatten geben nach wenigen Jahren den Geist auf, Magnetbänder reagieren sehr empfindlich auf magnetische Einflüsse, was sie oft sehr schnell unlesbar macht. Viele digitale Medien (z.B. DVD) sind noch recht neu; über ihre Haltbarkeit ist wenig bekannt.3) Im Gegensatz zu Gedrucktem lassen sich digitale Objekte jedoch verlustfrei kopieren: Es besteht kein Unterschied zwischen Original und Kopie. Deshalb ist die Vergänglichkeit des physischen Mediums nur insofern ein Problem, als ein regelmäßiges Umkopieren auf neue Datenträger erforderlich ist. Beispielsweise findet sich auf dem Webserver der Universität Wien (WWW.UNIVIE.AC.AT) so manche Datei aus dem Jahr 1995, obwohl seither mehrmals die Hardware getauscht wurde (zuletzt bei der Übersiedlung der Daten in das Storage Area Network).
Die wahren Probleme der digitalen Langzeitarchivierung liegen anderswo: Einerseits brauchen digitale Objekte eine "Heimstätte", die dauerhafter ist als die üblichen Webseiten, deren Lebenszeit selten mehr als ein paar Jahre beträgt. Andererseits muss sichergestellt werden, dass die verwendeten Datenformate auch in Zukunft noch lesbar sind.
Auch wenn viele ältere Datenträger wie Magnetband-Spulen oder 8-Zoll-Disketten physisch unversehrt sein mögen, so sind die Daten darauf nur mit enormem Aufwand zu lesen, weil es heutzutage fast überall an entsprechenden Geräten und Laufwerken fehlt. So manches Textverarbeitungsprogramm, das Mitte der Achtzigerjahre des vorigen Jahrhunderts populär war, ist inzwischen in Vergessenheit geraten, sodass Dokumente, die mit solchen Programmen geschrieben wurden, nur mehr mühsam zu entziffern sind.
Selbstverständlich kann heute niemand wissen, welche Formate noch in hundert Jahren lesbar sein werden. Durch die Beschränkung auf Standard-Formate, die zusätzlich noch möglichst self-contained sein sollen (d.h. bei denen alle erforderlichen Informationen wie z.B. die verwendeten Schriftarten im Dokument selbst enthalten sind), besteht zwar keine Garantie, aber immerhin eine hohe Wahrscheinlichkeit, dass auch unsere Urenkel sich noch an den digitalen Schätzen erfreuen können, die wir heute produzieren.
Metadaten: Standards und Schnittstellen
Wollte man ein Buch in einer Bibliothek ins Regal stellen, aber nicht in den Katalog aufnehmen, so wäre dieses praktisch wertlos. Erst die Aufnahme von Autor, Titel, Verlag, Jahrgang, ISBN, Aufstellungsort usw. in den Bibliothekskatalog sowie die Erfassung von Kategorien und Schlagwörtern macht das Buch zum Bestandteil einer Bibliothek. Die fehlerfreie Katalogisierung und Beschlagwortung ist durchaus keine triviale Aufgabe und erfordert geschultes Fachpersonal.
Ähnliche Anforderungen gibt es bei der Erfassung digitaler Objekte: Zusätzlich zum Objekt selbst (beispielsweise eine Bilddatei) muss eine Beschreibung des Objekts mit Daten wie Autor, Datum der Erstellung usw. abgespeichert werden. Diese Art von Zusatzinformationen bezeichnet man als Metadaten.
Bei der Beschreibung digitaler Ressourcen muss ein Kompromiss gefunden werden: Einerseits ist größtmögliche Einheitlichkeit und Standardisierung gewünscht, was z.B. für globale Suchfunktionen unerlässlich ist. Andererseits ist hohe Flexibilität erforderlich: Verständlicherweise sind für die Beschreibung von digitalisierten archäologischen Funden ganz andere Metadaten erforderlich (z.B. Fundort) als etwa bei NMR-Spektren von chemischen Verbindungen (z.B. chemische Formel, verwendetes Messgerät).
Der wichtigste Metadaten-Standard, der 1994 definiert wurde und sich bereits weitgehend durchgesetzt hat, ist der so genannte Dublin Core-Standard.4) Der Name "Core" deutet bereits an, dass es sich dabei um die Kern-Elemente von Metadaten handelt, die noch durch beliebige Zusatzinformationen erweitert werden können. Zu den 15 Elementen des Dublin Core gehören beispielsweise eine eindeutige Identifikation des Objektes, die auch die Zitierbarkeit sicherstellt, die Art des Objekts (Bild, Text, physisches Objekt usw.) und Personen (Autor, Herausgeber).
Besonders wichtig ist das Einhalten von Standards, wenn Daten zwischen mehreren Systemen ausgetauscht werden sollen oder eine gemeinsame Suchfunktion über mehrere Sammlungen von Objekten gewünscht ist. Wer beispielsweise eine Bilddatenbank aufbaut, ohne sich um Metadaten-Standards zu kümmern, mag sich dadurch anfangs einiges an Arbeit ersparen, ohne einen Verlust an Funktionalität zu bemerken. Das rächt sich jedoch, sobald einmal ein Wechsel der Software erforderlich wird oder eine Vereinigung mit anderen Datenbanken gewünscht ist: Durch Standard-Formate kann man sich in diesen Fällen aufwendige Migrations-Programme ersparen.
Die Bedeutung von Standard-Formaten für die Langzeitarchivierung wurde bereits erwähnt; dasselbe gilt selbstverständlich auch für Metadaten.
Suchen und Finden, Pflegen und Betreuen
Es ist nicht damit getan, digitale Objekte für künftige Generationen ins Archiv zu stellen und dort virtuell verstauben zu lassen: Mindestens genau so wichtig ist der praktische Nutzen für die Gegenwart. Dazu gehört eine effiziente Suchfunktion, wobei durchaus auch Objekte gefunden werden können, die sich physisch anderswo befinden. In einem solchen Fall verwaltet das DAMS nur die Metadaten, anstelle des eigentlichen Objekts enthält es nur einen Verweis, wo dieses zu finden ist.
Weiters gehören zu einem solchen System Werkzeuge, die die Verwendung der digitalen Objekte in Forschung und Lehre ermöglichen. Zwar ist ein DAMS primär kein Content Management System (CMS) und auch keine Lernplattform (Learning Management System, LMS), aber die Funktionen dieser Systeme überschneiden sich teilweise. Welche Werkzeuge benötigt werden, hängt stark von der Art der Objekte ab: Bei Bilddateien sind das etwa Funktionen wie Generieren verschiedener Qualitätsstufen und Auflösungen, verschiedene Methoden von Darstellung und Projektion usw.
Eine wichtige Komponente sind auch die Hilfsmittel bei der Erfassung und Pflege von Daten: Möglichst automatisierte Generierung von Metadaten aus den Daten selbst5), Methoden des Ingest, also der massenweisen Übernahme von Daten aus anderen Systemen, Hilfsmittel bei der Qualitätskontrolle usw.
Rechteverwaltung
Die Problematik von Urheber- und Verwertungsrechten digitaler Ressourcen ist ein schwieriges Feld, wo es noch viele ungelöste Fragen gibt. Meistens sind daran drei Parteien beteiligt: die Urheber (Autoren, Künstler, Forscher); die Inhaber der Verwertungsrechte, die von den Urhebern an diese mehr oder minder freiwillig abgetreten wurden (Verlage, Auftraggeber von Forschungsprojekten, Verwertungsgesellschaften)6); die Öffentlichkeit bzw. der Kundenkreis, der auf die digitalen Ressourcen zugreifen und diese nutzen will. Es ist Aufgabe des Gesetzgebers, einen gerechten Ausgleich zwischen den einander widersprechenden, mehr oder minder berechtigten Interessen der drei Beteiligten zu schaffen - eine Aufgabe, die er wohl noch nicht ganz zur allgemeinen Zufriedenheit gelöst hat.
Es gibt ein breites Spektrum von Meinungen zur digitalen Rechteproblematik. Am einen Ende der Skala stehen die Befürworter des Open Access-Gedankens, die die Meinung vertreten, dass universitäre Forschung von der Öffentlichkeit durch Steuermittel bezahlt wurde und dass daher die Öffentlichkeit das Recht habe, ohne Einschränkungen und weitere Kosten die Ergebnisse dieser Forschung zu nutzen. Am anderen Ende stehen die Verfechter eines restriktiven Digital Rights Management, die den öffentlichen Zugang zu digitalen Ressourcen so weit wie möglich einschränken und bei jeder Nutzung bei den Rechteverwertern - seltener bei den Urhebern - die Kasse klingeln lassen wollen.
Antworten auf diese Fragen zu finden, ist nicht Aufgabe eines Digital Asset Management-Projekts; es gibt vielmehr eigene Arbeitskreise, die sich mit der Rechteproblematik beschäftigen. Wichtig ist jedoch, dass ein DAMS über ein differenziertes System von Zugriffs- und Bearbeitungsrechten verfügt und alle gewünschten Lizenzmodelle abbilden kann.
Digital Asset Management an der Universität Wien
Das erfolgreiche Projekt UNIDAM ist ein Digital Asset Management System, das durch eine Initiative der Philologisch-Kulturwissenschaftlichen Fakultät aufgebaut wurde. Zu den ersten Anwendern gehörte das Institut für Kunstgeschichte mit Bilddatenbanken; seither sind viele weitere Inhalte dazugekommen. UNIDAM steht zwar prinzipiell allen Universitätsinstituten zur Verfügung, wurde aber speziell für die Bedürfnisse der Philologisch-Kulturwissenschaftlichen Fakultät ausgewählt und erfüllt daher nicht alle Anforderungen an ein universitätsweites System.
Vom Projektzentrum Lehrentwicklung, das großes Interesse an einem System zur Verwaltung und Archivierung digitaler Lehrinhalte hat, ging die Initiative aus, ein universitätsweites DAMS zu schaffen. Gemeinsam mit der Universitätsbibliothek, die einen dringenden Bedarf an einem System zur Verwaltung digitaler Ressourcen hat, sowie dem ZID, in dessen Kompetenz die technische Betreuung eines solchen Systems fällt, wurde Ende 2005 zu diesem Zweck ein Arbeitskreis gegründet.
Im März 2006 wurde ein Fragebogen an alle Institute versandt. Diese Umfrage brachte vor allem zwei wichtige Erkenntnisse: Einerseits das enorme Interesse an Langzeitarchivierung, andererseits eine überraschend große Menge an nicht-digitalen Beständen, die digitalisiert werden oder in absehbarer Zeit digitalisiert werden sollen. Anhand der Ergebnisse dieser Umfrage wurden verschiedene am Markt verfügbare Produkte evaluiert.
Evaluierung
Digital Asset Management ist eine noch relativ junge Disziplin, deshalb ist hier die Auswahl an Softwareprodukten nicht allzu groß. Von allen untersuchten Produkten kamen vier in die engere Wahl, wobei auch Institutionen besucht wurden, in denen sie bereits zum Einsatz kommen:
- DigiTool: Das bei weitem erfolgreichste kommerzielle DAM-Produkt ist DigiTool der israelischen Firma ExLibris, die auch das an der Universität Wien eingesetzte Bibliothekssystem Aleph entwickelt hat. DigiTool wird beispielsweise von der Österreichischen Nationalbibliothek verwendet.
- Fedora: Mehrere interessante Projekte benutzen das Open Source-DAMS Fedora, z.B. die Encyclopedia of Chicago und die Geisteswissenschaftliche Fakultät der Universität Graz.
- EasyDB: Es wurde auch untersucht, ob die im UNIDAM-Projekt eingesetzte Software EasyDB für ein universitätsweites DAMS in Frage käme, was aber wegen mangelnder Unterstützung wichtiger Aspekte wie Langzeitarchivierung und Einhaltung von Standards nicht der Fall ist.
- DSpace: Das Open Source-Produkt DSpace, das unter anderem an der Universität Edinburgh zum Einsatz kommt, konnte bei einer Präsentation nicht überzeugen.
Fedora
Letztlich standen ein kommerzielles (DigiTool) und ein Open Source-Produkt (Fedora) zur Auswahl. Die Kostenunterschiede fielen bei der Entscheidungsfindung kaum ins Gewicht: Zwar entfallen bei Fedora die durchaus beträchtlichen Lizenzkosten, doch ist mit höherem Personalaufwand zu rechnen, um zusätzliche Features zu implementieren und das System an individuelle Bedürfnisse anzupassen.
Obwohl DigiTool durchaus allen Anforderungen entsprach (vor allem die Bedürfnisse der Universitätsbibliothek erfüllt es vorbildlich) und auch bei der Präsentation an der Österreichischen Nationalbibliothek keinen schlechten Eindruck machte, ging Fedora eindeutig als Sieger hervor.
Der große Vorteil von Fedora ist die Flexibilität: Die Kernfunktionen von Fedora beschränken sich auf die eines Repository, in dem die digitalen Objekte abgelegt werden. Über genormte XML-Schnittstellen (die so genannten Web Services) wird auf die Objekte zugegriffen. Solange diese Normen eingehalten werden, kann der Zugriff auf die Ressourcen völlig frei gestaltet werden. Diese Flexibilität ist bei einer großen und heterogenen Universität, wo verschiedene Institute und Forschungsbereiche die unterschiedlichsten Anforderungen haben, von essentieller Bedeutung.
Implementierung eines universitätsweiten Digital Asset Management Systems
Im Dezember 2006 wurde dem Rektorat ein Projektplan vorgelegt, in dem die Auswahl von Fedora empfohlen wurde und genügend Personalressourcen für Projektmanagement und Leitung sowie für die Programmierung von Zusatzfeatures zu Fedora vorgesehen waren. Dieser Projektplan wurde auch bewilligt, sodass Anfang 2007 mit der Umsetzung begonnen werden konnte.
Die ersten Pilotprojekte sollen gemeinsam mit drei Fakultäten bzw. Zentren (Informatik, Physik, Translationswissenschaften) durchgeführt werden. Die DLE Bibliotheks- und Archivwesen wird das Digital Asset Management System nicht nur betreiben, sondern auch mit eigenen Inhalten befüllen. Es ist damit zu rechnen, dass das DAM-Projekt der Uni Wien noch heuer zu ersten Ergebnissen führt, die allerdings nicht notwendigerweise öffentlich zu bestaunen sein werden - je nach gewählten Zugriffsrechten werden manche Inhalte frei zugänglich sein, andere jedoch nicht.
Der Erfolg des Projektes hängt in erster Linie von den Inhalten ab: Hochwertiger Content - z.B. Digitalisierungsprojekte, Forschungsergebnisse, die Sie als Aushängeschild der Öffentlichkeit präsentieren wollen, Lehrinhalte von Lernplattformen, die Sie für die Zukunft aufbewahren wollen - ist stets willkommen.
Falls Sie Interesse haben, am Digital Asset Management System der Universität Wien teilzunehmen, kontaktieren Sie bitte dams.ub@univie.ac.at.
1) In diesem Fall versprechen wir, die URLs von Comment-Artikeln auf unbeschränkte Zeit beizubehalten und den Inhalt nicht nachträglich zu ändern - allerdings kann so eine Garantie von niemandem kontrolliert werden und ist daher von beschränktem Wert.
2) Wikipedia bietet für diesen Zweck die Option des so genannten Permanentlinks, bei der jede Version eines Dokuments gespeichert wird (siehe z.B. http://de.wikipedia.org/w/index.php?title=Idiot&oldid=9847828).
3) siehe dazu z.B. http://www.heise.de/newsticker/meldung/85686
4) www.dublincore.org, siehe auch http://de.wikipedia.org/wiki/Dublin_Core
5) Ein Beispiel für Metadaten, die in den Daten selbst enthalten sind, sind die so genannten EXIF-Einträge, die in praktisch allen von Digitalkameras generierten Bilddateien enthalten sind und Angaben zur Aufnahme wie Datum und Uhrzeit, Kameramodell u.a. enthalten. Eine komfortable Upload-Funktion eines DAMS wird diese Metadaten automatisch extrahieren.
6) Im Unterschied zu den Verwertungsrechten ist das Urheberrecht ein unveräußerliches Recht und bleibt auf jeden Fall beim Urheber eines Werkes.








uni:it-Newsletter