Der neue Webcluster
Leistungsfähige Frontend- und Backend-Architektur

von Peter Marksteiner (Ausgabe 09/1, April 2009)

 

Im comment 07/31) wurde ein neues Konzept vorgestellt, wie der Webserver www.univie.ac.at in Zukunft aufgebaut sein wird: Unter dieser Adresse ist nicht mehr der Webserver selbst anzusprechen, sondern nur ein Frontend, das alle Anfragen an Backend-Server weiterleitet; diese Backend-Server leisten den Großteil der Arbeit. Nachdem bei Bedarf beliebig viele Backend-Server eingesetzt werden können, skaliert so ein Cluster wesentlich besser als ein einzelner Server und kann praktisch beliebig viele Zugriffe verarbeiten.

Seither ist mehr als ein Jahr vergangen, und das Konzept wurde inzwischen zum Großteil umgesetzt. Es sind bereits ungefähr zehn Backend-Server im Einsatz, die meisten davon als virtuelle Server implementiert.2) Bisher konnten fast alle Webseiten auf die Backends übersiedelt werden. Bei der Übersiedlung gab es die eine oder andere Schwierigkeit – die neueren Versionen der eingesetzten Softwareprodukte (Apache, PHP, MySQL u. a.) sind mit den früheren nicht immer kompatibel, und auch die Cluster­architektur selbst mit Front- und Backends führt dazu, dass sich der Webserver manchmal etwas anders verhält, als einige Applikationen es erwarten. Abgesehen von diesen Anfangsschwierigkeiten – die in der Zwischenzeit fast vollständig beseitigt wurden – hat sich der neue Cluster hervorragend bewährt: Er ist sehr leistungsfähig und läuft stabil und zuverlässig.

Persönliche Homepages

Im ursprünglichen Konzept des Webclusters waren die persönlichen Homepages der Studierenden und Mitarbeiter/-innen nicht vorgesehen, vor allem, weil die Dateien (HTML-Dokumente, PHP-Skripts usw.)  auf anderen Fileservern liegen und nicht leicht in den Cluster integriert werden können. Mit einigem Aufwand war dies aber doch zu bewerkstelligen: Seit dem 15. Juni 2008 ist der Webserver für persönliche Homepages von Studierenden WWW.UNET.UNIVIE.AC.AT ein Teil des Clusters; am 22. November 2008 wurde auch HOMEPAGE.UNIVIE.AC.AT (persönliche Homepages von Mitarbeiter/-innen) in den Cluster übernommen.

Der Hauptvorteil dieser Integration liegt in der identischen Softwareumgebung: Alle Softwareprodukte liegen nun auf allen vom ZID betreuten Webservern in einheitlichen Versionen und Konfigurationen vor. Etliche Features und Werkzeuge (z. B. Statistiken, siehe Zugriffsstatistiken), die bisher nur auf WWW.UNIVIE.AC.AT zur Verfügung standen, können nun auch für persönliche Homepages genutzt werden.

Bisher lag das HTML-Verzeichnis auf demselben Server wie die sonstigen persönlichen Daten, nunmehr sind es zwei getrennte. In den meisten Fällen ist davon nichts zu bemerken, Zugriff erfolgt weiterhin über Fileservices oder über die Login-Server LOGIN.UNIVIE.AC.AT und LOGIN.UNET.UNIVIE.AC.AT. Einzig die Plattenplatzbeschränkung gilt jetzt getrennt für den File- und den Webserver: Für die Benutzer/-innen hat das den Vorteil, dass das Limit (Disk Quota) erhöht wurde: Für Webseiten steht nun 1 GB zusätzlich zur Verfügung, bei Bedarf kann der Plattenplatz zwischen File- und Webserver auch anders aufgeteilt werden. Allerdings wird dadurch die Buchführung komplizierter, weil die Daten nun über zwei bzw. sogar drei3) Server verstreut sind. Ein Überblick über die Quoten und die aktuelle Belegung ist auf Öffnet einen externen Link in einem neuen Fensterwww.univie.ac.at/ZID/account-info/ zu finden.

Zugriffsstatistiken

Vor allem im kommerziellen Bereich, wo jeder Klick Werbeeinnahmen bringt, interessieren sich die Betreiber von Webseiten brennend dafür, wie oft und von wem welche Seite aufgerufen wird. Im akademischen Bereich ist der finanzielle Aspekt weniger interessant, aber auch hier liefern Daten über die Reichweite und die Nutzerzahlen wichtiges Feedback.

Nach der Übersiedlung auf den Cluster stehen die bisherigen Statistiken nicht mehr zur Verfügung, stattdessen gibt es eine eigene Statistikseite unter Öffnet einen externen Link in einem neuen Fensterhttps://webstats.univie.ac.at/, wo die Auswertungen alle 10 Minuten aktualisiert abgerufen werden können.

Die Seite erfordert die Eingabe von UserID und Passwort, es kann entweder die Mailbox- oder u:net-UserID oder die eines Accounts am Webserver gewählt werden. Bei Eingabe einer Mailbox- oder u:net-UserID werden die Statistiken für die persönliche Homepage angezeigt sowie die für alle virtuellen Hosts und alle Unterseiten von WWW.UNIVIE.AC.AT, für die die UserID als Webmaster eingetragen ist.

Die Auswertung der Log-Dateien erfolgt mit Hilfe des Programms Webalizer4). Dieses generiert eine Übersichts­seite, die in graphischer und tabellarischer Form die wichtigsten Daten der letzten zwölf Monate anzeigt (Abb. 1). Zu jedem Monat gibt es noch detaillierte Auswertungen zu Tages- und Stundenverlauf (Abb. 2), den am häufigsten aufgerufenen Seiten, Suchbegriffen, über die die Seiten von Suchmaschinen gefunden wurden und vieles andere mehr.

Abb. 1: Zugriffsstatistiken der letzten 12 Monate für WWW.UNIVIE.AC.AT: Diese zeigen zu Semesterbeginn (Oktober 2008) den stärksten Zugriff auf die Webseiten der

1) siehe WWW.UNIVIE.AC.AT – Alte Adresse, neue Architektur in comment 07/3, Seite 20 (http://comment.univie.ac.at/07-3/20/)
2) siehe Aus eins mach zehn: Der Zauber der Virtualisierung in comment 07/2, Seite 7, (http://comment.univie.ac.at/07-2/7/)
3) Mitarbeiter/-innen haben zusätzlich noch lokalen Plattenplatz auf dem Login-Server. Dieser wird aber recht selten genutzt.
4) Öffnet einen externen Link in einem neuen Fensterwww.mrunix.net/webalizer/