Archie
Ein globales Inhaltsverzeichnis der FTP-Server im Internet

(Ausgabe 94/3, Dezember 1994)

 

Auf fast jedem FTP-Server im Internet befindet sich eine Datei mit dem kompletten Verzeichnis aller auf dem jeweiligen Server verfügbaren Dateien und Directories. Ausgehend von der Idee, diese Dateien in regelmäßigen Abständen von allen wichtigen FTP-Servern abzuholen und in einer Datenbank zu speichern, entwickelte man an der McGill-Universität (Kanada) ein Informationssystem, das unter dem Namen "Archie" in den letzten Jahren zu einem wichtigen Dienst im Internet wurde: Derzeit stehen weltweit 26 Archie-Server den Netzbenutzern kostenlos zur Verfügung. Auch die Universität Wien betreibt unter der Internet-Adresse

ARCHIE.UNIVIE.AC.AT

einen Archie-Server, in dem derzeit die Inhaltsverzeichnisse von über 900 FTP-Servern gespeichert sind.

Bei der Verwendung von Archie muß man sich vor Augen halten, daß dieses Informationssystem nur über die Namen der Dateien und Directories verfügt. Wenn man sich etwa für das Spreadsheet "AsEasyAs" (ein beliebtes Shareware-Programm) interessiert, muß man wissen, daß die beiden Dateien für Version 5.50c unter den Namen asa55c-1.zip und asa55c-2.zip gespeichert sind. Manchmal kann einem jedoch der Directoryname weiterhelfen: Die momentan aktuelle PC-Version von Mosaic ist kaum zu finden, wenn man den Dateinamen wmos6Ar1.zip nicht kennt. Wenn man aber eine Abfrage mit dem Suchbegriff mosaic durchführt, wird für den FTP-Server der Universität Wien das Directory /pc/windows/mosaic aufgelistet - somit kennt man zumindest ein Directory, in dem man die gewünschte Datei vermuten kann.

Als Ergebnis einer Archie-Abfrage erhält man eine Liste all jener FTP-Server, bei denen mindestens eine Datei bzw. mindestens ein Directory mit dem Suchbegriff übereinstimmt. Welche Daten (bei einer Abfrage mittels Telnet) für diese Server ausgegeben werden, ist aus der folgenden Abbildung ersichtlich:

Ergebnis einer Archie-Abfrage mittels Telnet oder eMail, Suchbegriff "Anarchie"

Man kann zwischen mehreren Arten der Suche wählen (die Abfrage führt natürlich umso schneller zu einem Ergebnis, je genauer der Suchbegriff angegeben wird):

  • exact bedeutet, daß der Suchbegriff mit den gefundenen Datei- oder Directorynamen vollständig übereinstimmen muß, auch in Hinblick auf Groß-/Kleinschreibung.

  • substring führt bereits zu einem Treffer, wenn der Suchbegriff als Teilzeichenkette im Namen enthalten ist. Groß-/Kleinschreibung wird nicht berücksichtigt. (Der Suchbegriff hat trifft z.B. auf "that", "HAT" und "whatever" zu.)

  • subcase führt ebenfalls bereits zu einem Treffer, wenn der Suchbegriff als Teilzeichenkette im Namen enthalten ist, jedoch unter Berücksichtigung von Groß-/Kleinschreibung. (Der Suchbegriff hat trifft auf zwar "that" und "whatever" zu, nicht aber auf "HAT".)

  • regexp: Wer die "regular expressions" von Unix schätzt oder Denksportaufgaben liebt, kann sich mit Suchbegriffen wie ^[^abc]\$...[0-9] austoben.

Abfragen von Archie-Servern kann man von seinem Arbeitsplatz aus mit mehreren Methoden durchführen. Diese unterscheiden sich zwar hinsichtlich der Benutzeroberfläche, sollten aber für dieselbe Suche in der Datenbank immer ein identisches Resultat liefern. Welche der folgenden Arten des Zuganges Sie wählen, bleibt Ihnen überlassen.

Archie über eMail und Telnet

Wer nur Zugang zu eMail hat, kann trotzdem einen Archie-Server abfragen; wer an seinem Rechner über das Kommunikationsprogramm Telnet verfügt, kann auch interaktiv am Archie-Server arbeiten. Für beides empfiehlt sich folgende Vorgangsweise, um zu einer ersten Information zu kommen: Schreiben Sie eine eMail-Nachricht, die in der ersten Zeile des Textteils nur das Wort manpage enthält, an die Adresse

ARCHIE@ARCHIE.UNIVIE.AC.AT

Sie erhalten dann vom Server - ebenfalls per eMail - eine etwa 17 Seiten umfassende Beschreibung der Archie-Befehle. Diese Befehle können Sie (wie oben für das Kommando manpage beschrieben) an den Archie-Server schicken und erhalten die Ergebnisse der Abfragen per eMail. Wenn Sie lieber interaktiv arbeiten wollen, so können sie mit dem Befehl

telnet archie.univie.ac.at

die Verbindung zum Archie-Server aufbauen. Als User-ID geben Sie archie ein; nach einem Paßwort werden Sie nicht gefragt. Interaktiv kann man im großen und ganzen dieselben Befehle eingeben, die auch für das Arbeiten über eMail gültig sind. Falls beim interaktiven Recherchieren die Ergebnisse zu umfangreich werden und nicht mehr auf dem Bildschirm passen sollten, können Sie sich die Ergebnisse des jeweils letzten Befehls per eMail an Ihren Rechner schicken lassen.

Archie mit Archie-Programmen

Besonders komfortabel kann man mit dem Archie-Server im Client/Server-Mode arbeiten. Hier installiert man an seinem Rechner ein spezielles Archie-Programm (Client), das die Anfragen über das Netzwerk an den Archie-Server richtet und die Ergebnisse ansprechend graphisch darstellt. Voraussetzung ist, daß auf dem Arbeitsplatzrechner TCP/IP als Netzwerksoftware zur Verfügung steht. Windows-Programme, die das Netzwerk mittels TCP/IP verwenden, benötigen die Datei winsock.dll, die z.B. in dem vom EDV-Zentrum distributierten Softwarepaket PC/TCP enthalten ist.

Archie-Klienten mit graphischen Oberflächen sind am FTP-Server der Uni Wien an folgenden Stellen gespeichert:

  • PCs unter MS-Windows:
    /pc/windows/cica/winsock/wsarch06.zip

Benutzeroberfläche des Archie-Klienten "WSARCHIE" für MS-Windows
  • PCs unter OS/2:
    /os2/hobbes/network/tcpip/pmarchie.zip

  • Macintosh:
    /mac/MacSciTech/comm/Anarchie-113.sit.hqx

Benutzeroberfläche des Archie-Klienten "Anarchie" für Macintosh; die Suchergebnisse werden in einem eigenen Fenster in Listenform präsentiert
  • Unix-Workstations unter X-Windows:
    /packages/x11/R5contrib/xarchie-2.0.9.tar.Z
    (X11 Release 5)
    /packages/x11/contrib/applications/xarchie-2.0.10.tar.gz (X11 Release 6)
Benutzeroberfläche des Archie-Klienten "xarchie" für X-Windows

Die Konfiguration der Programme beschränkt sich meist darauf, die Adresse des nächsten Archie-Servers - in unserem Fall ARCHIE.UNIVIE.AC.AT - in die Konfigurationsdatei einzutragen. Die Klienten bieten zusätzlich die Möglichkeit, die gesuchten Dateien in der Ergebnisliste zu markieren und die Dateiübertragung vom Archie-Programm aus zu starten.

Wer graphische Oberflächen verabscheut oder über keinen geeigneten Rechner verfügt, kann auf befehlsorientierte Archie-Klienten zurückgreifen:

  • PCs unter MS-DOS:
    /pc/dos/lan/archie.zip

  • PCs unter OS/2:
    /os2/hobbes/network/tcpip/archie.zip

  • Unix-Workstations:
    /systems/hpux/hpux/Networking/Misc/archie-1.4.1

Archie über Gopher

Hat man an seinem Rechner bereits Gopher- oder WWW-Klienten wie z.B. Mosaic installiert, kann man auch ohne eigenen Archie-Klienten auskommen. Unter dem URL gopher://archie.univie.ac.at:7070/1 finden Sie derzeit ein Gopher-Menü, in dem Sie sich zuerst für die Suche in der Archie-Datenbank für FTP-Server oder einer noch im Aufbau befindlichen Archie-Datenbank für Gopher-Server entscheiden können.

Sobald Sie die Art der Suche ausgewählt haben, können Sie in den folgenden Schirmen den Suchbegriff und den Typ der Suche angeben. Wünscht man sich das Resultat der Suche als Datei, so erhält man die übliche Liste der Dateien und Directories, auf deren Namen der Suchbegriff zutrifft. Hat man angegeben, daß das Resultat der Suche als Menü dargestellt werden soll, so erscheint ein Gophermenü, in dem die gefundenen Dateien als Menüpunkte dargestellt werden. Mit der Auswahl eines der Menüpunkte starten Sie die Übertragung der entsprechenden Datei auf Ihren Rechner.

Auch wenn Archie, wie eingangs beschrieben, nicht immer helfen kann, hat sich dieser Informationsdienst im Internet als nützliches Werkzeug etabliert - allein der Archie-Server an der Universität Wien verzeichnet über 400.000 Anfragen pro Jahr.