Mit diesem Utility können Sie verlinkte Seiten automatisch laden und speichern. Ausgehend von einer oder mehreren Startseiten werden die Links verfolgt und im Cache-Archiv gespeichert.

Start des Utility

Sie starten die Spiegelung im Hauptmenü mit dem Symbol und erhalten den Konfigurationsdialog Mirror.

Alternativ können Sie die Spiegelung auch starten mit dem Skript MM3-Utility im Ordner MM3-WebAssistantProfessional/script/.

MM3-Mirror Konfiguration

Eine Mirror-Konfiguration können Sie in einem Set speichern. Benutzen Sie zunächst das Set default. Mit Neu legen Sie ein neues Set an. Weiterhin können Sie über ein Kontext-Menü (Pop up) ein Set Umbenennen oder Löschen.

Allgemein

Startseite

Ausgehend von einer oder mehreren Startseiten werden die Links verfolgt, Seiten geladen und im Cache-Archiv gespeichert. Für jede Startseite geben Sie die URL in einer neuen Zeile an.

Post Parameter

Benötigen Sie die Option Post, dann geben Sie hinter der URL ein Leerzeichen und danach die Parameter (key/value Liste) an.

Hinweis

Einschränkungen bestehen bei der Linkverfolgung von dynamischen Elementen, wie Java-Skript und Flash.

Sequenz

Geben Sie mehrere Startseiten an, so werden diese zunächst geladen (Tiefe 1).
Danach werden alle Links der Startseiten geladen (Tiefe 2), und so weiter.
Alternativ können die Startseiten auch sequentiell geladen werden.

Surf-Set

Es werden die Parameter des Surf-Set verwendet, mit Ausnahme von Marker und Prefetch.

Ein wichtiger Parameter ist die Wieder­verwendungszeit von Dateien im Cache-Archiv. Innerhalb ihrer Wieder­verwendungszeit werden Dateien nicht neu aus dem Internet geladen.

Abbruch

Oft ist vorab nicht absehbar, wie viele HTML-Seiten tatsächlich verfolgt und geladen werden. Verwenden Sie deshalb Abbruchkriterien, um die automatische Linkverfolgung zu begrenzen. Die Linkverfolgung wird abgebrochen, wenn ein Abbruchkriterium erreicht ist. Zusätzlich können Sie einen Filter benutzen.

Folgende Abbruchkriterien können Sie angeben:

Tiefe
Linktiefe der zu verfolgenden Link.
HTML-Seiten
Anzahl der maximal zu ladenden HTML-Seiten.
Volumen
Größe des maximal zu ladenden Datenvolumens.
Zeit
Maximale Zeit für die Dauer der Linkverfolgung in Minuten.

Wartezeit

Manche Server brechen ein automatisches Laden von Seiten ab, da hierbei die Seiten in viel schnellerer Folge abgerufen werden als dies beim Surfen erfolgt. Fügen Sie deshalb eine Wartezeit ein, am Besten lassen Sie diese zwischen einer minimalen und maximalen Wartezeit variieren.

Report

Ein Report der verfolgten Links kann erstellt werden. Sie können wählen, zwischen einem Report mit allen Links oder nur mit den Links, bei denen auch ein Download erfolgte.

Protokoll

Alle verfolgten Links werden standardmäßig protokolliert.

Zusätzlich können Sie folgende URLs protokollieren:
Protokoll mitIn einer HTML-Seite …
Enthaltene Ressourcenalle enthaltenen Ressourcen
Nicht verfolgte Linksalle nicht verfolgten Links

In der Zusammenfassung können zusätzlich nicht verfolgte Links protokolliert werden.

Hinweis

Mehrfach vorkommende Seiten und Ressourcen werden nur einmal protokolliert.

Linkverfolgung

Werden bei einer Spiegelung für Sie nicht interessante Seiten geladen, so können Sie dies mit einem Filter verhindern. In dem Filter können Sie definieren: Domain, Pfad, Dateiname, Datei- oder MIME-Typen. Zusätzlichen können Sie den Parameter Folgen angeben, welcher die Wirkung des Filters steuert.

Es bedeutet:
Folgen Link verfolgen oder ausschließen
JaVerfolgen: Falls der Link das Zeichenmuster des Filters enthält.
NeinAusschließen: Falls der Link das Zeichenmuster des Filters enthält.
---Deaktiviert: Filter wird nicht benutzt.

Falls beides, Verfolgen und Ausschließen, auf einen Link zu trifft, dann wird der Link ausgeschlossen und die Seite nicht geladen.

Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für die Linkverfolgung

Beispiel:
FolgenDomainPfadDateiTypQuery
Ja*.Proxy-Offline-Browser.de/*/ **
Nein*.Proxy-Offline-Browser.de/*/ *pdf application/pdf
Nein*.Proxy-Offline-Browser.de/private/*/**

Es werden nur Seiten aus der Domain Proxy-Offline-Browser.de geladen, jedoch keine PDF-Dokumente und Seiten aus dem Verzeichnis /private/ und dessen Unterverzeichnisse.

Hinweis

Bei Links für die kein Filter angegeben ist, können Sie auswählen, ob generell der Link zu verfolgen, ausschließen oder nachzufragen ist.
Bei Nachfragen können Sie interaktiv beim Spiegeln angegeben, ob ein Link zu verfolgen oder auszuschließen ist.

Mit Filter generieren können Sie die benötigten Filter aus den Startseiten generieren. Ein zusätzliches Muster kann die Filter noch anpassen.

Möchten Sie in einer Seite z. B. Bilder ausschließen, müssen Sie hierfür den Filter für Werbung benutzen.

Protokoll

Alle Seiten protokollieren, die von der Linkverfolgung ausgeschlossen werden. Hiermit können Sie die Einstellung des Filters überprüfen.

Authentifizierung

Für eine passwortgeschützte Web-Site kann der Benutzername und das Passwort gespeichert werden. Je nach Web-Site erfolgt die Anmeldung über zwei unterschiedliche Verfahren.

Anforderung durch den HTTP-Header

Erfolgt die Anmeldung durch den Header des HTTP-Protokolls, so können Sie Benutzername und Passwort hier angeben.

Es bedeutet:
Login Zugangsdaten für Web-Site
JaEinloggen: Für diese URL mit den Zugangsdaten einloggen.
NeinBlockieren: Für diese URL nicht mehr einloggen.
---Deaktiviert: Filter wird nicht benutzt.

Zusätzlich können Sie angeben, ob beim Aufruf einer geschützten Seite das Passwort gespeichert werden soll.

Passwörter können über ein Master-Passwort geschützt werden. Das Master-Passwort ist bei jeder Spiegelung anzugeben.

Start der Spiegelung

Nachdem Sie die benötigte Konfiguration ausgefüllt bzw. ein Set ausgewählt haben starten Sie die Spiegelung. Der Verlauf der Spiegelung wird in einem Dialog protokolliert. Beim Ende der Spiegelung oder beim Abbruch wird eine Zusammenfassung ausgegeben und ein Report kann im Browser angezeigt werden.

Anzeigen der Reports

Von der lokalen Sitemap gelangen Sie zu den Reports (bzw. mit der URL: http://127.0.0.1:8080/mirror/). Den gewünschten Report wählen Sie aus einer Liste aus. Ein Report enthält die verfolgten Links einer Spiegelung.

Den Umfang der Anzeige können Sie einstellen:

  • Anzahl der verfolgten Links pro Reportseite
  • Sortierfolge der verfolgten Links
  • Darstellung der Reportseite

In einem Report können Sie surfen.

Spiegeln

MM3 WebAssistant - Proxy Offline Browser