Mit diesem Utility können Sie verlinkte Seiten automatisch laden und speichern. Ausgehend von einer oder mehreren Startseiten werden die Links verfolgt und im Cache-Archiv gespeichert.
Start des Utility
Sie starten die Spiegelung im Hauptmenü mit dem Symbol und erhalten den Konfigurationsdialog Mirror.
Alternativ können Sie die Spiegelung auch starten mit dem Skript MM3-Utility im Ordner MM3-WebAssistantProfessional/script/.
Eine Mirror-Konfiguration können Sie in einem Set speichern. Benutzen Sie zunächst das Set default. Mit Neu legen Sie ein neues Set an. Weiterhin können Sie über ein Kontext-Menü (Pop up) ein Set Umbenennen oder Löschen.
Allgemein
Startseite
Ausgehend von einer oder mehreren Startseiten werden die Links verfolgt, Seiten geladen und im Cache-Archiv gespeichert. Für jede Startseite geben Sie die URL in einer neuen Zeile an.
Post Parameter
Benötigen Sie die Option Post, dann geben Sie hinter der URL ein Leerzeichen und danach die Parameter (key/value Liste) an.
Hinweis
Einschränkungen bestehen bei der Linkverfolgung von dynamischen Elementen, wie Java-Skript und Flash.
Sequenz
Geben Sie mehrere Startseiten an, so werden diese zunächst geladen (Tiefe 1).
Danach werden alle Links der Startseiten geladen (Tiefe 2), und so weiter.
Alternativ können die Startseiten auch sequentiell geladen werden.
Surf-Set
Es werden die Parameter des Surf-Set verwendet, mit Ausnahme von Marker und Prefetch.
Ein wichtiger Parameter ist die Wiederverwendungszeit von Dateien im Cache-Archiv. Innerhalb ihrer Wiederverwendungszeit werden Dateien nicht neu aus dem Internet geladen.
Abbruch
Oft ist vorab nicht absehbar, wie viele HTML-Seiten tatsächlich verfolgt und geladen werden. Verwenden Sie deshalb Abbruchkriterien, um die automatische Linkverfolgung zu begrenzen. Die Linkverfolgung wird abgebrochen, wenn ein Abbruchkriterium erreicht ist. Zusätzlich können Sie einen Filter benutzen.
Folgende Abbruchkriterien können Sie angeben:
- Tiefe
- Linktiefe der zu verfolgenden Link.
- HTML-Seiten
- Anzahl der maximal zu ladenden HTML-Seiten.
- Volumen
- Größe des maximal zu ladenden Datenvolumens.
- Zeit
- Maximale Zeit für die Dauer der Linkverfolgung in Minuten.
Wartezeit
Manche Server brechen ein automatisches Laden von Seiten ab, da hierbei die Seiten in viel schnellerer Folge abgerufen werden als dies beim Surfen erfolgt. Fügen Sie deshalb eine Wartezeit ein, am Besten lassen Sie diese zwischen einer minimalen und maximalen Wartezeit variieren.
Report
Ein Report der verfolgten Links kann erstellt werden. Sie können wählen, zwischen einem Report mit allen Links oder nur mit den Links, bei denen auch ein Download erfolgte.
Protokoll
Alle verfolgten Links werden standardmäßig protokolliert.
Protokoll mit | In einer HTML-Seite … |
---|---|
Enthaltene Ressourcen | alle enthaltenen Ressourcen |
Nicht verfolgte Links | alle nicht verfolgten Links |
In der Zusammenfassung können zusätzlich nicht verfolgte Links protokolliert werden.
Hinweis
Mehrfach vorkommende Seiten und Ressourcen werden nur einmal protokolliert.
Linkverfolgung
Werden bei einer Spiegelung für Sie nicht interessante Seiten geladen, so können Sie dies mit einem Filter verhindern. In dem Filter können Sie definieren: Domain, Pfad, Dateiname, Datei- oder MIME-Typen. Zusätzlichen können Sie den Parameter Folgen angeben, welcher die Wirkung des Filters steuert.
Folgen | Link verfolgen oder ausschließen |
---|---|
Ja | Verfolgen: Falls der Link das Zeichenmuster des Filters enthält. |
Nein | Ausschließen: Falls der Link das Zeichenmuster des Filters enthält. |
--- | Deaktiviert: Filter wird nicht benutzt. |
Falls beides, Verfolgen und Ausschließen, auf einen Link zu trifft, dann wird der Link ausgeschlossen und die Seite nicht geladen.
Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für die Linkverfolgung
Folgen | Domain | Pfad | Datei | Typ | Query |
---|---|---|---|---|---|
Ja | / | ||||
Nein | / | pdf application/pdf | |||
Nein | /private/ |
Es werden nur Seiten aus der Domain Proxy-Offline-Browser.de geladen, jedoch keine PDF-Dokumente und Seiten aus dem Verzeichnis /private/ und dessen Unterverzeichnisse.
Hinweis
Bei Links für die kein Filter angegeben ist, können Sie auswählen, ob generell der Link zu verfolgen, ausschließen oder nachzufragen ist.
Bei Nachfragen können Sie interaktiv beim Spiegeln angegeben, ob ein Link zu verfolgen oder auszuschließen ist.
Mit Filter generieren können Sie die benötigten Filter aus den Startseiten generieren. Ein zusätzliches Muster kann die Filter noch anpassen.
Möchten Sie in einer Seite z. B. Bilder ausschließen, müssen Sie hierfür den Filter für Werbung benutzen.
Protokoll
Alle Seiten protokollieren, die von der Linkverfolgung ausgeschlossen werden. Hiermit können Sie die Einstellung des Filters überprüfen.
Cookie
Cookies können je nach Filtereinstellung angenommen oder blockiert werden. Neben dem Datenschutz können Sie hiermit z. B. die Darstellung eines Navigationsverlaufs (Krümelpfad) auf einer HTML-Seite verhindern.
Annehmen | Cookie annehmen oder blockieren |
---|---|
Ja | Annehmen: Falls die URL das Zeichenmuster des Filters enthält. |
Nein | Blockieren: Falls die URL das Zeichenmuster des Filters enthält. |
--- | Deaktiviert: Filter wird nicht benutzt. |
Falls beides, Annehmen und Blockieren, auf ein Cookie zu trifft, dann wird das Cookie blockiert.
Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für Cookie
Annehmen | Domain | Pfad |
---|---|---|
Nein | / |
Es werden keine Cookies angenommen.
Protokoll
Alle angenommenen Cookies werden protokolliert. Hiermit können Sie die Einstellung des Filters überprüfen.
Authentifizierung
Für eine passwortgeschützte Web-Site kann der Benutzername und das Passwort gespeichert werden. Je nach Web-Site erfolgt die Anmeldung über zwei unterschiedliche Verfahren.
Anforderung durch den HTTP-Header
Erfolgt die Anmeldung durch den Header des HTTP-Protokolls, so können Sie Benutzername und Passwort hier angeben.
Login | Zugangsdaten für Web-Site |
---|---|
Ja | Einloggen: Für diese URL mit den Zugangsdaten einloggen. |
Nein | Blockieren: Für diese URL nicht mehr einloggen. |
--- | Deaktiviert: Filter wird nicht benutzt. |
Zusätzlich können Sie angeben, ob beim Aufruf einer geschützten Seite das Passwort gespeichert werden soll.
Passwörter können über ein Master-Passwort geschützt werden. Das Master-Passwort ist bei jeder Spiegelung anzugeben.
Start der Spiegelung
Nachdem Sie die benötigte Konfiguration ausgefüllt bzw. ein Set ausgewählt haben starten Sie die Spiegelung. Der Verlauf der Spiegelung wird in einem Dialog protokolliert. Beim Ende der Spiegelung oder beim Abbruch wird eine Zusammenfassung ausgegeben und ein Report kann im Browser angezeigt werden.
Anzeigen der Reports
Von der lokalen Sitemap gelangen Sie zu den Reports (bzw. mit der URL: http://127.0.0.1:8080/mirror/). Den gewünschten Report wählen Sie aus einer Liste aus. Ein Report enthält die verfolgten Links einer Spiegelung.
Den Umfang der Anzeige können Sie einstellen:
- Anzahl der verfolgten Links pro Reportseite
- Sortierfolge der verfolgten Links
- Darstellung der Reportseite
In einem Report können Sie surfen.