Mit diesem Utility können Sie die Seiten eines Cache-Archiv aktualisieren. Ausgehend von einer oder mehreren Startseiten werden die Links zu bereits archivierten Seiten verfolgt und veränderte Seiten in einem Update-Archiv gespeichert.
Start des Utility
Sie starten die Aktualisierung mit einer der folgenden Skript-Dateien im Ordner: MM3-WebAssistantProfessional/script/
Skript | Betriebssystem |
---|---|
MM3-Utility.bat | Windows von Microsoft |
MM3-Utility.sh | Linux und UNIX |
MM3-Utility.command | Mac OS X von Apple |
Im ersten Dialog werden alle Utilities angezeigt.

Wählen Sie aus: Aktualisieren von archivierten Seiten.
Mit Weiter kommen Sie zu dem Konfigurationsdialog Utility.

Eine Update-Konfiguration können Sie in einem Set speichern. Benutzen Sie zunächst das Set default. Mit Neu legen Sie ein neues Set an. Weiterhin können Sie über ein Kontext-Menü (Pop up) ein Set Umbenennen oder Löschen.
Allgemein
Startseite
Ausgehend von einer oder mehreren Startseiten werden die Links zu bereits archivierten Seiten verfolgt. Veränderte Seiten werden in einem Update-Archiv gespeichert. Für jede Startseite geben Sie die URL in einer neuen Zeile an.
Hinweis
Einschränkungen bestehen bei der Linkverfolgung von dynamischen Elementen, wie Java-Skript und Flash.
Surf-Set und Cache-Archiv
Es werden die Parameter des Surf-Set verwendet, mit Ausnahme von Marker und Prefetch. Es wird nur das Cache-Archiv aktualisiert, welches das Schreibrecht im ausgewählten Surf-Set besitzt. Die Aktualisierung erfolgt über die Verfolgung von Links der Seiten des Cache-Archivs. Enthält das Surf-Set nur ein Cache-Archiv, so werden die Links verfolgt, die grün markiert sind (siehe Surf-Set/Marker).
Update-Archiv
In diesem Archiv werden die aktualisierten Seiten und deren neuen Ressourcen archiviert. Der Name des Update-Archivs entspricht dem Namen des zu aktualisierenden Cache-Archivs mit einem Namenszusatz. Als Zusatz wird standardmäßig das Tagesdatum verwendet, dieses wird durch ein Zeichenmuster angegeben. Das Zeichenmuster beginnt mit der öffnenden Klammer [ und endet mit der schließenden Klammer ].
Zeichen | Beschreibung | Beispiel |
---|---|---|
yy | zweistellige Zahl für das Jahr | 06 |
MM | zweistellige Zahl für den Monat | 03 |
dd | zweistellige Zahl für den Tag | 21 |
HH | zweistellige Zahl für die Stunden | 14 |
mm | zweistellige Zahl für die Minuten | 36 |
ww | zweistellige Zahl für die Kalenderwoche | 40 |
Vor der Archivierung können Sie den Umfang der zu aktualisierenden Seiten überprüfen. Hierzu deaktivieren Sie das Update-Archiv. Mit diesem Ergebnis können Sie weitere notwendige Startseiten bestimmen oder zur Einschränkung der Linkverfolgung angeben.
Hinweis
Seiten werden nur archiviert, falls das Update-Archiv aktiviert ist.
Wiederverwendung
Update aktualisiert alle Dateien, die älter sind als die eingestellte Zeit der Wiederverwendung.
Die Wiederverwendung können Sie als relative oder absolute Zeit angeben.
Beispiele sind in den beiden folgenden Tabellen angegeben.
Einheit | Beschreibung | Beispiel |
---|---|---|
m | Minuten | 62m |
h | Studen | 10h |
d | Tage | 3d |
w | Wochen | 2w |
M | Monate | 6M |
y | Jahre | 1y |
Format | Beschreibung | Beispiel |
---|---|---|
yyyy.MM.dd | Datumsangabe Jahr.Monat.Tag | 2008.08.19 |
hh:mm | Zeitangabe Stunde:Minute | 10:30 |
yyyy.MM.dd hh:mm | Datumsangabe und Zeitangabe | 2008.08.19 10:30 |
Hinweis
Geben Sie die Datums- bzw. Zeitangabe nicht vollständig vor, wird das aktuelle Tagesdatum und die Tageszeit benutzt.
Format | Beschreibung |
---|---|
..1 00:00 | erster Tag des aktuellen Monats |
Wartezeit
Manche Server brechen ein automatisches Laden von Seiten ab, da hierbei die Seiten in viel schnellerer Folge abgerufen werden als dies beim Surfen erfolgt. Fügen Sie deshalb eine Wartezeit ein, am Besten lassen Sie diese zwischen einer minimalen und maximalen Wartezeit variieren.
Protokoll
Alle verfolgten Links werden standardmäßig protokolliert.
Protokoll mit | In einer HTML-Seite ... |
---|---|
Enthaltene Ressourcen | alle enthaltenen Ressourcen |
Nicht verfolgte Links | alle nicht verfolgten Links |
In der Zusammenfassung können zusätzlich nicht verfolgte Links protokolliert werden.
Hinweis
Mehrfach vorkommende Seiten und Ressourcen werden nur einmal protokolliert.
Linkverfolgung
Werden bei einem Update für Sie nicht interessante Seiten geladen, so können Sie dies mit einem Filter verhindern. In dem Filter können Sie definieren: Domain, Pfad, Dateiname, Datei- oder MIME-Typen. Zusätzlichen können Sie den Parameter Folgen angeben, welcher die Wirkung des Filters steuert.
Folgen | Link verfolgen oder ausschließen |
---|---|
Ja | Verfolgen: Falls der Link das Zeichenmuster des Filters enthält. |
Nein | Ausschließen: Falls der Link das Zeichenmuster des Filters enthält. |
--- | Deaktiviert: Filter wird nicht benutzt. |
Falls beides, Verfolgen und Ausschließen, auf einen Link zu trifft, dann wird der Link ausgeschlossen und die Seite nicht geladen.
Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für die Linkverfolgung
Folgen | Domain | Pfad | Datei | Typ |
---|---|---|---|---|
Ja | / | |||
Nein | / | pdf application/pdf | ||
Nein | /private/ |
Es werden nur Seiten aus der Domain Proxy-Offline-Browser.de geladen, jedoch keine PDF-Dokumente und Seiten aus dem Verzeichnis /private/ und dessen Unterverzeichnisse.
Hinweis
Bei Links für die kein Filter angegeben ist, können Sie auswählen,
ob generell der Link zu verfolgen, ausschließen oder nachzufragen ist.
Bei Nachfragen können Sie interaktiv beim Update angegeben, ob ein Link zu verfolgen oder auszuschließen ist.
Mit Filter generieren können Sie die benötigten Filter aus den Startseiten generieren. Ein zusätzliches Muster kann die Filter noch anpassen.
Protokoll
Alle lokal vorhandene Seiten protokollieren, die durch die Linkverfolgung ausgeschlossen werden. Hiermit können Sie die Einstellung des Filters überprüfen.
Cookie
Cookies können je nach Filtereinstellung angenommen oder blockiert werden. Neben dem Datenschutz können Sie hiermit z. B. die Darstellung eines Navigationsverlaufs (Krümelpfad) auf einer HTML-Seite verhindern.
Annehmen | Cookie annehmen oder blockieren |
---|---|
Ja | Annehmen: Falls die URL das Zeichenmuster des Filters enthält. |
Nein | Blockieren: Falls die URL das Zeichenmuster des Filters enthält. |
--- | Deaktiviert: Filter wird nicht benutzt. |
Falls beides, Annehmen und Blockieren, auf ein Cookie zu trifft, dann wird das Cookie blockiert.
Der detaillierte Aufbau des Filters ist beschrieben unter: Filter für Cookie
Annehmen | Domain | Pfad |
---|---|---|
Nein | / |
Es werden keine Cookies angenommen.
Protokoll
Alle angenommenen Cookies werden protokolliert. Hiermit können Sie die Einstellung des Filters überprüfen.
Authentifizierung
Für eine passwortgeschützte Web-Site kann der Benutzername und das Passwort gespeichert werden.
Login | Zugangsdaten für Web-Site |
---|---|
Ja | Einloggen: Für diese URL mit den Zugangsdaten einloggen. |
Nein | Blockieren: Für diese URL nicht mehr einloggen. |
--- | Deaktiviert: Filter wird nicht benutzt. |
Zusätzlich können Sie angeben, ob beim Aufruf einer geschützten Seite das Passwort gespeichert werden soll.
Passwörter können über ein Master-Passwort geschützt werden. Das Master-Passwort ist bei jedem Start des Utility Update einzugeben.
Hinweis
Es können nur Anmeldungen bei Web-Sites verarbeitet werden, bei denen die Anmeldung durch den Header des HTTP-Protokolls angefordert wird (Anmeldung über Dialogbox des Browsers). Anmeldungen über ein HTML-Formular werden nicht unterstützt.
Start der Aktualisierung
Nachdem Sie die benötigte Konfiguration ausgefüllt bzw. ein Set ausgewählt haben starten Sie die Aktualisierung mit Update starten. Der Verlauf der Aktualisierung wird in einem Dialog protokolliert. Beim Ende der Aktualisierung oder beim Abbruch wird eine Zusammenfassung ausgegeben.
Über alle geänderten HTML-Seiten wird ein Report (Update-Archiv) erstellt.
Anzeigen der Reports Update-Archiv
Von der lokalen Sitemap gelangen Sie zu den Reports (bzw. mit der URL: http://127.0.0.1:8080/update/). Den gewünschten Report wählen Sie aus einer Liste aus. Ein Report enthält alle veränderten Seiten einer Aktualisierung. Neu hinzugekommene Textstellen in einer Seite werden angezeigt.
Den Umfang der Anzeige können Sie einstellen:
- Anzahl der veränderten Seiten pro Reportseite
- Anzahl der Zeichen, die bei einer veränderten Textstelle angezeigt werden sollen
- Sortierfolge der veränderten Seiten
In einem Report können Sie surfen. Die Veränderungen werden Ihnen beim Surfen angezeigt (Default blau markiert). Beim online Surfen werden alle zu archivierenden Seiten im Update-Archiv gespeichert (nicht im Cache-Archiv).
Diesen Modus erkennen Sie dadurch, dass beim Surfen im Report das Update-Symbol anstelle des Surf-Set-Symbols angezeigt wird. Klicken Sie auf das Update-Symbol, so wird der Update-Modus beendet. In den Update-Modus gelangen Sie beim Aufruf eines Reports. Der aufgerufene Report bestimmt das Update-Archiv und das Surf-Set. Werden mehrere Reports gleichzeitig angezeigt, bestimmt der zuletzt aufgerufene (geladene) Report das Update-Archiv und das Surf-Set. Im Hauptmenü wird das benutzte Surf-Set angezeigt und der Tool-Tipp gibt das Update-Archiv an.
Übernehmen
Mit einem Klick auf das Synchronisierungs-Symbol werden alle Ressourcen in das entsprechende Cache-Archiv kopiert. Die kopierten Domains werden protokolliert. Danach können Sie den Report und/oder das Update-Archiv löschen.