Mailarchiv-Tweaking in Thunderbird mit maildir anstatt mbox.

Meine ältesten Mailarchive stammen aus dem Jahre 1997, damals noch erstellt mit dem Netscape Navigator bzw. der darin eingebetteten Mailfunktion. Und auch heute noch nutze ich Mozilla Thunderbird, das (zumindest ideell) ein Kind des Navigators ist.

Traditionell nutzte der Netscape Navigator und später auch Mozilla Thunderbird für das Mailarchiv das so genannte „mbox“-Format. Das sieht so aus, dass für jeden Ordner, der im Mailprogramm angelegt ist, eine Datei im Dateisystem angelegt wird. Liegen Mails in diesem virtuellen Mailordner, werden diese alle in dieser einen Datei gespeichert.

Das funktioniert so lange prächtig, wie man relativ wenig Mails und dann auch noch vor allem sehr kleine Mails darin archiviert. Nur ein Beispiel: Mein Mailarchiv aus dem Jahre 2001 besteht aus gut 4.000 Mails und die sind zusammen gerade einmal 11 Megabyte (!) groß. Die rund 10.000 Mails aus dem Jahre 2018 brauchen schlappe 2,2 Gigabyte. Und die sind alle tatsächlich in einer Datei gespeichert, wenn man diese Mails in einem einzigen virtuellen Verzeichnis hat.

Demzufolge ist das mbox-Format zwar immer noch funktional, aber fehleranfällig und vor allem langsam. Es gibt zwar in Thunderbird eine Indexdatei zum Auffinden der einzelnen Mails in den riesigen Dateien, aber richtig praktisch ist das nicht mehr, weil für jede neue Mail die gesamte Datei angefasst werden muss. Neue Mails werden zwar nur angehängt und alte so markiert, dass sie erst bei einem Bereinigungsvorgang entfernt werden, dennoch ist das alles mühselig. Und im übrigen im Zeitalter von SSD-Festplatten ein Hort für viele unnötige Schreiboperationen.

maildir als moderne Antwort

Daher gibt es das so genannte „maildir“-Format, dass im Prinzip nicht mehr alle Mails eines virtuellen Verzeichnisses in eine Datei packt, sondern als einzelne Dateien in ein echtes Dateisystemverzeichnis. Heute brauchen wir uns um Zugriffsgeschwindigkeiten nicht mehr sonderlich scheren und können den direkten Dateizugriff auf einzelne Mails locker leisten. Zwar gibt es auch bei maildir einen Index, aber der Zugriff auf einzelne Dateien und Mails ist erheblich schneller und vor allem stabiler.

Kleiner Nachteil: Das Kopieren von wirklich großen Mailarchiven dauert deutlich länger, weil viele einzelne Dateioperationen nötig sind, als nur das verschieben von sehr großen mbox-Dateien. Aber das ist aus meiner Sicht tolerierbar, da ich – inzwischen – selten wirklich große Mailarchive kopiere.

maildir aktivieren

Wollte ich hier eigentlich erklären, aber Mozilla hat hierzu einen inzwischen sehr umfangreichen und guten Artikel:

Sehr wichtig: maildir funktioniert zwar bei mir stabil und problemlos, ist aber tatsächlich immer noch eine experimentielle Implementierung. Daher ist es unumgänglich, vorher (!) das gesamte (!!) Mailarchiv wegzusichern. Das sollte man sowieso regelmäßig machen, egal ob durch das Kopieren der Mails oder durch eine zentrale Systemsicherung.

Ich schreibe es sicherheitshalber nochmal: Mache eine Datensicherung vorher!

Öffnen von alten Dateiarchiven.

Wenn es in Zukunft einen wirklich lukrativen Job in der EDV geben wird, dann wird es mit Sicherheit im Berufsfeld eines „Dateiarchäologen“ zu suchen sein. Was wir im Laufe eines Lebens an Dateien speichern und für die Nachwelt festhalten, ist nicht nur gewaltig groß, sondern schon nach wenigen Jahren höchst spannend, überhaupt an die Inhalte heranzukommen.

Beispiel: Ich habe vor ca. drei Jahren eine Software gekauft, die aus einem proprietären Dateiformat EPS-Grafikdateien exportieren kann. Schon damals, also im Jahre 2006, war das Programm relativ altbacken, was sich auch schon an der Setup-Datei zeigte, denn die darin enthaltenen Dateien waren teilweise aus dem Jahre 1997. Aber damals ließ sich das installieren und gut war es. Nun habe ich wieder eine Datei umwandeln wollen und wollte mit der Setup-Datei die Software installieren: No way, es ging nicht.

Nach etwas Recherche offenbarte sich die Misere: Die Setup-Datei wurde einst mit InstallShield gepackt. An sich auch heute kein Problem, da InstallShield nach wie vor ein wichtiger Platzhirsch im Feld der Installationsprogramme ist. Allerdings wurde damals die Version 3 genutzt und die arbeitete als 16-Bit-Anwendung. Für 32-Bit-Betriebssysteme kein sonderliches Problem, da sie 16-Bit-Programme in einem eigenen Modus ablaufen lassen können, das funktioniert jedoch nicht mehr mit heute immer weiter verbreiteten 64-Bit-Betriebssystemen, die ich ausschließlich einsetze. Die Problemstellung war also die, an ein Programm heranzukommen, dass in einem unausführbaren Setup-Programm liegt. Moderne Packprogramme können heute übliche Setup-Archive wie CAB- oder MSI-Dateien problemlos öffnen, allerdings eben nicht mehr in diesem Dateiformat, wie sie einst InstallShield 3 verwendete.

Nach nicht wenig Suche bin ich auf ein Programm namens Universal Extractor gestoßen, das genau dies kann und nebenbei auch noch viele andere Archive öffnen, von denen ich teilweise noch nie etwas gehört habe. Die Bedienung ist dabei sowas von Understatement, wie es sich für ein Programm, das viel drauf hat, gehört:

Screenshot "Universal Extractor"

Das Freeware-Tool gehört wirklich in jeden Werkzeugkasten eines Windows-Benutzers.

Wo war nochmal die Nachricht?

Ich finde mich mal wieder in folgender Situation: Ich habe vor einigen Tagen eine Nachricht erhalten und gelesen, die ich nun beantworten will. Ich finde sie aber nicht. So weit, so schlecht.

Wäre diese Nachricht, so wie früher, per E-Mail gekommen, wäre alles kein Problem: Absender gesucht oder zur Not eine Volltextsuche und gut ist. Das geht dann im Falle meiner Mailarchive bis in das Jahr 1997 zurück, wobei ich mir nach wie vor nicht so ganz im Klaren darüber bin, was ich mit diesem Berg von E-Mails eigentlich einmal anfangen will. Unbestreitbar ist das aber mein “Online-Erbe”. Auch wenn da sehr viel Krampf ist, bei dem ich beim Nachlesen schon so manch virtuellen Schmerz über so viel Stumpfsinn erleide: Das ist “Online-Besim”. Nicht zur Veröffentlichung gedacht, aber eben auch nicht Papierkorb.

Vor was es mir dann richtig bange wird, sind Gedankenspiele, in denen so Dienste wie Facebook aus irgendwelchen Gründen nicht mehr erreichbar sind. Sei es, weil Facebook die Tore schließt oder Gebühren erhebt, die ich nicht zahlen möchte oder wie auch immer: Tatsächlich passiert auf Facebook und den anderen Social Networks immer mehr meines “Online-Lebens” und es stellt sich für mich auch immer mehr die Frage, was davon eigentlich einmal übrigbleibt. Und ich meine damit erst einmal nicht den Umstand, dass Facebook von mir zu viel weiß (das habe ich ja Facebook erzählt), sondern ob das Zeug, was ich Facebook erzähle, auch eine Zeit überdauern kann.

Es fehlt nach wie vor in praktisch allen Social Networks die Möglichkeit, Inhalte einfach zu archiveren und zum Herunterladen bereitzustellen, so dass man sich den selbst geschriebenen Krempel wenigstens in irgendeiner Form selbst archivieren kann. Auch da mag man sicherlich geteilter Meinung sein, was alles wirklich nützlich ist und was nicht, allerdings bin ich z.B. bei Xing auch schon seit 2004 dabei und da sind im dortigen Mailarchiv teilweise Namen dabei, an die ich mich durchaus erst beim Wiederlesen wieder erinnere (und dann meist noch nicht mal schlecht).

Inzwischen habe ich nach dem Schreiben dieses Artikels die gesuchte Nachricht wieder gefunden, nämlich bei “Wer kennt wen”. Dieses Social Network, das ich aus vielerlei Gründen überhaupt nicht mag, hat leider noch eine ganz andere, fiese Fußfalle: Nachrichten werden nach 30 Tagen gelöscht.

Website archivieren.

Heute hatte das Wahlkampfteam um den neuen Pforzheimer Oberbürgermeister Gert Hager seinen letzten Auftritt als Wahlkampfteam, in dem wir zu viert einen Termin beim Pforzheimer Stadtarchiv hatten, um einen Haufen Wahlkampfmaterialien für die Pforzheimer Geschichtsschreibung abzugeben. In der Tat sind selbst in unserer modernen und augenscheinlich so dokumentierten Zeit gerade solche Sachen wie Wahlkampfmaterialien ein höchst zu archivierendes Gut, denn Wahlkampf spiegelt auch immer ein Stück Zeitgeist und gesellschaftlichen Diskurs.

Nun gut, in Sachen von Plakaten, Prospekten, Aufklebern, Flyern, Briefpapier und so weiter ist das alles kein Problem -man zweigt von Anfang Material ab, packt das in eine Kiste und trägt das ins Stadtarchiv. Bei klassischen analogen Fotos ist das auch kein Problem, sowas überdauert bei vernünftiger Archivierung seine Jahre und Jahrzehnte.

Anspruchsvoller wird es dann schon mit digitalen Fotos und digital vorliegenden Materialien, beispielsweise Druckvorlagen. Hier gilt die Maßgabe tatsächlich auf PDF-Dateien, gebrannt auf CD oder DVD.

Das alles beantwortete dann aber nicht meine Frage, was denn mit der Wahlkampfhomepage zu machen wäre zwecks Archivierung. Denn dahinter steckt eine WordPress-Installation und das ist alles andere als flach.

Hier haben wir uns dann darauf geeinigt, dass die Seiten und Artikel in Form von Monatsarchiven angezeigt und dann als PDF-Dateien ausgegeben werden sollten. Das lässt sich nämlich dann wieder elektronisch archivieren, aber auch ausdrucken und binden.

Und binden ist tatsächlich eine gute Idee, denn es wird viel. Nach den ersten Seiten habe ich einen Zielwert von 50 bis 80 Seiten hochgerechnet. Erstaunlich, was da alles an Content zusammengekommen ist in einem halben Jahr.

Es ist aber andererseits auch höchst interessant zu sehen, was an Wahlkampfberichterstattung schlicht wegfallen würde, wenn wir eben den schnellen Löschfinger machen und nicht daran denken, dass man in möglicherweise ferner Zukunft den Krempel nochmal anschauen oder zumindest nachvollziehen will.