Tips und Tricks (Software) Next Datensicherung und Archivierung
itk-logo

 

Bemerkungen zum ZIP-Format


Fast jeder PC-Anwender hat Dateien mit der Extension .ZIP auf der Platte. Fast so viele haben eine lizensierte oder nicht lizensierte Version von Winzip oder einem kompatiblem Programm am Rechner. Wer macht sich überhaupt noch Gedanken darüber, was man mit dieser Technik eigentlich alles machen kann?

Eigentlich enthält Windows XP die nötigen Bordmittel, um ZIP-Archive zu verarbeiten. Dieses Utility ist allerdings reichlich schwachbrüstig. Also besser abschalten [2] und durch Leistungsfähigeres ersetzen:

  1. Start/Ausführen
  2. regsrv32 /u zipfldr.dll
  3. Winzip o.ä. installieren

Dateien zusammenfassen und komprimieren

Diese Basisfunktionen des Archivierens sind wohl jedem geläufig: Mehrere Dateien werden zu einer zusammengefaßt, das Datenvolumen sinkt dabei.

  • Das Zusammenfassen von Dateien ermöglicht, den Inhalt eines Verzeichnisses oder eines Unterverzeichnisbaums einzufrieren. Im UNIX-Bereich gibt es dafür das Werkzeug TAR.
  • Das Komprimieren der Dateien nutzt aus, daß viele Datenformate viel Redundanz enthalten. So läßt sich die Information jetzt kommen 40 Bindestriche sicher kürzer codieren als in 40 Byte. Im UNIX-Bereich schickt man TAR-Archive gerne durch COMPRESS. Das führt dann erst mal zur Doppel-Extension .TAR.Z, die oft zu TAZ zusammengeführt wird.

Diese ausdrückliche Trennung beider Funktionen ist im PC-Bereich unüblich, für eine grundlegende Betrachtung aber durchaus hilfreich.

Manche Dateiformate lassen sich gut komprimieren, andere wieder kaum. Letztere Formate enthalten entsprechend wenig Redundanz, z.B. weil sie bereits selber komprimieren. Einen 10-MB-Screenshot im BMP-Format habe ich aber schon mal auf rund 200 kB komprimiert – um den Faktor 50!

Eines bleibt festzuhalten: Das ZIP-Format komprimiert ohne Veränderung der Daten, im Gegensatz zu verlustbehafteten Komprimierungsverfahren wie JPEG (Bilder, Extension .JPG) oder MPEG (Tondateien, speziell Musik, Extension .MP3).

Die versteckten Feinheiten

Über die Grundfunktionen hinaus bietet das ZIP-Format eine Reihe von Eigenschaften, die weniger bekannt sind. Mit ihnen läßt sich aber so manches Detailproblem lösen:

  • Größere Dateien auf Disketten zu speichern ist nicht so ganz einfach - 1,4 MB sind heute sicher nicht mehr viel, aber gelegentlich gibt es keinen anderen gemeinsamen Datenträger als Disketten. Viele Probleme erledigen sich allein dadurch, daß die zu transportierende Datei durch das Komprimieren klein genug wird, um sie auf einer Diskette unterzubringen. Außerdem bieten die meisten Programme zum Erzeugen von ZIP-Dateien auch Möglichkeiten, ein Archiv über mehrere Disketten hinweg zu verteilen.
  • ZIP-Archive beschleunigen die Datenübertragung. Sicher kostet es Rechenzeit, Archive zu erzeugen oder zu zerlegen. Die heutigen Rechner sind aber so schnell, daß diese Zeit eine vergleichsweise kleine Rolle spielt. 500 kleine Textdateien einzeln auf Diskette zu speichern dauert eine halbe Ewigkeit, während die 200 kB des entsprechenden Archivs innerhalb von ein paar Sekunden auf der Diskette stehen. Bei anderen Übertragungs- und Speichermedien gilt ähnliches. Sogar auf der eigenen Festplatte kann die Datenkompression sinnvoll sein, wenn viele große, gut komprimierbare Dateien verwandt werden müssen.
  • Beschädigungen an Archiven werden sicher entdeckt. Jede Datei in einem ZIP-Archiv wird mit einem CRC-Prüfwert versehen. Dieser 32-bit-Wert wird nach einem Algorithmus berechnet, der extrem empfindlich auf Datenänderungen reagiert. Zwar arbeiten praktisch alle Datenträger ebenfalls mit CRC-Werten, die werden aber bei jedem Speichern neu berechnet. Zwischendurch passiert da durchaus mal was.
  • Lange Dateinamen oder Sonderzeichen in Dateinamen machen auf manchen Rechnern oder Übertragungskanälen Probleme. Ein ZIP-Archiv läßt sich problemlos mit einem Dateinamen versehen, an dem sich kein Betriebssystem verschluckt.
  • Die CRC-Werte reagieren extrem empfindlich auf Datenveränderungen. Den Einsatz bei der Fehlersicherung habe ich schon beschrieben, der Anwendungsbereich ist aber noch viel breiter: Wie sichern Sie Ihre elektronisch ausgelieferten Dokumente dagegen, daß ein Fremder sie verändert? Wenn Lieferschein bzw. Rechnung die CRC-Werte der übergebenen Dateien enthalten, sind die Dateien mit hoher Wahrscheinlichkeit eindeutig charakterisiert. So ist später nachzuvollziehen, ob der Dienstleister oder der Kunde die falsche Zahl eingebaut hat, die einen Neudruck erzwang.
  • Archive speichern den Projektzustand zu einem bestimmten Zeitpunkt. Programme im PC-Bereich unterstützen nur ausnahmsweise das gezielte Festhalten eines Projektstandes. Jede Woche das komplette Projekt in einen eigenen Unterverzeichnisbaums wegzuspeichern ist schon deshalb keine Lösung, weil die kopierten Daten dann immer noch mit normalen Mitteln zugänglich (und zu verändern!) sind und in kürzester Zeit ein riesiger Dateiwust entsteht. In ZIP-Archive hineinzulangen fällt den meisten Anwendungsprogrammen schon bedeutend schwerer und jeder Änderungsstand steckt in einer einzigen Datei.

Konventionen für Archivnamen

Grundsätzlich lassen sich Archivnamen ebenso frei wählen wie bei allen anderen Dateien. Es gibt aber ein paar Gesichtspunkte, die hier bestimmte Konventionen nahelegen:

  • Ausgesprochen sinnvoll ist, das Erstellungsdatum in den Archivnamen einzubauen. Dabei verwende ich das Format JJMMTT, also etwa 010502 für den 2. Mai 2001. Diese Reihenfolge hat den Vorteil, daß Dateien beim alphabetischen Sortieren auch chronologisch sortiert werden.
  • Der Archivname sollte für den Empfänger hilfreich sein. Archive werden häufig benutzt, um Dateien weiterzugeben. Wer einem Herrn Meier das Archiv meier.zip schickt, wird mit ziemlicher Sicherheit einen schmerzhaften Aufschrei des Empfängers verursachen: Womöglich hat er soeben beim Empfang Ihrer Mail eine wichtige Datei überschrieben. Zumindest muß er sofort darüber nachdenken, wie er Ihre Datei umbenennt.

Meine Kooperationspartner kennen meine übliche Konvention: Damit der Dateiname in der alten 8.3-Konvention bleibt, verkürze ich meine Initialen auf "ao" und hänge wie oben erläutert das Datum an. Falls es an einem Tag mehrere Archive werden, hänge ich noch die Buchstaben a, b usw. an. Wenn der Empfänger z.B. nach einem meiner Archive aus dem Mai 2001 sucht, dann wirft er die Suchfunktion des Explorers an und sucht nach ao0105*.zip.

Probleme mit verschlüsselten Archiven

Der Erfinder des ZIP-Datenformates, die Firma PKware hat den Verschlüsselungsmechanismus seiner neuen PKZIP-Version 5 patentieren lassen. Das zwingt die Hersteller kompatibler Programme, inkompatibel zu werden. Laut [1] benutzt Winzip seit der Version 9 ein anderes Verschlüsselungsverfahren und einige Hersteller verzichten ganz auf Verschlüsselungsmöglichkeiten. Meine Winzip-8.1-Version vom Mai 2001 kommt aber noch problemlos mit der Ur-Version PKZIP 2.04g unter MS-DOS klar.

ZIP-Programme kostenlos

Schon auf vielen Rechnern sah ich verschiedene Winzip-Versionen im unregistrierten Zustand – bei jedem Aufruf konnt die Registrierbox hoch. Es gibt aber auch ZIP-Utilities, die sind kostenlos.

ZIP Genius
ist kostenlos und kann offensichtlich eine Menge. Die ganze heiße Marketing-Luft auf der Website war mir aber zuwieder.

Literatur

Schüler, Hans-Peter: Patentstreit um ZIP-Verschlüsselung
In: c't 17/2003, S. 41
Hoffmann, Christoph; Müller, Burkhard: Wenn Windows nervt...
In: PC Professionell 9/2004, S. 40ff
TOP
Alexander von Obert * http://www.techwriter.de/thema/bemerkun.htm
Letzte Änderung: 26.10.06 (1 Link aktualisiert)


Startseite
Suche

Tips und Tricks (Software)

Bemerkungen zum ZIP-Format Siehe auch:
Winzip
Datensicherung und Archivierung
Installationsarchive mit IExpress erstellen
Kleine Programmiertips
Newsletter "PC-Tipps"
Partitionen verändern
USB-Memory-Stick (USB-Speichermodul) FAQ - Teil 2: Software
USB-Memory-Stick (USB-Speichermodul) FAQ - Teil 3: Betriebssysteme und USB-Memory-Stick
Windows-CDs "entdongeln"
Windows-Installation optimieren
Windows-Rechner sinnvoll installieren
Zeitschriften-CD sammeln