tar - zip - rar - ...

Smalltalk
Antworten
Benutzeravatar
HELLinG3R
Beiträge: 1328
Registriert: 15.04.2004 07:54:33

tar - zip - rar - ...

Beitrag von HELLinG3R » 20.08.2004 11:15:11

Es gibt ja die verschiedensten Kompressionsformate.
Allerdings hat sich in der Linuxwelt meines wissens nach tar und bz am meisten etabliert, wohingegen unter Windows oft rar und zip zum Einsatz kommen.

Mich würde jetzt interessieren, wo eigentlich die Vorteile von tar zu zip/rar liegen und warum man überhaupt .tar nochmal durch bz2 filtern lassen sollte?
kennt wer eine Seite, die die unterschiede der Kompressionsmethoden beschreibt?

Benutzeravatar
chimaera
Beiträge: 3804
Registriert: 01.08.2002 01:31:18
Lizenz eigener Beiträge: MIT Lizenz

Re: tar - zip - rar - ...

Beitrag von chimaera » 20.08.2004 11:16:30

HELLinG3R hat geschrieben:warum man überhaupt .tar nochmal durch bz2 filtern lassen sollte?
weil die daten sonst unkomprimiert in einem archiv zusammengafasst werden..
[..] Linux is not a code base. Or a distro. Or a kernel. It's an attitude. And it's not about Open Source. It's about a bunch of people who still think vi is a good config UI. - Matt's reply on ESR's cups/ui rant

Benutzeravatar
Savar
Beiträge: 7174
Registriert: 30.07.2004 09:28:58
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Berlin

Beitrag von Savar » 20.08.2004 11:17:33

hmm.. keine Ahnung aber zumindest zu bzip2 kann ich dir sagen, dass es wesentlich besser komprimiert als GZ..
MODVOICE/MYVOICE
Debianforum Verhaltensregeln
Log Dateien? -> NoPaste

Benutzeravatar
Joghurt
Beiträge: 5244
Registriert: 30.01.2003 15:27:31
Wohnort: Hamburg
Kontaktdaten:

Re: tar - zip - rar - ...

Beitrag von Joghurt » 20.08.2004 11:20:51

HELLinG3R hat geschrieben:Mich würde jetzt interessieren, wo eigentlich die Vorteile von tar zu zip/rar liegen
tar/bz2 ist meistens besser komprimiert; aber der Hauptgrund dürfte sein, dass:
1. RAR nicht frei ist
2. RAR und ZIP die Unixrechte nicht immer mitspeichern

Benutzeravatar
se8i
Beiträge: 1017
Registriert: 08.11.2002 17:02:20
Wohnort: nähe Karlsruhe
Kontaktdaten:

Beitrag von se8i » 20.08.2004 11:58:01

tar und bzip2 sind frei.
tar komprimiert nicht, tar wurde konzipiert, um auf bänder zu speichern (t[/]ape archive oder so ähnlich).
bzip2 ist besser als gzip.

Benutzeravatar
chimaera
Beiträge: 3804
Registriert: 01.08.2002 01:31:18
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von chimaera » 20.08.2004 12:16:14

wahnsinn, die redundanz in solchen threads ist ja nicht auszuhalten.. lest ihr auch manchmal was eure vorposter schreiben?
[..] Linux is not a code base. Or a distro. Or a kernel. It's an attitude. And it's not about Open Source. It's about a bunch of people who still think vi is a good config UI. - Matt's reply on ESR's cups/ui rant

Benutzeravatar
Savar
Beiträge: 7174
Registriert: 30.07.2004 09:28:58
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Berlin

Beitrag von Savar » 20.08.2004 12:30:42

Puh... da bin ich ja froh, das mein Posting zuerst da war (mit der Aussage: bzip2 besser als gz) :D
MODVOICE/MYVOICE
Debianforum Verhaltensregeln
Log Dateien? -> NoPaste

Benutzeravatar
HELLinG3R
Beiträge: 1328
Registriert: 15.04.2004 07:54:33

Beitrag von HELLinG3R » 20.08.2004 12:49:44

wow, danke für die Antworten!

jetzt ist mir auch klar, warum .tar alleine immer so groß ist ;)
wieder was dazugelernt! :)

LittleBoy
Beiträge: 718
Registriert: 30.04.2002 14:32:26

Beitrag von LittleBoy » 20.08.2004 17:41:01

tar fügt wie gesagt die Dateien nur zusammen. Da tar auch Header verwendet, wird das Teil erstmal größer.
ABER: Wenn man das jetzt durch einen Kompressor jagt (Z, gz oder bz2) dann hat man ein "solid archive" - das wird meist besser komprimiert, als der umgekehrte Weg (erst alle Dateien komprimieren und dann zusammenfassen). Diesen Weg geht z.B. das ZIP Format. Der Nachteil: Bei einer bescädigung im Archiv sind alle nachfolgenden Dateien betroffen - beim ZIP Format nur die aktuelle Datei.
Die Algorithmen von gz und zip sind an sonsten relativ ähnlich.

Welcher Algorithmus "besser" ist, hängt vom Einsatzzweck ab: bz2 liefert meist bessere Kompressionsraten, ist dafür aber wesentlich langsamer. Bei Audio-Dateien ist z.B. flac wesentlich besser als gz/bzip2, die eher bei Textdateien ihre Stärken ausspielen. Aus diesem Grund nutzen moderne Packer (wozu ich die Linux-Varianten eher nicht zähle) mehrere Formate in einer Datei - rar hat z.B. mit Version 3 wieder neue Algorithmen hinzugewonnen - die lassen sich mit dem aktuellen "unrar" aus Debian nicht entpacken (dafür braucht man dann unrar-nonfree).

Über die Algorithmen schweigen sich die Entwickler aus, da ja sonst jeder ziemlich einfach ein Konkurrenzprodukt entwickeln könnte. Zumindest die "simplen" Algorithmen, Huffman, LZW, LZ89, etc. sind aber öffentlich und bekannt.

Benutzeravatar
weedy
Beiträge: 585
Registriert: 02.11.2002 21:47:49
Lizenz eigener Beiträge: GNU General Public License
Kontaktdaten:

Beitrag von weedy » 21.08.2004 20:40:46

Es gibt noch einen wesentlichen Unterschied, der noch nicht genannt wurde, oder den ich übersehen habe: das Tar-Format kann im ggs. zu rar/zip/arj/lha/... (a) Links (b) Nodes (c) named Pipes (d) Permissions (e) User/group-Owner der Files archivieren, was es geradezu für unixoide Betriebssysteme prädestiniert. Bei vielen anderen und besonders aus der Dos- /Windows-Welt kommenden Archivierern gehen diese Informationen verloren bzw können durch diese nicht bearbeitet werden. (Man stelle sich vor, Zip wölle /dev/zero archivieren. Tar könnte dies, Zip würde eine nicht enden wollende Datei erzeugen, da /dev/zero Nullen am laufenden Band liefert).

weedy.

Benutzeravatar
penthesilea
Beiträge: 147
Registriert: 19.02.2003 23:51:24
Wohnort: Ulm

Beitrag von penthesilea » 22.08.2004 15:29:49

weedy hat geschrieben:. (Man stelle sich vor, Zip wölle /dev/zero archivieren. Tar könnte dies, Zip würde eine nicht enden wollende Datei erzeugen, da /dev/zero Nullen am laufenden Band liefert).
Wieso würde Zip nicht aufhören?Kapier ich nicht.

Gruss penthesilea

julien
Beiträge: 1062
Registriert: 06.05.2002 19:53:05
Wohnort: Oberhessen

Beitrag von julien » 22.08.2004 18:16:32

Weil zip u.a. keine Device files speichern kann. Also würde es /dev/zero auslesen wollen, und diese spezielle Datei liefert eben unendlich nullen.
Mit tar könnte ich diese device file sichern.

Benutzeravatar
b a r t
Beiträge: 145
Registriert: 16.08.2004 20:19:15
Wohnort: springfield

Beitrag von b a r t » 22.08.2004 23:53:21

ich habe heute unzip probiert und es hat wunderbar geklapt, damit kann man WinZip Dateien vom Windows öffnen. Cools tool und einfach in der bedinung.

Code: Alles auswählen

unzip *.zip
einfacher geht es kaum :- )

gruss
b a r t

matze-peng
Beiträge: 242
Registriert: 03.01.2004 19:22:59
Wohnort: Dresden
Kontaktdaten:

Beitrag von matze-peng » 23.08.2004 00:35:36

*.tar.gz oder *.tgz kennst Du sicher (kann auch WinZip auspacken), die sind mit "gzip" verpackt worden. "gzip" testet die Archifdatei nur am Anfang und entscheidet sich dann für ein Kompressionsverfahren, das bis zum Schluss nicht mehr gewechselt wird. Hat man ein Archiv mit verschiedenen Dateietypen (Text, Bilder, Binär...) dann kann "gzip" nicht sehr gut komprimieren.
Hierfür verwendet man "bzip2", das komprimiert Blockweise. Standartmässig werden 900kB grosse Blöcke getestet (Komprimierungsverfahren gewählt) und komprimiert. Dann kommt bei einem gemischten Archiv eine wesentlich kleinere Datei raus. Bei einem einheitlichen Archiv (z.B. nur Text und HTML) ist "gzip" besser, da jeder Block von "bzip2" einen eigenen Header braucht.
Soviel zum Unterschied zwischen "gzip" und "bzip2".
stammt von quarzsnoopy und wurde bei bsdforen.de gepostet.

mfg
matze
- Ein weiser Mann widerspricht seiner Frau nicht. Er wartet bis sie es selbst tut. -

Antworten