Archiwatory to programy, które potrafią kompresować informacje w plikach. Nowoczesne archiwizatory pozwalają na łączenie kilku plików w jedno archiwum i przeglądanie zawartości takich archiwów. Rozmiar archiwum utworzonego za ich pomocą okazuje się znacznie mniejszy niż rozmiar oryginalnego pliku.
Instrukcje
Krok 1
Ogólna zasada działania większości archiwów opiera się na algorytmie opracowanym przez badaczy A. Lampela i J. Ziva w latach 80. ubiegłego wieku. Algorytm stworzony przez Ziv i Lampel pozwala obliczyć duplikat kodu w pliku, a tym samym zmniejszyć jego rozmiar. W tym celu z sekwencji danych kompilowany jest słownik. Przykładowo kod binarny pliku zawiera następującą kombinację: 10111011101110110011. Łatwo zauważyć, że kod 1011 powtarza się w nim kilka razy. Archiwizator wykrywa taki kod i zapisuje go do archiwum tylko raz, a rozpakowując ponownie podstawia kod w niezbędne miejsca w pliku.
Krok 2
Jak dobrze archiwizator skompresuje plik, zależy od rozmiaru słownika źródłowego. Jeśli słownik jest za duży, wpłynie to na rozmiar archiwum. Jeśli rozmiar słownika jest zbyt mały, w utworzonym archiwum mogą wystąpić błędy. Możesz zwiększyć stopień kompresji pliku za pomocą kodowania entropijnego (tzw. metoda Huffmana). W przypadku kodowania entropijnego powtarzające się fragmenty binarne są zapisywane przy użyciu krótkiego kodu. W nowoczesnych archiwach kodowanie entropijne jest stosowane jako dodatkowa metoda kodowania.
Krok 3
W systemach Unix najpopularniejszym archiwizatorem jest gzip. Ten archiwizator kompresuje dane bezstratnie i jest oparty na algorytmie Deflate. Kompresja plików odbywa się tutaj na dwa sposoby – najpierw zduplikowane fragmenty kodu są zastępowane, a następnie znajdujące się w nich znaki są zastępowane nowymi znakami przy użyciu metody Huffmana. Archiwizatory dla systemów Unix mają szereg wad. Są one skierowane przede wszystkim do archiwów składających się z wielu plików, więc rozpakowanie pojedynczego pliku jest trudne. Dzieje się tak, ponieważ archiwizatory uniksowe widzą archiwum jako ciągłą tablicę wszystkich spakowanych do niego plików. Archiwum tworzone jest na podstawie informacji zawartych w każdym pliku.
Krok 4
W systemach Windows popularne są takie archiwizatory jak WinZip, 7-zip i WinRAR. W przeciwieństwie do systemów Unix, archiwizatory te koncentrują się na pracy zarówno z pojedynczymi plikami, jak iz ciągłymi archiwami składającymi się z wielu plików. Większość nowoczesnych archiwizatorów Windows „rozumie” wiele formatów archiwów, obsługuje szyfrowanie i jest w stanie kompresować bardzo duże pliki (na przykład maksymalny rozmiar pliku dla archiwizatora WinRAR to ponad osiem miliardów gigabajtów).