Передача та стиснення даних
Ми часто використовуємо комп’ютери для зберігання інформації та надсилання її іншим. Скажімо, ви робите фотографію і хочете надіслати її другові.
Фотографія зберігається на комп’ютері у вигляді послідовності нулів і одиниць. Скільки потрібно нулів і одиниць? Це вказує нам розмір даних, який ми вимірюємо у байтах і їх кратних (мегабайтах, гігабайтах). Корисно розуміти розмір даних, наприклад, щоб чітко знати, скільки фотографій поміщається на карті пам’яті.
Якщо ми робимо фотографії з високою роздільною здатністю, розмір файлу буде великим, і ми не зможемо вмістити їх у пам’ять. Можливо, ми б хотіли зберегти більше фотографій, навіть якщо вони будуть трохи нижчої якості. Для цього використовується стиснення даних.
А коли ми надсилаємо обрану фотографію другові, відбувається передача даних. Нулі та одиниці, які представляють нашу фотографію, можуть переміщатися через повітря або через оптичний кабель під час передачі. Під час цієї подорожі щось може піти не так. Тому нам потрібно розумно виконувати передачу даних, щоб можна було знайти та виправити помилки.
ВгоруІнформація, об’єм даних
Одне з основних призначень комп’ютерів – робота з інформацією та даними. Ми можемо зберігати, передавати та редагувати інформацію. Щоб комп’ютери могли працювати з інформацією, ми повинні закодувати її, тобто записати певним фіксованим способом, який зрозуміють комп’ютери. У комп’ютері всі дані кодуються за допомогою нулів і одиниць.
Біт є основною та найменшою одиницею інформації. Він може мати два різних значення: 0 або 1. Біти згруповані у байти, один байт складається з 8 бітів. Комп’ютери працюють з цілими байтами, тому байт є найменшою одиницею, яку він може обробляти. Саме через це розмір комп’ютерної пам’яті та файлів, що зберігаються в ній, наведено у байтах. Біт позначається як b, байт як B.
Усі дані зберігаються та обробляються в комп’ютерах у вигляді серії байтів. Оскільки файли на комп’ютерах часто складаються з багатьох мільйонів байтів, ми використовуємо кілька одиниць, щоб легше позначати розмір даних. Для легшого перетворення між одиницями ми використовуємо співвідношення 1 kB = 1000 B, але іноді ми також можемо зустріти співвідношення 1 kB = 1024 B = 2^{10} B. Те саме стосується інших кратних одиниць, тобто іноді ми можемо побачити 1 MB = 1024 kB, 1 GB = 1024 MB тощо.
| позначка | назва | розмір |
|---|---|---|
| kB | кілобайт | 1000 B |
| MB | мегабайт | 1000 kB |
| GB | гігабайт | 1000 MB |
| TB | терабайт | 1000 GB |
| PB | петабайт | 1000 TB |
Стиснення даних
Стиснення – це процес, за допомогою якого ми можемо значно зменшити простір, який наші дані займають у пам’яті, зберігаючи при цьому їх вміст відносно незмінним. Ми використовуємо його, коли хочемо заощадити місце у пам’яті або коли нам потрібно кудись надіслати дані. Коли ми застосовуємо стиснення до файлу, ми стискаємо його, коли ми хочемо повернути вихідний вміст, ми розпаковуємо його.
Стиснення без втрат зберігає всю інформацію, що міститься у файлі, тому ми не втрачаємо жодних даних і можемо будь-коли повернутися до вихідної версії файлу. Недоліком цього типу стиснення є те, що він не може зменшити розмір настільки ж ефективно, як і стиснення із втратами. Він дуже часто використовується для текстів і для стиснення файлів незалежно від їх формату. Стиснення без втрат використовують, наприклад, архіви ZIP і RAR, які можуть стискати кілька різних файлів або папок одночасно. Іншими форматами зі стисненням без втрат є PNG, GIF (зображення) і FLAC (відео).
Одним із простих алгоритмів стиснення без втрат є RLE (кодування серії). Кодує ряд послідовних ідентичних символів у пару (кількість значень, значення). Наприклад, рядок aaaaaa кодується як 6a, рядок ccccddce як 3c2d1c1e.
Стиснення з втратами ефективніше зменшує розміри файлів. Однак під час стиснення ми можемо назавжди втратити частину інформації, яка була в оригінальному файлі. Тому стиснутий файл може містити дещо спотворені деталі або бути нижчої якості, ніж оригінал. Він широко використовується для зображень, відео та аудіо. Формати, які використовують стиснення з втратами, це, наприклад, JPG (зображення), MP3 (аудіо), MP4 і OGG (відео).
Вгору