Uchovávanie informácií. Kódovanie.
06.09.2016 19:17Uchovanie informácie súvisí rozvojom komunikácie medzi ľuďmi. Aby sa informácie mohli šíriť aj na väčšie vzdialenosti, bolo treba nájsť iný spôsob, ako ústne podanie a uchovanie v pamäti človeka.
Myšlienka zapisovania a uchovávania písaných záznamov súvisí so vznikom symbolov potrebných na zápis - vznikom písma.
S rozvojom fyziky sa na uchovávanie informácií začal využívať celý rad fyzikálnych zákonitostí:
- elektro-mechanický záznam (dierne štítky, dierne pásky, vinylové platne),
- magnetické pole a magnetizácia látok (pevné disky, diskety),
- statické elektrické pole (dynamické pamäte),
- optika - vlastnosti monochromatického svetla (lasera) v zápise na kompaktné disky, DVD disky, Blu-ray disky, hologramy atď.
Údaje sú v technických zariadeniach uchovávané ako postupnosti núl a jednotiek. Takýto spôsob zápisu, ktorý používa na zápis informácií nuly a jednotky sa nazýva binárny kód.
Kódovanie informácií
Cieľom kódovania je, aby sme mohli prenášať informáciu. Často sa musíme prispôsobiť možnostiam technického zariadenia (preto vznikla napr. Morseova abeceda ako jazyk pre telegraf ), alebo možnostiam ľudí zapojených do komunikácie (preto vzniklo Braillovo písmo pre nevidiacich).
Kódovanie informácii je ľubovoľná vopred dohodnutá a všeobecne známa množina pravidiel, ktorá dovoľuje informáciu vyjadriť tak, aby sa dala uchovať, alebo šíriť.
Šifrovanie sa používa všade tam, kde treba utajiť obsah komunikácie. Existuje veľmi veľa metód na tajné šifrovanie (a metód na dešifrovanie).
Binárny kód.
Ľudia medzi sebou používajú na komunikáciu reč, ktorá pozostáva zo slov tvorených jednotlivými písmenami. Počítače komunikujú – prenášajú informácie - v číslach. Informácie, ktoré v nich človek uchováva, musia byť prekódované do im zrozumiteľného jazyka.
Pamäť počítača si môžeme predstaviť ako milióny miniatúrnych prepínačov, z ktorých každý je buď rozopnutý (pre znak 0) alebo zopnutý (pre znak 1). Dlhé postupnosti prepínačov predstavujú rôzne informácie.
Počítače preto používajú zvláštny spôsob kódovania informácii – binárny kód. Sú to postupnosti dvoch znakov – 0 a 1.
Informácie zapísané v binárnom kóde nazývame digitálne informácie.
Digitalizácia - prevod informácie z reálneho sveta (blízke človeku) do binárneho kódu podľa dohodnutých pravidiel.
Reprezentácia čísel v počítači
Všetky údaje v počítači sú kódované pomocou rôznej kombinácie hodnôt bitov. Každý z bitov môže nadobúdať iba dve rôzne hodnoty 0 a 1.
Tieto bity sú však do pamäťových buniek počítača ukladané po osmiciach, preto je výhodné na zakódovanie údajov použiť vždy taký počet bitov, ktorý je deliteľný ôsmimi (8,16,24,32 ....).
Čím väčší počet bitov použijeme, tým väčší rozsah čísel môžeme použiť.Napríklad pomocou 8 bitov dostaneme 28 = 256 rôznych kombinácií núl a jednotiek. Pomocou 8 bitov teda môžeme zakódovať napríklad čísla od 0 do 255 alebo čísla od -128 do 127 v prípade, že potrebujeme i záporné čísla.
Na kódovanie čísiel v počítačoch je najvýhodnejšie použiť jedno „slovo“ (Word), t.j. taký počet bitov, ktoré počítač dokáže spracovať počas jednej operácie (jedného taktu procesora). Najmodernejšie počítače dnes používajú 64 bitové slovo, teda dokážu spracovať 64 bitov pri jednej operácií.
Kódovanie prirodzených čísel a nuly
Každé číslo môžeme previesť do dvojkovej sústavy, ktorá používa iba cifry 0 a 1, čím pre každé číslo dostaneme jednoznačný zápis.
Prirodzené čísla sú v počítači uložené v tzv. priamom kóde, čo je vlastne číslo prevedené do dvojkovej sústavy.
Jedným z takýchto kódov je kód BCD.
Kódovanie celých čísel
Pri celých číslach je potrebné zohľadniť i znamienko. Našťastie sú znamienka len dve (+, -), preto ich môžeme zakódovať 1 bitom (0 = +, 1= -).
Pri kódovaní celých čísel sa znamienko zakóduje vždy prvým bitom zľava.
Binárna (dvojková) číselná sústava
Bežne v živote používame čísla vyjadrené v desiatkovej pozičnej sústave, ktorá :
- používa cifry od nuly do deväť – teda 0, 1, 2, ..., 9,
- využívaj pozičný spôsob zápisu. Skutočnú hodnotu každej cifry v čísle určuje to, či stojí na pozícii jednotiek alebo desiatok alebo stoviek atď. Tieto kľúčové čísla sa nazývajú pozičné hodnoty.
Napríklad číslo 5 635 je súčtom 5000 + 600 + 30 + 5 teda 5*103+6*102+3*101+5*100
Dvojková pozičná sústava :
- používa cifry od nula do jeden – teda iba 0 a 1,
- používa pozičný spôsob zápisu, ale pozičnými hodnotami sú mocniny čísla 2,
Napríklad číslo 101101 je súčtom 1*25+0*24+1*23+1*22+0*21+1*20
Prevod čísel z desiatkovej do dvojkovej sústavy
Prevod desiatkového čísla na dvojkové vykonáme postupným celočíselným delením čísla dvomi a zapisovaním zvyšku po celočíselnom delení do výsledného dvojkového čísla.
Príklad:
327 (10) = ? (2) | |
327 : 2 = 163 | zvyšok: 1 |
163 : 2 = 81 | zvyšok: 0 |
81 : 2 = 40 | zvyšok: 1 |
40 : 2 = 20 | zvyšok: 0 |
20 : 2 = 10 | zvyšok: 0 |
10 : 2 = 5 | zvyšok: 0 |
5 : 2 = 2 | zvyšok: 1 |
2 : 2 = 1 | zvyšok: 0 |
1 : 2 = 0 | zvyšok: 1 |
Zvyšky potom zapíšeme do dvojkového čísla tak, že prvý zvyšok bude na prvej pozícii zprava
Výsledok: 327 (10) = 101000111 (2)
Prevod čísel z dvojkovej do desiatkovej sústavy
Postup: postupne, zprava doľava, sčitujeme čísla (0 a 1) v dvojkovej sústave vynásobené mocniteľom čísla 2 umocneného od 0 až po n.
Príklad:
1 0 1 0 0 1 1 (2) = ? (10)
1*26+0*25+1*24+0*23+0*22+1*21+1*20 = 83
Výsledok: 1 0 1 0 0 1 1(2) = 83 (10)
Reprezentácia textovej informácie
Keď chceme pracovať s textovou informáciu v počítači musíme ju najprv nejakým spôsobom vedieť v počítači reprezentovať. Veľmi výhodnou možnosťou je rozložiť textovú informáciu na jednotlivé znaky.
Znakom nie sú len malé a veľké písmená, ale aj číslice, špeciálne znaky – čiarka, bodka, plus, pomlčka, dvojbodka, matematické operácie plus, minus aj takzvané neviditeľné znaky. To sú napríklad medzera, tabulátor, koniec riadku, koniec súboru a iné.
Keď máme text rozložený na jednotlivé znaky, zistíme, že týchto znakov nie je nejako veľa. Sú len rôzne usporiadané a tým vytvárajú text. Teraz každému znaku priradíme nejaký kód a následne v súbore celý text zapíšeme ako postupnosť kódov znakov textu.
Takéto priradenie kódov znakom nazývame kódová tabuľka.
V minulosti boli znaky kódované pomocou 7 bitov. To umožnilo kódovať 128 znakov.
Takéto kódovanie označujeme ASCII.
Toto kódovanie celkom stačilo pre anglickú abecedu a množinu základných symbolov. Ale aj ostatné národy chcú písať svoje texty cez diakritiku a preto sa začalo používať na kód znaku 8 bitov = 1 byte. Teda dalo sa zapísať 256 rôznych znakov. Prvých 128 znakov bolo spoločných, zodpovedali pôvodnému ASCII kódovaniu. Zvyšných 128 znakov si každé kódovanie vybralo podľa svojich potrieb. Vznikla rozšírená ASCII tabuľka.
Spočiatku bol takýto systém výhodný. Umožňoval písať texty v národných abecedách s diakritikou. Ale neskôr s rozvojom počítačových sietí dochádzalo čoraz častejšie k problémom. Každé kódovanie malo znaky s kódmi 129 až 255 rôzne. To spôsobilo, že ak sme napísali text v programe s nastaveným kódovaním napríklad pre strednú Európu a poslali sme ho niekomu, kto používal kódovanie pre západnú Európu, tak znaky anglickej abecedy sa zobrazili korektne, ale znaky s diakritikou a rôzne špeciálne znaky sa mohli zobraziť úplne nezmyselne.
Pre Strednú Európu vzniklo viacero kódovaní: windows-1250, ISO-8859-2, MacCE, IBM-852 a pod.
Tabuľka ASCII kódu:
Aby sa predišlo podobným problémom bolo vytvorené kódovanie s použitím 16 bitov s názvom UNICODE. V tomto kódovaní je možné zakódovať cez 65536 rôznych znakov, čo umožňuje zakódovať znaky všetkých abecied pomocou jednej medzinárodnej tabuľky.
Toto kódovanie zabezpečuje, že ten istý znak má rovnaký kód v každej krajine i a každom type počítača.
Nevýhodou tohto kódovania je, že znaky, ktoré sme predtým vedeli zakódovať iba ôsmymi bitmi v kódovaní Unicode, sú kódované 16 bitmi, a teda zaberajú viac pamäte ako kód ASCII.
Istým vylepšením tohto kódovania je kódovanie UTF-8. V tomto kódovaní je prvých 128 znakov tabuľky ASCII (tieto sú pre všetky krajiny rovnaké), zakódovaných pomocou 8 bitov a zvyšné znaky sú zakódované 16, 24, 32, 40 až 48 bitmi.
Reprezentácia grafickej informácie
Rastrová grafika
Je to spôsob uloženia grafických údajov pomocou farieb jednotlivých bodov obrazu.
Jeho podstatou je rozloženie obrazu na jednotlivé zobraziteľné body – pixely. Počet pixelov pomocou ktorých je obrázok uložený sa údáva v pixeloch na výšku a šírku.
Napríklad 1024x768, hovoríme tomu rozlíšenie obrázka, alebo tiež raster.
Teda súbor obsahujúci údaje o rastrovej grafike obsahuje informácie o farbe jednotlivých pixelov.
Samozrejme farba je zakódovaná binárnym kódom do postupnosti núl a jednotiek.
Vektorová grafika
Pri použití vektorovej grafiky nepracujeme z jednotlivými pixelmi obrázku, ale so základnými objektmi (úsečky, kružnice, oblúky, mnohouholníky, transformácie, farby), ktoré umožňujú vytvárať výsledný obrázok.
V súbore vektorovej grafiky sú uložené príkazy, ktoré určujú ako sa výsledný obrázok poskladá zo základných tvarov a ich úpravami - zmenou tvaru, transformáciou, zmenou farby a inými.
Výhodou oproti bitmapovej grafike je možnosť zväčšovať a zmenšovať obrázok bez zmeny kvality.
Video
Videozáznam je v podstate sekvencia statických obrázkov, ktoré sa v rýchlom slede zobrazujú. Teda môžeme na ich uloženie použiť nejaký formát na uloženie statických obrázkov, ktorý doplníme o nejaké pokyny na zabezpečenie striedania obrázkov (ako rýchlo sa majú obrázky striedať a pod.).
Ak by sme použili nekomprimované statické obrázky štandardnej veľkosti, napríklad 1024x768 pixelov, pre plynulý pohyb by sa malo za sekundu vystriedať asi 30 obrázkov.
Pri 24 bitovej farebnej hĺbke (3Byty) by to znamenalo, že na sekundu záznamu by sme potrebovali: 30x1024x768x3 Bytov = 70778880 B = 67,5 MiB.
Ak film má hodinu, čo je 3600 sekúnd, tak výsledný súbor by mal 243000 MiB = 237,3 GiB. Čo je veľkosť takmer celého pevného disku.
Ako zmenšiť veľkosť videa? Je viacero metód:
- použijeme menšie rozlíšenie obrázkov, napr.: 320x240,
- nepoužijem 30 snímkov za sekundu, ale menej, napr. 12, obraz je potom trochu sekaný, ale nemusí to príliš prekážať,
- použijem komprimovaný formát jednotlivých snímok - potrebujem dostatočne výkonný počítač, aby stíhal obrázky rýchlo načítavať,
- celý sa uloží len prvý obrázok sekvencie, z ďalších obrázkov sa uložia len tie časti, ktoré sa oproti prvému zmenia,
- použije sa lepšia kompresia celého videa (nie jednotlivých snímok, ale videa ako celku).
Reprezentácia zvukovej informácie
Zvuk je v podstate vlnenie, ktorého hlavnými charakteristikami sú frekvencia a hlasitosť.
Ak chceme v počítači ukladať zvuk musíme ukladať frekvenciu - výšku tónu. Podľa toho koľko bitov použijeme na jeden tón máme výsledný počet rôznych tónov. Pomocou 8 bitov môžeme rozlíšiť cez 256 tónov. Použitím ďalších bitov sa počet tónov zvyšuje.
Pre rozlíšenie štandardných kvalít záznamu platí:
(počet bitov na vzorku, vzorkovacia frekvencia, počet kanálov)
- 8 bitov, 11kHz, mono – telefónna kvalita záznamu,
- 8 bitov, 22kHz, mono – rozhlasová kvalita
- 16 bitov, 44kHz, stereo – CD kvalita,
- 24 bitov, 192kHz, 5+1 – DVD kvalita.
Pri ukladaní stereo zvuku potrebujeme uložiť samostatne každý kanál. To znamená, že potrebný počet bitov sa nám zdvojnásobí.
Digitalizácia informácie
Zjednodušene môžeme povedať, že svet okolo nás je plný analógových informácií. Keď ich chceme spracovať v počítači, musíme ich previesť na digitálne. Tento proces sa nazýva digitalizácia.
Pôvodná analógová informácia musí byť rekonštruovateľná z výslednej digitálnej informácie. Z povahy digitalizácie vyplýva, že určité podrobnosti informácie sa pri digitalizácii stratia.
Základom digitalizácie (prevod spojitého signálu na diskrétny) sú tri procesy: vzorkovanie, kvantovanie, kódovanie.
Pri vzorkovaní sa odoberajú hodnoty (vzorky) v pravidelných intervaloch. Hustota odoberania vzoriek sa nazýva vzorkovacia frekvencia.
Pri kvantovaní ide o rozdelenie celého rozsahu hodnôt, ktoré môže nadobúdať analógová informácia na intervaly. Každý interval má potom priradenú svoju zástupnú hodnotu (kvantovanie podľa hodnoty).
Kvantovaním zaradíme hodnoty analógovej informácie namerané vzorkovaním do príslušných intervalov.
Po zaradení do intervalov nastáva tretia fáza spracovania - kódovanie. Pri kódovaní sa uložia navzorkované a nakvantované hodnoty vo formáte vhodnom pre digitálnu techniku. V podobe slov zložených z núl a jednotiek - zakódujeme ich do binárnej podoby.
———
Späť