Informační váha abecedy. Abecední přístup k určování množství informací

Připomeňme, že z hlediska subjektivního přístupu k definování informace je informace obsahem zpráv, které člověk dostává z různých zdrojů. Stejná zpráva může pro jednu osobu nést mnoho informací a pro jinou ji nenést vůbec. S tímto přístupem je obtížné jednoznačně určit množství informací.

Abecední přístup nám umožňuje měřit informační objem sdělení prezentovaného v nějakém jazyce (přirozeném nebo formálním), bez ohledu na jeho obsah.

Pro kvantitativní vyjádření jakékoli veličiny je v první řadě potřeba měrná jednotka. Měření se provádí porovnáním naměřené hodnoty s jednotkou měření. Počet, kolikrát se jednotka měření „vejde“ do naměřené hodnoty, je výsledkem měření.

S abecedním přístupem se má za to, že každý znak zprávy má určitou informační váhu – nese pevné množství informací. Všechny znaky stejné abecedy mají stejnou váhu v závislosti na síle abecedy. Informační váha symbolu binární abecedy je brána jako minimální jednotka informace a nazývá se 1 bit. Vezměte prosím na vědomí, že název jednotky informace „bit“ pochází z anglické fráze „binary digit“.

1.4.2. Informační váha znaku libovolné abecedy

Již dříve jsme zjistili, že abecedu jakéhokoli přirozeného nebo formálního jazyka lze nahradit binární abecedou. V tomto případě je síla původní abecedy N vztažena k bitové kapacitě binárního kódu i potřebného k zakódování všech znaků původní abecedy, vztah: N = 2 i.

Problém 1. Pultiho abeceda obsahuje 8 znaků. Jakou informační váhu má symbol této abecedy?

Řešení. Udělejme stručné prohlášení o podmínkách problému.

Vztah mezi veličinami i a N je znám: N = 2 i.

Vezmeme-li v úvahu počáteční údaje: 8 = 2 i. Proto: i = 3.

Kompletní řešení v notebooku může vypadat takto:

Odpověď: 3 bity

1.4.3. Informační objem zprávy

Informační objem zprávy (množství informací ve zprávě), reprezentovaný symboly přirozeného nebo formálního jazyka, se skládá z informačních vah jejích základních symbolů.

Problém 2. Zpráva napsaná v 32místné abecedě obsahuje 140 znaků. Kolik informací nese?

Řešení.

Odpověď": 700 bitů.

Problém 3. Informační zpráva o objemu 720 bitů se skládá ze 180 znaků. Jaká je síla abecedy, ve které je tato zpráva napsána?

Řešení.

Odpověď: 16 znaků.

1.4.4. Jednotky informací

V dnešní době se příprava textu provádí především pomocí počítačů. Můžeme hovořit o „počítačové abecedě“, která obsahuje následující znaky: malá a velká ruská a latinská písmena, čísla, interpunkční znaménka, znaménka aritmetických operací, závorky atd. Tato abeceda obsahuje 256 znaků. Protože 256 = 2 8 , informační váha každého znaku v této abecedě je 8 bitů. Hodnota rovnající se osmi bitům se nazývá bajt. 1 bajt je informační váha symbolu abecedy s kapacitou 256.

Problém 4. Informační zpráva o velikosti 4 KB se skládá z 4096 znaků. Jakou informační váhu má symbol této zprávy? Kolik znaků obsahuje abeceda, kterou je tato zpráva napsána? Řešení.

Odpověď: 256 znaků.

Nejdůležitější

Při abecedním přístupu se má za to, že každý znak určitého sdělení má určitou informační váhu – nese pevné množství informací.

1 bit je minimální jednotka informace.

Informační váha i znaku abecedy a mocnina N abecedy spolu souvisí vztahem: N = 2 i . Informační objem I zprávy se rovná součinu počtu K znaků ve zprávě informační vahou i znaku abecedy: I ​​= K i.

1 bajt = 8 bitů.

Bajt, kilobajt, megabajt, gigabajt, terabajt jsou jednotky měření informace. Každá následující jednotka je 1024 (2 10) krát větší než ta předchozí.

Otázky a úkoly


Zatmění mě opravdu zasáhlo. Ovšem pod přísným vedením kolegy pythonchik Uvědomil jsem si své chyby a vydal se správnou cestou.

Prezentaci materiálu na odkazu uvedeném v této poznámce však považuji za velmi matoucí.

Takto bych představil tento materiál.

Téma lekce: Kódování informací a výpočet objemu informací zprávy.

Teorie

1. Všechny zprávy se skládají z abecedních znaků. Tento text se například skládá ze znaků ruské abecedy.

2. Symbol je minimální nedělitelná částice abecedy. Například symboly ruské abecedy jsou písmena „a“, „b“, „v“ a tak dále.

3. Mocnina abecedy je počet znaků, které tvoří abecedu. Například kapacita ruské abecedy je 33 znaků.

4. Teoreticky lze libovolnou abecedu používat samostatně, bez jakéhokoli kódování. V tomto případě každý znak abecedy znamená sám sebe a má nezávislý význam. Například v papírové knize každé písmeno znamená samo sebe, není tam žádné kódování.

5. Ale v praxi je často nutné zakódovat jednu abecedu pomocí jiné abecedy. Například v počítači ve skutečnosti neexistují žádná písmena, pouze čísla. Proto, aby počítač porozuměl písmenům „lidské abecedy“, musí být zakódována pomocí speciální „strojové abecedy“.

6. Při kódování se tedy používají dvě abecedy – kódování a kódování.

7. Jeden znak kódovací abecedy je zakódován několika znaky kódovací abecedy.

8. Mocnina kódované abecedy je určena vzorcem N=M i, kde M je mocnina kódovací abecedy a i je počet symbolů kódovací abecedy, kterými je kódovaná abeceda zakódována.

9. Zvláštní upozornění! Pokud neexistují samostatné instrukce, pak by se mělo předpokládat, že kapacita kódovací abecedy je 2 znaky. Všechny moderní počítače pracují se dvěma symboly, jedničkou a nulou, takže všechny výpočty jsou založeny na této skutečnosti.

Praxe

Jak již bylo řečeno, počítač o písmenech nic neví. Aby se písmena psala na počítači, musí být zakódována. Jako kódovací abeceda se používají dva symboly strojové abecedy - 0 a 1. Mocninou strojové abecedy jsou tedy dva znaky.

Nejčastěji, i když ne nutně, se pro zakódování jednoho znaku lidské abecedy v počítači používá osm znaků strojové abecedy. Uvnitř počítače to vypadá takto:

Těchto osm nul a jedniček kóduje jeden znak - & .

Kolik znaků lze zakódovat pomocí osmi nul a jedniček? Odpověď lze vypočítat pomocí vzorce N=M i. Mocnina kódovací abecedy je 2, počet kódovacích symbolů je 8.

Tito. Pomocí osmi nul a jedniček můžete zakódovat 256 znaků. Jinými slovy, se dvěma symboly strojové abecedy (kódovací abeceda) lze zakódovat 256 symbolů lidské abecedy (kódovací abeceda). Těchto 256 znaků dokonale zapadá do ruských písmen, latinských písmen, interpunkčních znamének a nejrůznějších znaků, jako je výše zmíněný znak & .

Nyní vyřešme jednoduchý problém

Velikost zprávy obsahující 4096 znaků je 1/512 MB. Jaká je síla abecedy, ve které je tato zpráva napsána?

Mocnina abecedy je N=M i . M je známé, vždy se rovná 2. To znamená, že potřebujeme zjistit i - počet symbolů kódovací abecedy, které kódují jeden symbol kódovací abecedy.

K tomu rozdělíme 1/512 MB znaků kódovací abecedy na 4096 znaků kódové abecedy.

Objem 1/512 MB je 1024/512 = 2 KB = 2*1024 = 2048 bajtů = 2048*8 = 16384 bitů.

To znamená i = 16384/4096 = 4 bity na symbol.

Z toho vyplývá kapacita kódované abecedy = 2 4 = 16 znaků.

Nyní vyřešme obtížný problém

Policista strýc Styopa chce předat zprávu svému kolegovi na nedaleké křižovatce pomocí semaforu. Kolik semaforů bude strýc Styopa potřebovat, když bude chtít používat všechna písmena ruského jazyka?

V tomto případě je kódovanou abecedou ruština. Ruský jazyk má 33 písmen, což znamená, že síla kódované abecedy je 33 znaků.

Kódovací abecedou budou dopravní signály. Semafor má 5 signálů: červená, žlutá, červenožlutá, blikající žlutá, zelená. Kapacita kódovací abecedy je tedy 5 znaků.

Připomeňme si, jak se počítá mocnina kódované abecedy: N=M i . Na rozdíl od jednoduchého problému zde M nebude rovno 2. V případě semaforů bude M rovno 5. To znamená N=5 i .

Víme, že mocnina ruského jazyka je 33. To znamená N=33. Pak vzorec bude 33=5 i. Pojďme vypočítat i.

Pokud vezmeme i=2, pak 5 2 se bude rovnat 25. To znamená. 25 znaků lze zakódovat dvěma semafory. 25 je méně než 33, což znamená, že dva semafory nebudou stačit na zakódování všech písmen ruského jazyka.

Pokud vezmeme i=3, pak 5 3 se bude rovnat 125. To znamená. 125 znaků lze zakódovat dvěma semafory. 125 je větší než 33, což znamená, že tři semafory budou stačit k zakódování všech písmen ruského jazyka.

Dokonce zbyla spousta postav navíc, takže pomocí tří semaforů může strýček Styopa nejen kódovat písmena, ale také do své zprávy vkládat hromadu emotikonů :)

Tuto hodnotu budeme označovat písmenem N. Například mocnina abecedy ruských písmen a označených doplňkových symbolů je 54.

Představte si, že k vám text přichází postupně, jeden znak po druhém, jako kus papíru vylézajícího z telegrafního stroje. Předpokládejme, že každý znak, který se objeví na pásce, bude stejně pravděpodobně jakýkoli znak v abecedě. Ve skutečnosti to není úplně pravda, ale pro jednoduchost tento předpoklad přijmeme. Na každé další pozici textu se může objevit kterýkoli z N znaků. Každý takový symbol pak podle nám známého vzorce N = 2 I (viz substantivní přístup) nese I bit informace, kterou lze určit z řešení rovnice: 2 I = 54. Dostaneme: I = 5,755 bitů - toto množství informací nese jeden symbol na ruský text.

Chcete-li zjistit množství informací v celém textu, musíte spočítat počet znaků v něm a vynásobit je I.

Počítejme množství informací na jedné stránce knihy. Nechte stránku obsahovat 50 řádků. Každý řádek obsahuje 60 znaků. To znamená, že se na stránku vejde 50x60=3000 znaků. Potom se objem informací bude rovnat: 5,755 x 3000 = 17265 bitů.

V abecedním přístupu k měření informací množství informací nezávisí na obsahu, ale na velikosti textu a síle abecedy.

Abecední přístup k měření informací lze tedy znázornit jako diagram:

Při použití binárního systému (abeceda se skládá ze dvou znaků: 0 a 1) nese každý binární znak 1 bit informace.

Abecední přístup je objektivní způsob měření informací na rozdíl od přístupu subjektivního obsahu.

Nejpohodlnější je měřit informace, když je velikost abecedy N rovna celé síle čísla dvě. Pokud například N = 16, pak každý symbol nese 4 bity informace, protože 2 4 = 16. A pokud N = 32, pak jeden symbol „váží“ 5 bitů.

Maximální velikost abecedy teoreticky není nijak omezena. Existuje však abeceda, kterou lze nazvat dostatečnou. Jedná se o abecedu s kapacitou 256 znaků. Do abecedy této velikosti se vejdou všechny prakticky potřebné symboly: latinská a ruská písmena, čísla, aritmetické operace, všechny druhy závorek, interpunkční znaménka...

Protože 256 = 2 8, pak jeden znak této abecedy „váží“ 8 bitů. Navíc 8 bitů informace je tak charakteristická hodnota, že dostala i vlastní název – bajt.

1 bajt = 8 bitů.

Pro měření velkého množství informací se používají následující jednotky:

1 KB (jeden kilobajt) = 1024 bajtů = 2 10 bajtů

1 MB (jeden megabajt)= 1024 KB=2 10 KB=2 20 bajtů

1 GB (jeden gigabajt)= 1024 MB=2 10 MB=2 30 bajtů


1 TB (jeden terabajt) = 1 024 GB = 2 10 GB = 2 40 bajtů

1 PB (jeden petabajt) = 1024 TB = 2 10 TB = 2 50 bajtů

1 EByte (jeden exabajt) = 1024 PByte = 2 10 PByte = 2 60 bajtů

1 Zbyte (jeden zettabajt) = 1024 EB = 2 10 EB = 2 70 bajtů

1Ybyte (jeden yottabajt)= 1024Zbyte=2 10 Zbyte=2 80 bytů.

Kódování textových informací
Textové informace v počítači, stejně jako všechny ostatní typy informací, jsou kódovány pomocí binárních kódů. Každý znak abecedy je spojen s celým číslem, které je považováno za kód tohoto znaku.
Tradiční kódování používá k zakódování jednoho znaku sekvenci 8 nul a jedniček 8 bitů = 1 bajt.
Existuje 256 různých sekvencí po 8 nulách a jedničkách (2 8 = 256). Proto takový 8bitový kód umožňuje zakódovat 256 různých znaků.
Přiřazení konkrétního číselného kódu symbolu je záležitostí konvence. Tabulka byla přijata jako mezinárodní standard ASCII(American Standard Code for Information Interchange), kódování první poloviny znaků pomocí číselných kódů od 0 do 127 (kódy od 0 do 32 nejsou přiřazeny znakům, ale funkčním klávesám).

Tabulka ASCII kódů

Pro kódování znaků národních abeced se používá rozšíření tabulky kódů ASCII, tedy 8bitové kódy od 128 do 255.


Národní standardy pro kódovací tabulky zahrnují mezinárodní část kódové tabulky beze změn a druhá část obsahuje kódy národních abeced, pseudografické symboly a některé matematické symboly. V současné době existuje 5 různých kódování azbuky (KOI8, Windows. MSDOS, Macintosh, ISO), což způsobuje určité potíže při práci s ruskojazyčnými dokumenty.
Na konci 90. let se objevil nový mezinárodní standard Unicode, který 1 znaku nepřiděluje jeden bajt, ale dva, lze s ním tedy zakódovat 65 536 různých znaků. Zahrnuje všechny existující, zaniklé a uměle vytvořené abecedy světa, stejně jako mnoho matematických, hudebních, chemických a dalších symbolů.

Moderní počítačové technologie, informatika, síla abecedy, číselné soustavy a mnoho dalších pojmů mají mezi sebou nejpřímější souvislosti. V těchto otázkách se dnes dobře orientuje jen velmi málo uživatelů. Zkusme si ujasnit, v čem spočívá síla abecedy, jak ji vypočítat a aplikovat v praxi. V budoucnu se to nepochybně může hodit v praxi.

Jak se měří informace

Než začneme studovat otázku, jaká je síla abecedy a co to je obecně, měli bychom začít takříkajíc od základů.

Každý jistě ví, že dnes existují speciální systémy pro měření libovolných veličin na základě referenčních hodnot. Například pro vzdálenosti a podobné veličiny jsou to metry, pro hmotnost a hmotnost - kilogramy, pro časové intervaly - sekundy atd.

Jaká je síla abecedy: počáteční koncept

Pokud se tedy budeme řídit obecně uznávaným pravidlem, že konečná hodnota jakékoli veličiny je parametr, který určuje, kolikrát je referenční jednotka obsažena v měřené veličině, můžeme dojít k závěru: mocnina abecedy je celkový počet použitých symbolů. pro konkrétní jazyk.

Aby to bylo jasnější, nechme zatím otázku, jak najít sílu abecedy, stranou a věnujme pozornost samotným symbolům, přirozeně, z pohledu informačních technologií. Zhruba řečeno, úplný seznam použitých znaků obsahuje písmena, čísla, všechny druhy závorek, speciální znaky, interpunkční znaménka atd. Pokud však přistoupíme k otázce, jakou sílu má abeceda počítačově, měli bychom zařadit i mezeru (jedinou mezeru mezi slovy nebo jinými znaky).

Vezměme si jako příklad ruský jazyk, nebo spíše rozložení klávesnice. Na základě výše uvedeného obsahuje kompletní seznam 33 písmen, 10 číslic a 11 speciálních znaků. Celková mocnina abecedy je tedy 54.

Informační váha znaků

Obecný koncept síly abecedy však nedefinuje podstatu výpočtu informačních objemů textu obsahujících písmena, čísla a symboly. To vyžaduje zvláštní přístup.

V podstatě se zamyslete, jaká by mohla být minimální sada z pohledu počítačového systému, kolik znaků může obsahovat? Odpověď: dva. A právě proto. Faktem je, že každý symbol, ať už je to písmeno nebo číslo, má svou informační váhu, podle které stroj rozpozná, co přesně je před ním. Počítač ale rozumí pouze reprezentaci ve formě jedniček a nul, na čemž je vlastně celá informatika založena.

Jakýkoli znak tedy může být reprezentován jako sekvence obsahující čísla 1 a 0, to znamená, že minimální sekvence označující písmeno, číslo nebo symbol se skládá ze dvou složek.

Samotná informační váha, brána jako standardní informační jednotka měření, se nazývá bit (1 bit). Podle toho 8 bitů tvoří 1 bajt.

Reprezentace znaků v binárním kódu

V čem je tedy síla abecedy, je myslím už trochu jasné. Nyní se podíváme na další aspekt, konkrétně na praktické znázornění výkonu pomocí binárního kódu. Jako příklad si pro jednoduchost vezměme abecedu obsahující pouze 4 znaky.

Ve dvoumístném binárním kódu lze sekvenci a jejich informační reprezentaci popsat následovně:

Sériové číslo

Binární kód

Z toho plyne nejjednodušší závěr: s mocninou abecedy N=4 je váha jednoho znaku 2 bity.

Pokud použijeme třímístný binární kód pro abecedu s např. 8 znaky, bude počet kombinací následující:

Sériové číslo

Binární kód

Jinými slovy, s mocninou abecedy N=8 bude váha jednoho symbolu pro třímístný binární kód rovna 3 bitům.

Jak najít sílu abecedy a použít ji v počítačovém výrazu

Nyní se zkusme podívat na vztah vyjádřený počtem znaků v kódu a mohutností abecedy. Vzorec, kde N je alfabetická mocnina abecedy a b je počet znaků v binárním kódu, bude vypadat takto:

To znamená, 2 1 = 2, 2 2 = 4, 2 3 = 8, 2 4 = 16 atd. Zhruba řečeno, požadovaný počet znaků samotného binárního kódu je hmotnost symbolu. Z hlediska informací to vypadá takto:

Měření objemu informací

To však byly jen ty nejjednodušší příklady, abych tak řekl, pro prvotní pochopení toho, v čem spočívá síla abecedy. Pojďme k praxi.

V této fázi vývoje výpočetní techniky pro psaní textu s přihlédnutím k velkým, velkým a malým písmenům, azbuce a latince, interpunkčním znaménkům, závorkám, aritmetickým symbolům atd. Je použito 256 znaků. Na základě skutečnosti, že 256 je 2 8, není těžké uhodnout, že váha každého znaku v takové abecedě je 8, tedy 8 bitů nebo 1 bajt.

Na základě všech známých parametrů snadno získáme požadovaný informační objem libovolného textu. Máme například počítačový text obsahující 30 stran. Jedna stránka obsahuje 50 řádků po 60 libovolných znacích nebo symbolech včetně mezer.

Jedna stránka tedy bude obsahovat 50 x 60 = 3 000 bajtů informací a celý text bude obsahovat 3 000 x 50 = 150 000 bajtů. Jak vidíte, měření i malých textů v bajtech je nepohodlné. A co celé knihovny?

V tomto případě je lepší převést objem na výkonnější jednotky - kilobajty, megabajty, gigabajty atd. Na základě skutečnosti, že například 1 kilobajt je roven 1024 bytům (2 10) a megabajt je 2 10 kilobajtů (1024 kilobajtů), lze snadno spočítat, že objem textu v informačním a matematickém vyjádření pro naše příklad bude 150000/1024 = 146, 484375 kilobajtů nebo přibližně 0,14305 megabajtů.

Místo doslovu

Obecně je to stručně vše, co se týká úvahy o otázce, jaká je síla abecedy. Zbývá dodat, že v tomto popisu byl použit čistě matematický přístup. Je samozřejmé, že se v tomto případě nebere ohled na sémantické zatížení textu.

Pokud však přistupujeme k otázkám uvažování právě z pozice, která dává člověku co chápat, bude mít soubor nesmyslných kombinací nebo posloupností symbolů v tomto ohledu nulovou informační zátěž, i když z hlediska pojmu informace objem, výsledek lze ještě vypočítat.

Obecně platí, že znalosti o síle abecedy a souvisejících pojmů nejsou tak těžké na pochopení a lze je jednoduše aplikovat ve smyslu praktických akcí. Navíc se s tím každý uživatel setkává téměř každý den. Stačí uvést příklad populárního editoru Word nebo jakéhokoli jiného editoru stejné úrovně, který takový systém používá. Nepleťte si ho ale s běžným Poznámkovým blokem. Zde je síla abecedy nižší, protože při psaní se nepoužívá, řekněme, velká písmena.

Účel lekce: představit pojmy: „měření informací“, „abeceda“, „síla abecedy“, „abecední přístup k měření informací“, naučit se měřit informační objem zpráv s přihlédnutím k informační váze znaků.

Typ lekce: výkladová a demonstrační s praktickými prvky.

Stručný přehled: prezentace „Informace o měření“ (Příloha 1).

Naučná literatura: učebnice „Informatika“. 8. třída (základní kurz) I.G.Semakin, „Informatika“ problémová kniha-dílna (1. část) I.G.Semakin.

Požadavky na znalosti a dovednosti:

Studenti by měli vědět:

  • co je „abeceda“, „síla abecedy“, „abecední přístup k měření informací“;
  • jak měřit objem informací;
  • jak se určuje jednotka měření informačních bitů;
  • Co je bajt, kilobajt, megabajt, gigabajt.

Studenti by měli být schopni:

  • uveďte příklady zpráv nesoucích 1 bit informace;
  • měřit informační objem textu;
  • představují množství přijatých informací v různých jednotkách (bity, bajty, kilobajty, megabajty, gigabajty).

Plán lekce

  1. Org. moment - 1 min.
  2. Kontrola domácího úkolu - 2 min.
  3. Nový materiál. Informace o měření. Abecední přístup - 25 min.
  4. Upevňování naučeného - 14 min.
  5. Shrnutí lekce. - 2 minuty.
  6. Domácí úkol - 1 min.

I. Org. moment.

II. Kontrola domácích úkolů.

Sešit č. 1. Str. 11 č. 2, 5, 8, 11, 19 *.

III. Nový materiál.

1. Úvod.

Proces poznávání okolního světa vede k hromadění informací ve formě znalostí.

Jak poznáte, že jste obdrželi mnoho informací nebo ne?

Je nutné měřit množství informací. A dnes zjistíme, jak to udělat.

Získávání nových informací vede k rozšiřování znalostí nebo jinak řečeno ke snižování nejistoty znalostí.

Pokud nějaká zpráva vede ke snížení nejistoty našich znalostí, pak můžeme říci, že taková znalost obsahuje informaci (obrázek 1).

2. Jak můžete měřit množství informací.

Pro měření různých veličin existují standardní jednotky měření.

Například:

  • Vzdálenost se měří v milimetrech, centimetrech, decimetrech...
  • Hmotnost se měří v gramech, kilogramech, tunách...
  • Čas se měří v sekundách, minutách, dnech, letech...

Pro měření informací je proto nutné zavést vlastní standardní jednotku.

Existují dva přístupy k měření informací:

b) Abecedně. Umožňuje měřit informační objem textu v jakémkoli jazyce (přirozeném nebo formálním); při použití tohoto přístupu není objem informací spojen s obsahem textu, v tomto případě objem závisí na informační váze postavy.

3. Abecední přístup k měření informací.

Připomeňme si, co je to abeceda?

  • Abeceda je celá sada písmen, interpunkčních znamének, čísel, závorek a dalších symbolů použitých v textu.

*Abeceda obsahuje mezeru (mezera mezi slovy).

Jaká je síla abecedy?

  • Síla abecedy je celkový počet znaků v abecedě.

Například: síla použité abecedy ruských písmen a symbolů je 54:

33 písmen + 10 číslic + 11 interpunkčních znamének, závorky, mezera.

Abeceda používaná v počítači (strojový jazyk) má nejmenší sílu; nazývá se binární abeceda, protože obsahuje pouze dva znaky „0“, „1“.

Informační váha symbolu binární abecedy se bere jako jednotka informace a nazývá se 1 bit.

Pokuste se určit objem informační zprávy:

Informace napsané ve strojovém jazyce váží:

01110 - …bit

010010 - …bit

010 - ...bit

0111111011110 - … bit

U abecedního přístupu se má za to, že každý znak textu má informační váhu.

Informační váha symbolu závisí na síle abecedy.

S rostoucí mocninou abecedy se zvyšuje informační váha každého symbolu.

Pro měření objemu informace je nutné určit, kolikrát je ve stanoveném objemu informace obsažena informace o velikosti 1 bitu.

Například:

1) Vezměme si čtyřmístnou abecedu (vynalezenou), (obrázek 2).

Všechny znaky původní abecedy lze kódovat ve všech možných kombinacích pomocí číslic binární abecedy.

Pojďme získat binární kód každého znaku abecedy. Abychom mohli zakódovat znaky abecedy, jejíž mohutnost je čtyři, potřebujeme dva znaky binárního kódu.

Každý znak čtyřznakové abecedy tedy váží 2 bity.

2) Kódujte každý znak abecedy binárním kódem, jehož mohutnost je 8 (obrázek 3).

Závěr. Celou abecedu, jejíž mohutnost je 8, lze zakódovat do strojového jazyka pomocí tří znaků binární abecedy (obrázek 4).

Jaký je podle vás informační objem každého znaku v osmimístné abecedě?

Každý znak osmimístné abecedy váží 3 bity.

3). Kódujte každý znak abecedy s mohutností 16 pomocí binárního kódu.

Co lze uzavřít?

Abecedu šestnácti znaků lze zakódovat pomocí čtyřmístného binárního kódu.

Vyřešit problém.

Úkol: Kolik informací obsahují 3 znaky 16místné abecedy?

Protože každý znak 16znakové abecedy lze zakódovat pomocí čtyřmístného binárního kódu, každý znak původní abecedy váží 4 bity.

Protože byly použity celkem 3 znaky abecedy s kapacitou 16 znaků, tedy: 4 bity 3 = 12 bitů

Odpověď: množství informací zapsaných 3 abecedními znaky s kapacitou 16 znaků se rovná 12 bitům.

Zapišme si tabulku shody mezi mocninou abecedy (N) a počtem znaků v kódu (b) - bitovou kapacitou binárního kódu.

Najděte vzor (obrázek 5)!

Jaký závěr lze vyvodit?

Informační váha každého symbolu vyjádřená v bitech (b) a mocnina abecedy (N) jsou ve vztahu podle vzorce: N = 2 b

Abeceda, ze které se na počítači sestavuje text (dokument), se skládá z 256 znaků.

Tato abeceda obsahuje symboly: malá a velká písmena latinky a ruštiny, čísla, znaky aritmetických operací, všechny druhy závorek, interpunkční znaménka a další symboly.

Zjistěte, kolik informací obsahuje jeden znak abecedy, jehož mocnina je 256.

Řešení. Ze vzorce N = 2 b vyplývá 256 = 2 8.

Závěr. To znamená, že každý znak abecedy použitý v počítači pro tisk dokumentů váží 8 bitů.

Tato hodnota byla také brána jako jednotka informace a dostala název byte.

8 bitů = 1 bajt

Úkol. Článek obsahuje 30 stran, každá stránka obsahuje 40 řádků, každý řádek obsahuje 50 znaků. Kolik informací článek obsahuje?

Průběh rozhodnutí.

1) Každá stránka má 50 40 = 2000 znaků;

2) v celém článku 2000 30 = 60 000 znaků;

3) protože váha každého znaku je 1 bajt, tedy informační objem celého článku je 60 000 1 = 60 000 bajtů nebo 60 000 8 = 480 000 bitů.

Jak je z problému patrné, bajt je „malá“ jednotka měření informačního objemu textu, proto se k měření velkého množství informací používají větší jednotky.

Jednotky měření objemu informací:

1 kilobajt = 1 kB = 210 bajtů = 1024 bajtů

1 megabajt = 1 MB = 210 kB = 1024 kB

1 gigabajt = 1 GB = 210 MB = 1 024 MB

Zkuste převést výsledek problému na větší jednotky měření:

    60 000 bajtů 58,59375 KB

    60 000 bajtů 0,057 MB

IV. Upevňování naučeného.

Sešit č. 1. S. 19 č. 19, 20, 22, 23, 25.

V. Shrnutí.

VI. Domácí práce.

Sešit č. 1. Str. 20 č. 21, 24, 26.