Organizace vyhledávání dat na internetu. Organizace vyhledávání informací na internetu

MINISTERSTVO ODVĚTVÍ RUSKA

Státní vzdělávací instituce vyššího odborného vzdělávání

"RUŠTINA

STÁTNÍ HUMANITÁRNÍ UNIVERZITA “

Pobočka Ruské státní humanitární univerzity v Petrohradě.

Petrohrad 2011

Úvod 3

1. Internet jako moderní zdroj informací 4

2. Specifičnost informací ve vzdělávacích aktivitách studenta 6

3. Vlastnosti používání internetu při hledání informací pro vzdělávací aktivity studenta 8

Závěr 13

Seznam pramenů a literatury 14

Úvod

Dnes se student bez počítače neobejde. Komunikace s počítačem začíná ve škole, kde studenti zvládnou základy výpočetní techniky, seznámí se s výukovými internetovými weby. Při vstupu na univerzitu je zpravidla mnoho uchazečů o počítači dobře obeznámeno a většina z nich jej má doma.

Aby si studenti ulehčili proces učení, často se uchylují k používání internetu, stahování esejů a esejů. Takový přístup ke třídám může prozatím projít. Studium na univerzitě však vyžaduje vážnější přístup a vyžaduje zvládnutí různých specifických věd. V tomto smyslu internet již není spolehlivým zdrojem informací a v jistém smyslu je zcela škodlivý.

Moderní internet má mnoho sociálních a kulturních aspektů, je univerzálním informačním médiem. V tomto ohledu je relevantní otázka internetu jako zdroje informací ve vzdělávacích aktivitách studenta.

Úkoly práce jsou:

    Popište internet jako moderní zdroj informací.

    Odhalit specifika informací ve vzdělávacích aktivitách studenta.

    Zvažte zvláštnosti používání internetu při hledání informací pro vzdělávací aktivity studenta.

1. Internet jako moderní zdroj informací

Podle webu wikipedia.org: Internet (vyslovuje se [Internet]; anglicky Internet) je celosvětový systém vzájemně propojených počítačových sítí, postavený na použití protokolu IP a směrování datových paketů. Internet tvoří globální informační prostor, slouží jako fyzický základ pro World Wide Web a mnoho dalších systémů (protokolů) pro přenos dat. Často označované jako „ Celosvětová síť„A„ Globální síť “. V každodenním životě někdy říkají „internet“ 1.

V dnešní době, kdy se slovo „internet“ používá v každodenním životě, nejčastěji to znamená síť WWW a informace v ní dostupné, nikoli samotná fyzická síť.

Dnes se internet stává jedním z hlavních zdrojů informací díky obrovskému množství dat umístěných v síti a možnosti snadného přístupu k nim. Současně získává vyhledávání na webu stále praktičtější hodnotu, protože s rychlým nárůstem množství dostupných dat je postup hledání potřebných informací stále komplikovanější 2.

Síť obsahuje obrovské množství informačních zdrojů. Podle některých odhadů počet dokumentů přesáhl 65 milionů a nadále rychle roste 3. Takový objem informací vyžaduje správnou organizaci procesu vyhledávání a použití speciálních technologických nástrojů, jako jsou vyhledávače. Jednoduché hledání klíčového slova obvykle přináší desítky tisíc až několik milionů odkazů, je zřejmé, že práce s tak velkým počtem dokumentů je prakticky nemožná, to znamená, že obsahuje informace, které nejsou relevantní.

Kromě problému vyhledávání existuje problém se spolehlivostí informací na internetu. Snadný přístup a zveřejnění údajů umožňuje snadné šíření chybných a často záměrně nepravdivých informací 4.

Tyto dva problémy: vyhledávání a spolehlivost určují specifika internetu jako zdroje informací.

2. Specifičnost informací ve vzdělávacích aktivitách studenta

Podle webu wikipedia.org: Termín informace pochází z latinského slova informace, což znamená „informace, vysvětlení, prezentace“ 5.

V současné době se věda pokouší najít obecné vlastnosti a vzorce spojené s pojmem „informace“, ale tento koncept zatím zůstává do značné míry intuitivní a přijímá různý sémantický obsah v různých odvětvích lidské činnosti.

V každodenním životě jsou informace jakákoli data nebo informace, které někoho zajímají, například zpráva o jakýchkoli událostech, o něčích činnostech atd. „Informovat“ v tomto smyslu znamená „komunikovat něco dříve neznámého.“

Informace - informace o objektech a jevech prostředí, jejich parametrech, vlastnostech a stavu, které snižují stávající míru nejistoty o nich, neúplné znalosti 6.

Jedna a ta samá informační zpráva (novinový článek, oznámení, dopis, telegram, odkaz, příběh, kresba, rozhlasové vysílání atd.) Může obsahovat různé množství informací pro různé lidi v závislosti na jejich nahromaděných znalostech, na úrovni porozumění této zprávě a zájem o to 7.

Na základě výše uvedeného můžeme konstatovat, že informace ve vzdělávací činnosti studenta by měly mít řadu specifických rysů.

1. Informace by měly odpovídat stupni připravenosti studenta, jeho úrovni znalostí. Příliš vysoká úroveň obtížnosti snižuje stravitelnost a snižuje motivaci studentů. Příliš nízká úroveň - snižuje obsah informací a negativně ovlivňuje účinnost procesu učení.

2. Informace použité studentem musí být relevantní, tj. odpovídají moderní úrovni vědeckých poznatků a vývoji společnosti.

3. Informace použité studentem musí být přesné.

4. Informace by měly být k dispozici, pokud jde o katalogizaci a vyhledávání.

3. Vlastnosti používání internetu při hledání informací pro vzdělávací aktivity studenta

Moderní student vyzbrojený osobním počítačem dobře ví, co a kde na internetu. Docela mistrovsky dostane na internet vše, co potřebuje k vytvoření další povinné tvorby: esej, esej, projekt kurzu, diplom atd. A po malé revizi, která často spočívá pouze v označení jeho příjmení a čísla skupiny, po vytištění na tiskárně předá „svou práci“ učiteli 8.

Zároveň se jeho lenost mnohonásobně zvyšuje a tento přístup snižuje pravděpodobnost úspěchu v budoucí kariéře. Je třeba poznamenat, že podvádění, které je v zásadě plagiátem, je v Rusku mnohem rozšířenější než na Západě, což snižuje šance na získání prestižního zaměstnání v konkurenci absolventů západních univerzit.

K dosažení úspěchu v soutěži by se měl člověk naučit zpracovávat kolosální množství informací, umět si prohlédnout ukázky písemných prací, všímat si jejich silných a slabých stránek, pokusit se „pitvat“ text někoho jiného, \u200b\u200baby z něj izoloval nejvýznamnější část. Na základě výsledné kostry by se měl student naučit, jak vytvořit požadované dílo. Tato práce byla v zásadě provedena v knihovnách knih před internetovým boomem 9. Důležitá je zde také práce učitele, který by měl studenta kompetentně vést, nezakazovat používání internetu, ale poukazovat na možná úskalí a dávat pokyny, jak jej používat. Například za účelem zúžení vyhledávacího okruhu může učitel poradit určité informační zdroje, čímž zajistí adaptaci učebního materiálu na přípravu studenta, navíc mu pomůže odfiltrovat falešné a nesprávné informace.

V moderní informační společnosti se role učitele zvyšuje. Například učitelé „staré školy“ mohou číst stejné přednášky po celá léta, vůbec se nezajímají o nejnovější úspěchy v tomto oboru, obor činnosti. Student s jakýmkoli mobilním zařízením připojeným k internetu navíc může zmást každého učitele. Učitel již není vnímán jako jediný zdroj znalostí. Student s internetem může učitele kdykoli opravit, kritizovat a postavit se neřešitelné otázce. Učitel na to musí být připraven, to je výzva moderní společnosti k modernímu vzdělávacímu systému. Učitel by se neměl hněvat, vyvarovat se odpovědi nebo skládat odpověď za běhu. Pokud dříve byl vztah učitel-student vybudován na principu senior-junior, měl by se nyní blížit principu internetu: peer-to-peer.

Mobilitu internetu udržuje samo o sobě další nebezpečí, a to nedostatek potřeby si něco pamatovat. K čemu? Pokud se můžete vždy zeptat Yandexu. Aby se student nedostal do této pasti, musí dokončit všechny úkoly zrádce, nesmí být líný, zapisovat, pamatovat, učit. Je to zavazadlo znalostí v lidské paměti, které formuje jeho obecnou erudici a schopnost řešit aplikované problémy v dané oblasti předmětu. Extrémní míra tohoto efektu mobility spočívá ve skutečnosti, že student si při setkání s neznámým výrazem říká: „Na internetu si mohu tento význam kdykoli prohlédnout. Teď nemám čas, podívám se později “- takto vznikají mezery ve vzdělávání. Před érou internetu by student uvažoval jinak: „Dokážu vyhledat význam tohoto pojmu ve slovníku (učebnice, encyklopedie, ...). Teď nemám čas, ale budu se muset podívat na význam tohoto pojmu a pamatovat si ho, protože nemohu pořád obcházet slovník. “

Z pohledu sebevzdělávání se student, a samozřejmě celá společnost, potýká s problémem informační krize 10. Informační krize spočívá v rozporuplné jednotě „informačního hladu“ a „informační exploze“, tj. V nedostatku informací v podmínkách jejich nadprodukce 11. Množství informací o konkrétní oblasti lidské činnosti přesahuje kapacitu lidského mozku 12. Proto se zvyšuje potřeba systematizace informací a filtrování informačního šumu. Student by měl používat důvěryhodné zdroje doporučené učitelem, uvedené v bibliografii učebnice.

Rychlost růstu informací je měřitelná. Knihovník R. Barton a fyzik R. Kebler z USA představili koncept „poločasu“ vědecké články analogicky s poločasem radioaktivních látek. Poločas rozpadu publikace je doba, během níž byla publikována polovina veškeré aktuálně používané literatury o odvětví nebo předmětu 13. Například pokud je poločas publikace ve fyzice 4,6 roku, znamená to, že 50% všech aktuálně používaných (citovaných) publikací v této oblasti není starších než 4,6 roku. Přestože taková definice poskytuje numerické hodnocení stárnutí informací, je třeba s takovým hodnocením zacházet opatrně a v konečném světle si každý odborník sám stanoví hloubku a stupeň předpisu, které v každém konkrétním případě potřebuje. Pro studenta pomůže stupeň relevance informací určit školitele.

Další vlastností informací na internetu je jejich rozptýlení po souboru zdrojů - Bradfordův zákon 15. Zjednodušeně to lze formulovat následovně: 1/3 vědeckých článků o konkrétním tématu bude publikováno v malém počtu zdrojů přímo souvisejících s tímto tématem. Další třetina bude publikována ve více zdrojích souvisejících s tímto tématem. A poslední třetina bude publikována ve zdrojích, které s tématem nemají nic společného, \u200b\u200ba poměr počtu zdrojů v těchto zónách je podle Bradforda stejný. S ohledem na tento vzorec je třeba poznamenat, že dosažení úplného informačního obsahu o konkrétním tématu je nemožné, pokud je výzkumný pracovník omezen na řadu zdrojů o této problematice, aniž by se uchýlil k pomoci speciálních informací, služeb a bibliografických služeb. Ve většině případů bude studentovi stačit první třetina, ale pro hlubší práci, jako jsou práce ve specializovaných oborech, diplomové práce, se student potřebuje obrátit o pomoc na tento druh elektronických katalogů.

Navzdory skutečnosti, že svoboda přístupu uživatelů internetu k informačním zdrojům není omezena státními hranicemi, ale jazykové hranice zůstávají. Převládajícím jazykem internetu je angličtina. Druhým nejoblíbenějším jazykem je čínština a třetím nejpopulárnějším jazykem je španělština. Ruský jazyk je na 9. místě 16. V tomto ohledu získá student, který mluví cizími jazyky, zejména angličtinou, přístup k mnohem více informací. Pokud mluvíme o rozdělení informací na internetu, pak stojí za zmínku, že informace o různých oblastech lidské činnosti nejsou rovnoměrně prezentovány z hlediska objemu. Na internetu je více technických informací týkajících se programování, informačních technologií, počítačového designu a méně informací o humanitních oborech. To lze vysvětlit skutečností, že techničtí specialisté jsou tak či onak spojeni s informačními technologiemi a internetem povahou své práce, a proto je počet materiálů, které publikují, vyšší.

Závěr

Shrnutím zvažovaných aspektů internetu jako zdroje informací ve vzdělávacích aktivitách studenta můžeme zdůraznit hlavní klíčové rysy a doporučení.

    Student musí být schopen používat internet a zároveň neustále zdokonalovat své dovednosti v používání internetu.

    Student by měl na základě informací na internetu ověřit stupeň spolehlivosti a relevance.

    K vyhledávání informací o daném tématu je vhodné použít specializované elektronické bibliografické katalogy.

    Pro zvýšení efektivity používání internetu by student měl zdokonalit angličtinu, která je nejběžnějším jazykem na internetu.

    Při plnění úkolů informační společnosti musí být student schopen zpracovat velké množství dat, izolovat z nich klíčové informace a odfiltrovat nadbytečná a nepotřebná data.

    Internet poskytuje nejen skvělé příležitosti pro získávání informací, ale také plný nebezpečí v podobě podváděcího listu, což často dělá medvědí službu v procesu učení.

Je třeba poznamenat, že podle bodů 2 a 3 musí student pracovat v přímém kontaktu se svým školitelem.

Seznam pramenů a literatury

Literatura

    Blumenau, V. I. Informační a informační služba. / DI Blumenau. - L.: Nauka, 1989. - 192 s.

    Galeeva, I. S. Internet jako nástroj pro bibliografické vyhledávání / I. S. Galeeva; vědecký. vyd. M.I. Vershinin. - SPb.: Professiya, 2007 .-- 248 s.

    Efimov A.N. Informační exploze: skutečné a imaginární problémy / A. N. Efimov. - M.: Nauka, 1985 .-- 160 s.

    Vyhledávání informací na internetu: učebnice. příspěvek / V. I. Averchenkov, V. V. Miroshnikov, S. M. Roshchin a další ,; Bryan. Stát tech. University - Bryansk, 2001. - 28 s.

    Kuzin, F. A. Ph.D. disertační práce: technika psaní, pravidla registrace a pořadí ochrany: praktická. Příručka pro postgraduální studenty a uchazeče o zaměstnání uch. Stupně / FA Kuzin. -. - M.: Os-89, 1999 .-- 208 s.

    Kuznetsov I. N. Internet ve vzdělávací a vědecké práci: Praktický průvodce. - 2. vyd. - M.: Vydavatelská a obchodní společnost „Dashkov and Co“, 2005. - 192 s.

    Kuznetsov I. N. Učebnice o informačních a analytických pracích. M.: Yauza, 2001 .-- 320 s.

    Mikhailov, O. A. Nové v internetovém vyhledávání podle zdrojů roku 2000 / O. A. Mikhailov; Vyrůst. Stát oblouk. vědecké a technické dokumentace. - M.: Max Press, 2001 .-- 171 s.

    Parshukova GB Metody vyhledávání odborných informací: studijní průvodce. Manuál / G.B. Parshukova. - SPb.: Professiya, 2009. - 224 s.

    Solomenchuk V.G. Internet: Krátký kurz. SPb.: Peter, 2001 - 322 s.

Internetové zdroje

    URL: internet

    URL: http://ru.wikipedia.org/wiki/Informace

1 URL: http://ru.wikipedia.org/wiki/internet

Objektivní:studium zásad organizace vyhledávání v systému Windows internetové sítě a získání praktických dovedností při psaní vyhledávacích dotazů.

2.1 Jednoduché techniky vyhledáváníWeb-stránky

Jednoduché vyhledávací techniky neznamenají použití výkonných vyhledávacích schopností Internetu a jsou založeny na znalostech principů vytváření symbolických doménových jmen a intuici.

Vyhledejte reklamuWeb- stránky.Chcete-li získat adresu, kterou hledáte, můžete přidat název firmy, podniku, organizace nebo jednoduché anglické podstatné jméno (klíčové slovo). com, předcházejte www. Webové stránky s doménou nejvyšší úrovně v adrese. com., nejčastěji obsahují informace v angličtině.

Příklad 1. Vezměme si název společnosti SONY, přidejte doménu. com a www. - získejte adresu webové stránky SONY: www. sony. com... Podobně můžete získat:

www. cnn. com - CNN World News;

www. mtv. com - hudební zprávy MTV;

www. - časopis COSMOPOLITAN.

Pokud zadáte klíčové slovo v adresní řádek Internet Badatel a stiskněte Ctrl+ Enter, poté se prohlížeč pokusí přejít na přesnou adresu URL a automaticky přidá název protokolu a webovou značku, například http: // www. a doména nejvyšší úrovně. com. Například pokud mě napíšete do adresního řádku a stisknete Ctrl-Enter, pak prohlížeč Internet Badatel se pokusí otevřít web s adresou http:// www. . com... Pokud se uzel neotevře, potom neexistuje.

Hledání podle regionů.Pro Rusko a další regiony zůstává výše uvedená technika platná. V tomto případě je k klíčovému slovu přidána doména nejvyšší úrovně regionu (dvoupísmenný kód země), která udává adresu webové stránky. Chcete-li například vyhledat ruské servery, můžete zkusit přidat doménu do klíčového slova. ru.

Příklad 2. Je známo, že má server www. audi. com... Můžete se pokusit najít její pobočku v Rusku nahrazením domény. com do domény. ru, - www. audi. ru.

Hledejte velké vzdělávací instituce.Doména je přidána k názvu nebo zkratce instituce. edu (hlavně pro americké a evropské regiony), kde je obvykle uvedena správná adresa.

Příklad 3. Pojďme si vzít OXFORD University, přidat doménu. edu a před www. - získejte adresu webové stránky univerzity OXFORD: www. oxford. edu... Doména často chybí na adrese školního webu. edu. Registrovanou doménou druhé úrovně (nebo aliasem domény) může být zkrácený anglický název instituce. Chcete-li vyhledat ruskou vzdělávací instituci, můžete si ji vzít anglická zkratka, například MSU (Moskevská státní univerzita), přidejte doménu. ru - www. msu. ru - Moskevská státní univerzita pojmenovaná po.

URL webové stránky často obsahuje doménové jméno poskytovatel internetových služeb, na jehož počítači je tato webová stránka nainstalována, například www. kgtu. runnet. ru - adresa Krasnojarské státní technické univerzity, kde ***** je název domény poskytovatele internetových služeb.

Mnoho zemí má zaregistrovanou doménu druhé úrovně pro vzdělávací instituce. Například pro Spojené království je to doména AC (Academic). Jakákoli webová stránka může mít několik aliasových adres, při přístupu na kterou se uživatel dostane na stejnou webovou stránku. Například pro OXFORD University jsou to adresy www. vůl. ac. spojené království a www. oxford. edu.

Jiné vyhledáváníWeb-stránky.Můžete manipulovat s klíčovými slovy a doménami nejvyšší úrovně a najít vládní (.gov), vojenské (.mil) a další organizace (.org). Například adresa Bílého domu vlády USA je: www. bílý dům. vláda.

2.2 Webové vyhledávačeInternet

VInternet má výkonné prostředky k vyhledávání jakýchkoli informací: dokumentů, obrázků, programů, webových stránek atd. Hledání probíhá v tzv. vyhledávače,které se také nazývají vyhledávací programy, vyhledávače, vyhledávače.Na internetu existuje mnoho vyhledávačů. Nejznámější systémy vyhledávání informací jsou uvedeny v tabulce 2.1. Seznam odkazů na různé vyhledávače je k dispozici na webové stránce www. mnich. newmail. ru.

Tabulka 2.1 - Nejoblíbenější vyhledávače

Název vyhledávače

Adresa

Yandex (rusky)

http: // www. *****

Rambler (rusky)

http: // www *****

Aport (rusky mluvící)

http: // w w w. *****

Yahoo! (anglicky mluvící)

AltaVista (anglicky)

Google (ruština)

http: // www. *****

Vyhledávací systémimplementováno jako webová stránka s běžnou adresou, která obsahuje tzv hledaný řetězeca tlačítko Vyhledávání (Vyhledávání), a může také obsahovat tematický katalog zdrojů,odkazy na oblíbené stránky atd.

Chcete-li volat vyhledávač, musíte zadat jeho adresu do adresního řádku internetového prohlížeče. Po načtení vyhledávače do vyhledávací lišty musíte zadat žádost (dotaz), což je textový řetězec (v jakémkoli jazyce), klíčová fráze dokumentů, které hledáte na internetu, a klikněte na tlačítko Vyhledávání.Více efektivní vyhledávání je nutné, aby požadavek obsahoval slova nebo fráze, které budou na prohledávané webové stránce nebo ve prohledávaném dokumentu (je třeba je „uhodnout“). Po chvíli se zobrazí obrazovka seznam adresWeb-strany,obsahující odkazy na požadované dokumenty, které jsou obvykle doprovázeny komentáři. Kliknutím na odkaz můžete přejít na kterýkoli z nalezených dokumentů.

Chcete-li přejít na další stránku seznamu nalezených dokumentů, musíte kliknout na odpovídající číslo (1, 2, 3, ...) v hlavním okně s výsledkem hledání. Obvykle dokumenty z první desítky nalezených odpovídají dotazu co nejpřesněji.

Základem každého vyhledávače je speciální program - síťový robotnebo pavouk (pavouk),někdy najdete jména červ (červ),prohledávač (liána).Vyhledávač vysílá takové „pavouky“ na internet maximální částka (je-li to možné) uvedené na internetových webových stránkách, a poté zaregistrujte jejich adresu (URL) a obsah v jejich databázi. Poté, co uživatel zadá dotaz a klikne na tlačítko Vyhledávánívyhledávací systém prohledá databázi a zobrazí výsledek hledání.

Kromě toho téměř všechny vyhledávače umožňují registraci uživatelské stránky na internetu. Chcete-li to provést, na stránce významného vyhledávače, například YAHOO!, Musíte zavolat režim registrace a zadat adresu URL a popis své stránky. Vyhledávač dále distribuuje vaše registrační informace na všechny ostatní hlavní vyhledávací stránky, na ty, na ostatní atd. Existují také globální registrační servery.

Prohledat adresářejsou k dispozici například ve vyhledávačích Rambler, Yahoo !, AltaVista atd. Chcete-li prohledat katalog, musíte vybrat témata myší, prohloubit a zúžit rozsah hledání, dokud se seznam zobrazených odkazů nezredukuje na několik stránek, které lze procházet ručně nebo do dostatečně velké skupiny, ve které můžete provádět normální vyhledávání (například ve vyhledávači Yapeeh: Studium vysokého školství na Moskevské státní univerzitě).

2.3 Pravidla pro provádění dotazů ve vyhledávačích

Při provádění dotazů existují určitá pravidla, která se mohou v různých vyhledávačích částečně lišit, ale základní akce jsou podobné. Pravidla pro provádění dotazů lze vždy najít na webové stránce konkrétního vyhledávače v sekci Pomoc(tuto část lze nazvat Pomoc„Jak hledat, Tipy pro vyhledávání, Pravidla dotazůatd.). Pravidla požadavku obvykle zahrnují použití dotazovací jazyk pro pokročilé vyhledávání.

Nejjednodušším pravidlem pro všechny vyhledávače je zadat libovolnou frázi a kliknout Vyhledávání.

V další části budeme uvažovat o některých pravidlech pro provádění dotazů pomocí příkladu Yandex. Mnoho z těchto pravidel platí i pro jiné vyhledávače. Příklady dotazů jsou převzaty ze stránek nápovědy vyhledávače Yandex.

2.4 Příklady jednoduchých dotazů ve vyhledávači Yandex

Dotaz je obvykle jen jedno nebo více klíčových slov, například: firemní mikroprocesoryIntel. K takové žádosti existují dokumenty, ve kterých jsou nalezena všechna slova žádosti. Některá slova v požadavku jsou ignorována (spojky, předložky atd.), Protože nenesou sémantický význam. Například na vyžádání jablka ve sněhubudou nalezeny všechny dokumenty, které obsahují dvě slova současně: „apple“ a „snow“ (pořadí jejich zobrazení v seznamu se však bude lišit). Kde jsou slova v dokumentu umístěna, v jaké gramatické podobě jsou umístěna - to nevadí. Záminka naignorováno. Výše uvedený dotaz lze tedy napsat takto: sníh na jablku.Výsledek hledání bude stejný.

Důležitá a velmi užitečná vlastnost vyhledávačů: bez ohledu na to, v jaké gramatické podobě napíšete slovo v dotazu, je v dokumentech ve všech jeho podobách. Například na vyžádání muž šelmimo jiné budou nalezeny dokumenty obsahující text „lidé přicházejí“. Rozpoznávání všech forem funguje pro běžná ruská slova. U exotických slov, neologismů atd. Se neprovádí.

Operátory Yandex, jejich účel a příklady použití naleznete v části nápovědy systému.

Můžete použít možnosti pokročilého vyhledávání na stránce Rozšířené hledání k vizuálnímu vytváření složitých dotazů.

1. Podívejte se na teoretické informace.

2. Vytvořte webovou adresu světoznámé společnosti (Intel, IBM, Sony atd.) A otevřete ji Internet Badatel. Nalezené webové stránky uložte do samostatné složky.

3. Stejnou technikou jděte do Petrohradu státní univerzita a stejným způsobem otevřít web Katedry aplikované matematiky stejné univerzity. Nalezené webové stránky uložte do samostatné složky.

4. V každém vyhledávači (tabulka 2.1) proveďte několik dotazů týkajících se problémů, které vás zajímají, a otevřete nalezené dokumenty.

5. Zkuste prohledat tematické adresáře.

6. Pomocí rozšířeného vyhledávání na Yandexu porovnejte popularitu následujících webů podle počtu stránek, které na ně odkazují: Prezident a vláda Ruská Federace; Moskevská státní univerzita a Petrohradská státní univerzita; Hermitage a Louvre. Nalezené webové stránky uložte do samostatné složky. Vytvořit textový soubor, kde zaznamenejte počet odkazů na každý z nich.

7. Najděte informace o tom, kdy a kde jste se narodili. Seznam jeho děl. Najděte jeho fotografie v různých letech jeho života. Uložte všechny informace do samostatné složky.

8. Vyhledejte na internetu informace o zvoleném tématu práce na kurzu. Na základě výsledků hledání vytvořte v textový editor Slovní tabulku podle ukázky (tabulka 2.3) a vyplňte ji.

Tabulka 2.3 - Ukázka zprávy s výsledky vyhledávání

a / a

Charakteristika výsledků vyhledávání

URL nalezeného zdroje

Stručný popis zdroj

9. Vyzvěte učitele, aby podal zprávu o odvedené práci.

10. Odstraňte soubory uložené během práce z pracovní složky.

2.6 Testovací otázky

1. Popište jednoduché techniky vyhledávání informací na internetu.

2. Jaké jsou principy internetových vyhledávačů?

3. Formulujte základní pravidla pro vytváření vyhledávacích dotazů.

4. Které z vyhledávačů, které jste zvažovali, mají schopnost používat dotazovací jazyk?

5. Které z vyhledávačů, které jste zvažovali, mají tematický katalog zdrojů?

6. Které z vyhledávačů, které jste zvažovali, mají možnosti vyhledávání v různých kategoriích informačních zdrojů?

Kdokoli vlastní tyto informace, vlastní svět. U asistenta manažera není touha mít určité znalosti diktována ješitností nebo myšlenkami na dobytí světa, ale nejčastěji profesionální nutností. Schopnost získat užitečná data je bezpochyby jedním z klíčů v práci osobního asistenta, protože ne vždy jsou pravdivé nebo nezbytné informace na povrchu.

Co je důvěrnost informací?

Podle odstavce 7 čl. 2 spolkového zákona ze dne 27.07.2006 č. 149-FZ „Informace informační technologie a o ochraně informací "(ve znění ze dne 24.11.2014) důvěrnost informací - povinný požadavek, aby osoba, která má přístup k určitým informacím, nepředávala tyto informace třetím stranám bez souhlasu jejího vlastníka... Dalším konceptem důvěrnosti je nepřístupnost informací pro určitý okruh uživatelů. Tak či onak, jedná se o informace, které se přenášejí pouze podle určitých pravidel stanovených nositelem práv, ať už jde o právnickou osobu (organizaci) nebo jednotlivce (obyčejný občan, který se pro nás z nějakého důvodu stal zajímavým). Důvěrnost tedy na jedné straně poskytuje ochranu držiteli autorských práv k informacím a na druhé straně vytváří překážky pro ty, kdo mají zájem o přístup k nim.

Informační hádanka

Jednou ze zvláštních vlastností informací je, že „žijí“; přenášeny tak či onak pomocí různých metod a nástrojů. Z tohoto důvodu dokonce důvěrná informace, kterého je často nemožné získat podáním oficiální žádosti, se objevuje ve veřejné doméně kvůli neopatrnosti jeho držitele autorských práv nebo neopatrnému přístupu k jeho údajům. Dnes, s ohledem na aktivní použití moderní technická zařízení, stejně jako internet, jsou v internetovém prostoru chaoticky rozptýleny nejčastěji části mozaiky obecného informačního obrazu držitele autorských práv. Chcete-li skrýt data, musíte to udělat účelně, navíc musíte mít určité dovednosti a schopnosti. A kromě toho, někoho by napadlo, že by někoho napadlo provést informační vyšetřování o jeho osobě nebo organizaci?

Jedním slovem, pro získání potřebných informací potřebuje asistent manažera přístup na internet, provádět potřebné dotazy, shromažďovat údaje a plně využívat své analytické dovednosti.

Špionážní motivy

Nedostatek informací je hlavním motivem pro doplnění informační zásoby. Je známo, že opatření přijatá v případě nedostatku informací mohou vést k nepříjemným následkům. Stanovení cílů v „vyšetřování informací“ hraje na jedné straně důležitou roli při určování očekávaného výsledku, na druhé straně při výběru zdrojů pro vyhledání potřebných údajů. Při profesionální činnosti může asistent manažera dostávat od svých nadřízených různé pokyny týkající se hledání jakýchkoli informací. Jejich seznam je individuální a jeho hranice jsou pravděpodobně neomezené. Je však možné identifikovat hlavní situace, jejichž řešení bude užitečné, aby se asistent manažera uchýlil ke shromažďování dalších informací.

  • Rozhovor.Změna zaměstnání a hledání nového vyžaduje odpovědnost a pečlivou analýzu údajů o zaměstnavateli. Stává se, že podle výsledků jedné nebo několika fází pohovoru není dostatek údajů k tomu, aby bylo možné učinit informované rozhodnutí „pro“ nebo „proti“. Buď kvůli tomu, že zaměstnavatel nedodal potřebné materiály z důvodu nedostatku času, nebo jim prostě nepřikládal důležitost, nebo kvůli touze je záměrně skrývat. V každém případě je nepravděpodobné, že by zástupci společnosti byli připraveni na pohovor odpovědět čestně na „delikátní“ soukromé otázky, například otázky týkající se zpoždění platů, fluktuace zaměstnanců nebo souvisejících běžné problémy V organizaci.

Pokud jsou počáteční údaje k dispozici, doporučuje se asistentovi manažera najít před pohovorem co nejvíce užitečných informací o společnosti: na jedné straně zajistit a položit nezbytné otázky, na druhé straně prokázat profesionalitu a ukázat povědomí a připravenost na schůzku.

  • Profesionální úkoly. Činnosti moderních organizací jsou nevyhnutelně spojeny se vzájemnou spoluprací. Každá firma má partnery, zákazníky, dodavatele atd. Například před uzavřením dohody s určitou společností o dodávkách produktů nebo poskytování služeb právník požaduje ověření nezbytného balíčku dokumentů, který obsahuje minimální nebo maximální úplný seznam - v závislosti na požadavcích vaší organizace na protistrany. Právník ne vždy zkontroluje společnosti, v některých případech to provede asistent manažera jménem svých nadřízených. Vyhledání informací o nové společnosti nebo jejím vedení proto může být součástí povinností osobního asistenta.
  • Osobní a profesionální kontakty. Výkonný asistent denně komunikuje s velkým počtem lidí (kolegové, dodavatelé, noví známí v práci nebo v soukromém životě). Existují případy, kdy je z nějakého důvodu nutné shromáždit další informace o osobě, například při najímání nového zaměstnance: s kým dříve pracoval, jaké je jeho hobby, existují nějaké nedostatky v profesionální biografii atd. Poměrně osobní kontakty dodatečné znalosti také nebudou nadbytečné, protože ve většině případů mají lidé tendenci skrývat osobní údaje o sobě (v nejlepším případě - v nejhorším případě z důvodu prostého podezření člověka - když je skutečně co skrývat).

Ve velkých organizacích tzv. bezpečnostní služba. Zabývá se profesionálním hledáním všech informací o jednotlivcích nebo organizacích, pokud je to nutné k zajištění obchodní, ekonomické a průmyslové bezpečnosti společnosti. Specialisté této služby mají zpravidla k dispozici vlastní zdroje pro provádění dotazů a shromažďování údajů. Pokud má vaše organizace bezpečnostní službu, doporučujeme kontaktovat její specialisty a získat potřebné informace ze spolehlivých zdrojů.

Počáteční údaje

Při provádění „informačního šetření“ nejsou žádné podrobnosti „malé“ nebo zbytečné. Navíc v podmínkách nedostatku informací je jakýkoli informační „háček“ nezbytným vodítkem k postupnému hledání užitečných dat. „Háčky“ pro vyhledání potřebných materiálů v internetovém prostoru jsou správně formulované dotazy a veškerá počáteční data, která asistent manažera aktuálně má. Na první pohled budou k zahájení hledání stačit ty nejskromnější novinky.

Žádost o název organizace:

  • poskytne informace o názvu webových stránek společnosti;
  • vám umožní získat kontaktní informace;
  • poskytne výsledky vyhledávání na základě údajů ze zpravodajských a reklamních zdrojů;
  • poskytne informace o oblasti činnosti, registračních údajích, poloze atd.

Žádost o celé jméno vedoucí organizace nebo soukromá osoba:

  • pomoc při získávání informací o názvu společnosti a oboru činnosti;
  • vám umožní seznámit se s informacemi o reklamních, obchodních, zpravodajských zdrojích;
  • poskytne výsledky hledání životopisů, životopisů, referenčních materiálů;
  • poskytne informace o „přítomnosti“ v obchodních a zábavních sociálních sítích atd.

Žádost podle telefonního čísla nebo čísla společnosti mobilní telefon:

  • umožní vám získat informace o společnosti, pokud se jedná o telefonní číslo kanceláře;
  • poskytne informace o příslušnosti čísla mobilního telefonu k určité oblasti Ruska;
  • poskytne vyhledávací údaje pro reklamní weby, reklamy, zveřejněná volná místa a nabídky od organizace nebo jednotlivce atd.

Na notu.Tyto počáteční údaje lze považovat za základní pro další sběr informací. Výsledky vyhledávání pro zadané dotazy by měly být použity jako data pro následující dotazy. Například pokud bylo původně známé pouze telefonní číslo organizace, pak na základě výsledků takového požadavku můžete získat údaje o názvu organizace a poté informace s údaji manažerů a zakladatelů.

Uvažujme příklad získávání informací a jejich použití.

Do vyhledávače zadejte původně známé telefonní číslo. Dostaneme následující výsledek (obr. 1):

Dále podle názvu organizace zadáme následující požadavek a získáme několik webů s referenčními informacemi o organizacích. V tomto případě se seznámíme s výsledky na webu rusprofil. ru (obr. 2).

Kdy mohou být tyto informace užitečné?

  • Asistent manažera dostal za úkol kontaktovat redakční radu časopisu pro reklamu;
  • asistent manažera dostal pokyn připravit oficiální dopis adresovaný generální řediteljméno generálního ředitele však nebylo původně známé;
  • manažer přijal hovor s uvedením telefonního čísla a jména kontaktní osoby a asistent byl požádán, aby objasnil, ze které společnosti volali.

Vyhledávače zpravidla poskytují mnoho výsledků s odkazy na různé zdroje a weby pro dotazy podle jména, telefonního čísla a názvu společnosti. Doporučuje se, aby asistent manažera pečlivě přečetl referenční materiály a pečlivě odfiltroval užitečná data z „spamu“, přičemž zvláštní pozornost by měla věnovat také zdroji informací: v tomto případě bude oficiální web organizace spolehlivější než například reklamní referenční webový zdroj.

Díky tomu, že má minimální počáteční data a dovednosti v práci s internetovými vyhledávači, může asistent manažera najít informace požadované v současné době nebo získat další data pro další dotazy a pokračování „vyšetřování informací“.

„Elementární Watson!“

V internetovém prostoru každý z uživatelů, tak či onak, zanechává své vlastní „stopy“ a informace, které kdy zveřejnili, mají „ocasy“. Když tedy používáte dotazy na vyhledávací liště Google, Yandex nebo jiných vyhledávačů, může se asistent seznámit s informacemi:

  • o inzerátech zveřejňovaných uživatelem na stránkách pro hledání zaměstnání nebo zaměstnancích, soukromých reklamách na prodej nebo nákup, o poskytovaných nebo požadovaných službách;
  • o zveřejněných zprávách organizace nebo o úřednících, o účasti na jakýchkoli obchodních akcích, výstavách, jiných činnostech společnosti;
  • o vytvořeném životopise a životopisech, pokud mluvíme o soukromé osobě;
  • přítomnost v sociálních sítích a skupinách;
  • o recenzích produktů společnosti nebo recenzích společnosti jako zaměstnavatele a mnoha dalších. dr.

I když informace o hledání zaměstnání nebo zaměstnance, inzeráty a zveřejněné zprávy nejsou relevantní, nejsou držiteli autorských práv vždy vymazány - ze zapomnění nebo pokud to není nutné.

Co a kde hledáme? Jak to použijeme?

Podle toho informační úkol je na rozhodnutí osobního asistenta (zda shromažďuje nejúplnější informace nebo pouze kontroluje určité údaje o organizaci nebo jednotlivci), lze zvolit jiné efektivní metody hledat na internetu. Chcete-li je použít, potřebujete také počáteční údaje (postačují informace o názvu společnosti nebo kontaktní údaje nebo celé jméno vedoucího nebo jednotlivce) (viz tabulka).

Typ informací a příklady jejich použití

Typ informací

Příklady použití

Celé jméno společnosti a její činnosti

Celé jméno, organizační a právní forma a oficiálně registrované typy vykonávaných činností jsou základní informace o společnosti. Bude užitečné jak při hledání nového zaměstnání pro sběr údajů o zaměstnavateli, tak při práci osobního asistenta pro kontrolu činnosti partnera nebo protistrany.

Často bezohlední zaměstnanci organizací prezentují své společnosti jako „velké“ nebo dokonce „mezinárodní“, ale ve skutečnosti se ukazuje, že se jedná o běžné individuální podnikatele, jejichž seznam činností nezahrnuje ta pracovní místa, pro která je vaše společnost plánovala přilákat

Datum registrace v vládní orgány

Datum registrace podniku u státních orgánů je důležité, pokud jsou pro vaši organizaci důležité mnohaleté zkušenosti protistrany nebo partnera v konkrétní oblasti.

Pokud vám například společnost řekne, že je na trhu více než 10 let, ale ve skutečnosti byla zaregistrována před několika měsíci, může to vzbudit pochybnosti o solidnosti a spolehlivosti společnosti.

Informace o době trvání podniku budou užitečné jak v profesionální práci asistenta manažera, tak v případě, že je nutné shromáždit nejúplnější údaje o novém zaměstnavateli.

Informace o zakladatelích a vůdcích organizace

Informace o vedení a zakladatelích společnosti mohou zahrnovat informace o počtu zakladatelů, jejich úplném jménu, účastnických podílech, počtu manažerů a jejich úplném jménu. Užitečnost těchto dat spočívá v tom, že mohou sloužit jako základ pro následné získávání informací. Takže například, když známe zakladatele a manažery společnosti, je nutné podat další žádost o celé jméno. a účast těchto jednotlivců na činnostech jiných organizací. Lze tedy pochopit, jak „velcí“ jsou zakladatelé, a pokud jsou jejich podíly na účasti velké, je možné, že jsou také investory do několika společností. Na základě výsledků vyhledávání můžete jít dále a seznámit se s aktivitami nově založených společností - abyste vytvořili nejjasnější obraz o obchodní činnosti jejích účastníků.

Kromě toho lze dodatečně získaná data o zakladatelích a ředitelích analyzovat z různých úhlů pohledu. Pokud jsou například jména v seznamu osob stejná, jde pravděpodobně o rodinnou společnost. Pokud se setkáte se jmény zahraničních osob, je možné, že společnost má kontakty se zahraničními partnery nebo mateřskými organizacemi.

Firemní adresy a telefony

Potřebu kontaktních údajů je těžké přeceňovat. Plní svou hlavní roli: poskytují příležitost kontaktovat organizaci nebo její jednotlivé zaměstnance. Někdy však má smysl se dotazovat na adresu a telefonní čísla organizace.

Stává se, že několik právnických osob může být umístěno na stejné adrese společnosti. Často se jedná o dceřiné společnosti i třetí strany. Navíc se k registraci na stejnou adresu často uchylují bezohledné organizace, které nemají prostředky k pronájmu plnohodnotné kanceláře. Poté se za určitých podmínek zakoupí adresa sídla, ale ve skutečnosti se společnost na zadané adrese nenachází.

Na žádost asistenta manažera se telefonní číslo společnosti může objevit v různých „odpovědích“ vyhledávače. Výsledky je nutné pečlivě přečíst, abyste pochopili, zda obsahují informace, například o zařazení telefonního čísla do černých seznamů zaměstnavatelů atd.

Adresa oficiální webové stránky podniku

Adresa oficiálního webu společnosti je velmi informativní zdroj:

  • pokud organizace nemá webovou stránku, pak společnost pravděpodobně nemá prostředky na její vytvoření, nebo byla vytvořena relativně nedávno;
  • záleží na množství informací poskytovaných společností: přítomnost nebo nepřítomnost údajů o manažerech, zaměstnancích, novinkách, informacích o partnerech nebo zákaznících atd .;
  • datum vytvoření webu a jeho rozhraní označuje, kdy byl web vytvořen a jak profesionální byl, technicky i po stránce designu;
  • přítomnost nebo nepřítomnost kontaktních údajů (viz výše);
  • doménová adresa webové stránky obsahuje další informace, s nimiž je možné další ověření

Velikost základního kapitálu společnosti

Velikost charterového kapitálu organizace má velký význam. Existuje minimální výše základního kapitálu a mnoho společností je při registraci omezeno na něj. Pokud však společnost dodává vaší společnosti produkty nebo poskytuje služby v řádu desítek či stokrát vyšších částek, než je její schválený kapitál, je třeba si uvědomit, že v případě nekalé práce nebo dodání obdrží vaše organizace pouze to, co je ve fondu společnosti

Dluhy vůči daňovým úřadům

Údaje o neexistenci dluhu jsou pouze plusem a hovoří o společnosti jako o svědomitém daňovém poplatníkovi. Je však třeba vzít v úvahu přítomnost dluhů vůči daňovým úřadům, jakož i velikost těchto dluhů.

Při podávání žádosti o zaměstnání bude užitečné vědět, zda má společnost dluhy vůči penzijnímu fondu.

Když společnost spolupracuje jako protistrana nebo partner, mohou se dluhy stát indikátorem jejího neférového obchodního přístupu nebo nerentabilní pozice.

Účast na soudním řízení

Informace o účasti v soudním řízení jsou důležité, je však nutné se seznámit s jejich obsahem. Jedna věc je nezaplacení pokuty za nesprávné parkování služebního automobilu, další jsou pracovní spory nebo jiné závažné případy. Je také důležité zvážit, zda společnost vystupovala jako žalobce nebo žalovaný.

Diskvalifikace úředníka

Stává se, že úředníci organizací, ať už jsou to manažeři nebo jiní úředníci, jsou diskvalifikováni u soudu v souladu se zákonem. Tyto informace budou užitečné při analýze nových partnerských společností nebo při podávání žádosti o zaměstnání. To je zvláště důležité pro asistenta manažera, jehož práce přímo souvisí s profesionální činností šéfů.

Adresa e-mailem kontaktní osoba

E-mailovou adresu organizace nebo jejího zaměstnance lze posoudit podle její „solidnosti“. V moderních organizacích se zpravidla používá firemní emailová adresahostované na jejich doménách (adresa domény za znakem @), pro účely zabezpečení informací a indikátor určité podnikové kultury. Pokud je adresa společnosti na veřejném serveru, například mail.ru nebo yandex.ru, má smysl ji dodatečně zkontrolovat zadáním dotazu na adrese do vyhledávacího pole. Na základě výsledků vyhledávání můžete analyzovat, ve kterých článcích byla adresa použita, ve kterých reklamách byla uvedena a zda byla zahrnuta do černých listin uživatelů

Telefonní číslo

Podle čísla mobilního telefonu můžete zjistit, zda patří konkrétní společnosti - zda se ve výsledcích vyhledávání zobrazuje v reklamách jménem právnická osoba... Kromě toho jej lze zaznamenat na stránkách soukromých reklam - bude užitečné seznámit se s jejich obsahem. Je třeba věnovat pozornost tomu, zda je zahrnut v jakýchkoli černých seznamech uživatelů a zda k němu existují nějaké komentáře.

Kromě toho můžete podle čísla mobilního telefonu zjistit jeho příslušnost k určitému telefonnímu operátorovi a regionu.

Osobní data

Pro účely charakterizace osobnosti budoucího vedoucího, nových kolegů nebo těch, s nimiž se asistent manažera protíná na současném pracovišti, jsou osobní údaje často užitečné. Rodinný stav, fotografie, koníčky, komunikační styl, okruh přátel, zájmy - to vše je často k dispozici na sociálních sítích. Nedoporučuje se ztrácet čas hledáním těchto informací z nečinného zájmu, ale pro další charakteristiky člověk sociální sítě může poskytnout osobnímu asistentovi různé údaje: pozitivně i negativně charakterizující osobu

Recenze zaměstnanců, seznamy zaměstnavatelů

Zpětná vazba od bývalých zaměstnanců organizací i těch, kteří se účastnili rozhovorů vedených organizací, je důležitá, pokud asistent manažera plánuje vykonávat své profesionální činnosti v organizaci. Je třeba poznamenat, že vždy existují „urazení“ a „nespokojení“, nedoporučuje se vyvodit závěry pouze na základě zpětné vazby a komentářů jednotlivců. Je však nutné je zohlednit a porovnat s ostatními údaji o společnosti.

Kromě toho existují oficiální zdroje, které pravidelně zveřejňují seznamy nejlepších i bezohledných zaměstnavatelů.

Na internetu existuje mnoho zdrojů, které uživatelům nabízejí informace o vaší organizaci. Zároveň existují ty, o nichž jsou volně dostupné informace, a také komerční stránky. Často placené webové stránky nabízejí bezplatné poskytnutí údajů, které najdete na jiné stránce. Udělejte si čas na zaplacení prvních informací, které narazíte, pečlivě prostudujte dostupné zdroje, vč. důvěryhodné zdroje - oficiální stránky různých služeb, než se uchýlíte k placenému požadavku.

Pro referenci.Údaje o společnostech publikované na referenčních zdrojích se zpravidla získávají z otevřených zdrojů (USRLE a Rosstat) a nepodléhají federálnímu zákonu č. 152-FZ ze dne 27. července 2006 „O osobních údajích“ (ve znění ze dne 21. července 2014). podle čl. 6 federálního zákona ze dne 8. 8. 2001 č. 129-FZ „dne státní registrace právnické osoby a fyzické osoby podnikající “(ve znění ze dne 30. 3. 2015; ve znění ze dne 18. 5. 2015).

  • www.egrul.nalog.ru . Oficiální web Federální daňové služby poskytne asistentovi manažera bezplatné informace zveřejněné v souladu se zákonem a nikoli důvěrné. Tento prostředek umožňuje získat data o několika položkách uvedených v tabulce najednou.

Požadované počáteční údaje pro vyhledávání: název právnické osoby nebo jednotlivého podnikatele, OGRN nebo TIN (obr. 3).

V tomto případě vyhledáváme podle názvu právnické osoby. Není nutné zadávat region, ve kterém se nacházíte, ale pokud máte tyto informace, doporučujeme je zadat, abyste získali co nejúplnější výsledky hledání. Po zadání údajů stiskněte tlačítko Najít a dostaneme výsledek (obr. 4).

Vyhledávání na webových stránkách Federální daňové služby ukazuje výsledky ve formátu pdf. Dokumenty jsou k dispozici ke stažení a obsahují úplné informace o registraci společnosti: informace o zakladatelích, manažerech, datu registrace, registrovaných aktivitách, údaje o adrese atd. (Obr. 5).

Zdroj daňové služby je také vhodný v tom, že poskytuje možnost prohledávat další databáze, které lze zdarma použít kliknutím na požadovaný odkaz a zadáním počátečních údajů požadovaných pro požadavek. Asistent manažera může snadno najít informace o diskvalifikovaných osobách, právnických osobách, které mají daňové nedoplatky, a další užitečné údaje.

Stojí za zmínku, že možná budete muset hledat dodatečné informacenapříklad k vyhledání dluhů - DIČ daňového poplatníka (obr.6). Pokud původně nebylo DIČ známé, lze jej zobrazit v informacích o registraci právnických osob získaných z výsledků vyhledávání podle názvu společnosti.

Známky společností fly-by-night

Načítání
z Veřejných kritérií pro sebehodnocení rizik pro daňové poplatníky, používaných daňovými úřady v procesu výběru objektů pro provádění daňových kontrol v terénu,
schváleno usnesením Federální daňové služby Ruska ze dne 30. května 2007 č. MM-3-06 / [chráněno e-mailem]
„Po schválení Koncepce plánovacího systému pro daňové kontroly v terénu“

(ve znění revize 10. 5. 2012)

[...] Při hodnocení daňových rizik, která mohou souviset s povahou vztahů s některými protistranami, se daňovému poplatníkovi doporučuje prozkoumat následující ukazatele:

Nedostatek osobních kontaktů mezi vedením (oprávněnými úředníky) dodavatelské společnosti a vedením (oprávněnými úředníky) kupující společnosti při projednávání dodacích podmínek a při podpisu smluv;

Nedostatek listinných důkazů o pravomocích vedoucího protistrany, kopie jeho dokladu totožnosti;

Nedostatek listinných důkazů o autoritě zástupce protistrany, kopie dokladu prokazujícího jeho totožnost;

Nedostatek informací o skutečném umístění protistrany, stejně jako o umístění skladu a / nebo výrobních a / nebo maloobchodních prostor;

Nedostatek informací o způsobu získávání informací o protistraně (žádná reklama v médiích, žádná doporučení od partnerů nebo jiných osob, žádný web protistrany atd.). V tomto případě se negativita tohoto znamení zhoršuje přítomností dostupné informace (například v médiích, venkovní reklamě, internetových stránkách atd.) o dalších účastnících trhu (včetně výrobců) stejného (podobného) zboží (díla, služby), včetně těch, kteří nabízejí své zboží (díla, služby) za nižší ceny;

Nedostatek informací o státní registraci protistrany v jednotném státním registru právnických osob ( obecný přístup, oficiální web Federální daňové služby Ruska www.nalog.ru).

Přítomnost těchto znaků naznačuje vysokou míru rizika kvalifikace takové protistrany ze strany daňových úřadů jako problematické (neboli „jednodenní“) a transakce s takovou protistranou jsou pochybné.

Taková rizika navíc zvyšují současnou přítomnost následujících okolností:

Protistrana s výše uvedenými charakteristikami jedná jako prostředník;

Existence podmínek, které se liší od stávajících pravidel (zvyků) obchodního obratu (například dlouhá zpoždění plateb, dodání velkých zásilek zboží bez platby předem nebo záruky platby, srovnatelné s důsledky porušení smluv smluvními stranami sankcemi, vyrovnáním prostřednictvím třetích stran, vyrovnáním ve směnkách atd.) P.);

Nedostatek zjevných důkazů (například kopie dokumentů potvrzujících, že protistrana má výrobní kapacity, potřebné licence, kvalifikovaný personál, majetek atd.), Možnost skutečného plnění podmínek smlouvy protistranou, jakož i existence důvodných pochybností o možnosti, aby protistrana podmínky smlouvy skutečně plnila, s přihlédnutím k čas potřebný k dodání nebo výrobě zboží, provedení práce nebo poskytnutí služeb;

Nákup prostřednictvím zprostředkovatelů zboží, jejichž výrobu a pořizování tradičně provádějí jednotlivci, kteří nejsou podnikateli (zemědělské produkty, druhotné suroviny (včetně kovového šrotu), průmyslové výrobky atd.);

Nedostatek skutečných kroků plátce (nebo jeho protistrany) k inkasu dluhu. Růst dluhu plátce (nebo jeho protistrany) na pozadí pokračování dodávek velkých zásilek zboží nebo významného objemu prací (služeb) dlužníkovi;

Vydávání, nákup / prodej směnek protistranami, jejichž likvidita není zřejmá nebo není zkoumána, stejně jako vydávání / přijímání půjček bez zajištění. Negativnost této funkce se zároveň prohlubuje absencí podmínek pro úroky z dluhových obligací jakéhokoli druhu a splatnost těchto dluhových obligací je více než tři roky;

Významná část nákladů transakce s „problémovými“ protistranami na celkových nákladech daňového poplatníka, přičemž pro proveditelnost takové transakce neexistuje žádné ekonomické opodstatnění, ani její realizace nemá žádný pozitivní ekonomický účinek atd.

Jak zkontrolovat „realitu“ společnosti protistrany?

  1. Používejte elektronické služby na webu Federální daňové služby Ruska(http://www.nalog.ru/):
  • « Informace o osobách, u nichž je u soudu prokázána (potvrzena) skutečnost nemožnosti účasti (vedení) v organizaci “(https://service.nalog.ru/svl.do). Podle OGRN nebo TIN organizace můžete zjistit, zda osoba, která je podle Jednotného státního rejstříku právnických osob vedoucím nebo zakladatelem organizace, prohlásila, že s tím nemá nic společného;
  • « Informace zveřejněné v časopise „Státní registrační bulletin“ o rozhodnutích registračních orgánů o nadcházejícím vyloučení neaktivních právnických osob z jednotného státního rejstříku právnických osob (http://www.vestnik-gosreg.ru/publ/fz83/). Daňové orgány mohou učinit takové rozhodnutí, pokud společnost nepodala daňové zprávy a neprovedla v průběhu roku transakce alespoň na jednom bankovním účtu. Vyloučení společnosti ze Sjednoceného státního rejstříku právnických osob se rovná její likvidaci, což znamená, že nemůže uzavírat a plnit smlouvy.

Naše rada: tiskněte nebo ukládejte na své webové stránky (snímky obrazovky) počítače informace o společnosti. Pomůže to dále prokázat, že jste provedli ověření.

  1. Vyžádejte si ověřené kopie následujících dokumentů:
  • listina organizace;
  • osvědčení o státní registraci organizace;
  • osvědčení o registraci organizace u daňového úřadu v místě jejího sídla;
  • rozhodnutí o volbě (jmenování) vedoucího organizace;
  • pasy vedoucího organizace (str. 2, 3);

Mimochodem: Platnost pasu lze zkontrolovat podle jeho série a čísla pomocí služby „Kontrola seznamu neplatných ruských pasů“ na webu FMS Ruska ( http://services.fms.gov.ru/info-service.htm?sid\u003d2000).

  • licence, pokud je transakce s organizací uzavřena v rámci licencované činnosti. Kromě toho lze informace o licencích vydaných společnosti zkontrolovat na webových stránkách licenčních úřadů;
  • účetní výkazy za rok předcházející roku transakce. Účetní údaje organizace za jakékoli období lze také bezplatně získat z Rosstatu (za předpokladu, že společnost předloží účetní záznamy statistickým úřadům). Chcete-li to provést, musíte ve schválené formě zaslat žádost jakékoli územní agentuře Rosstat.

Výsledky kontroly mohou být vydány ve formě certifikátu a předloženy vedoucímu.

Videonávody ke kontrole protistrany - na webuhttp://egrul.nalog.ru/.

  • www. fssprus. ru . Oficiální stránka Federální služba soudní vykonavatelé v Rusku poskytují uživatelům příležitost seznámit se s bankou donucovacích řízení a provést vyhledávání pomocí jednoduchého formuláře (http://fssprus.ru/iss/ip/) (obr.7).

Databáze obsahuje informace o právnických a fyzických osobách. Pro provedení prohlídky je nutné zadat údaje o fyzické osobě, právnické osobě nebo na samostatné záložce vyhledávacího formuláře - počet exekučních řízení, pokud jsou známy (obr.8).

Poznámka!Na rozdíl od webových stránek Federální daňové služby je zavádění údajů o územních orgánech na webových stránkách FSSP povinné.

Pokud má společnost nebo jednotlivec nějaké dluhy a bylo proti nim zahájeno exekuční řízení, obdrží ve výsledcích vyhledávání asistent manažera následující údaje: celé jméno společnosti a adresu místa, číslo a datum zahájení exekučního řízení, podrobnosti výkonného dokumentu a zbývající částku dluh. V příkladu byla některá data tabulky odstraněna, ale sloupce jsou zachovány pro přehlednost zobrazení výsledků hledání.

  • www. rusprofil. ru . Projekt RusProfile je referenční systém pro společnosti, který lze použít k rychlému vyhledání organizace, kontaktních údajů a registračních údajů.

V části „Společnosti“ zadejte název společnosti a zobrazte výsledky hledání (obr. 9).

Internet poskytuje neomezený přístup k informačním zdrojům, a to jak v oblasti právní vědy, tak v oblasti praktické tvorby právních předpisů. Vyhledávače výrazně usnadňují hledání potřebných informací, veškerých dat, článků, monografií a programů. Internetové zdroje se stávají účinným prostředkem k získávání nových poznatků a také poskytují přístup k elektronickým verzím nejen právních časopisů a novin, ale také k celé řadě právní literatury dostupné ve bezplatné i placené formě.

Téměř každý právník se může v právních problémech vyzkoušet jako „vzdálený konzultant“. K tomu není nutné vytvářet osobní webovou stránku, stačí se stát členem jednoho ze stávajících internetových projektů. Například na ruském internetu je velmi populární tzv. „Virtual Legal Advice“ (www.uristy.ru). Práce na této konzultaci se může účastnit každý odborník s právnickým vzděláním, stačí se zaregistrovat do systému.

Je však třeba poznamenat, že dostupnost a snadnost zveřejňování informací, stejně jako téměř úplná nezávislost serverů na sobě navzájem na internetu, změnily globální úspěch v chaos. Proto je z roku na rok stále naléhavější problém s hledáním potřebných informací na internetu. To je obzvláště důležité v podmínkách omezeného času a v případě, kdy musí být rozhodnutí založeno na konkrétním dokumentu.

Nejjednodušší způsob, jak něco najít, je zadat klíčová slova přímo do adresního řádku prohlížeče. Hledání probíhá v systému Microsoft WSN Search.

Obr. 18 Vyhledávací systém WSN

Dalším způsobem vyhledávání je použití tlačítka Hledat na liště prohlížeče. Při použití tohoto tlačítka je okno rozděleno na dvě části. Vlevo je řádek pro zadávání klíčových slov, seznam nalezených stránek a vpravo můžete prohlížet vybrané stránky. Pomocí tlačítka můžete použít jiný vyhledávač Naladit v panelu Vyhledávání.

Internetové vyhledávače:

Vyhledávače lze rozdělit do následujících skupin:

    hledat adresáře

    vyhledávače nebo indexy vyhledávání

Prohledat adresáře.

Adresáře zdrojů - globální, místní, specializované - jsou webové databáze s adresami prostředků. Tyto databáze mohou obsahovat různá množství nahromaděných informací. Obvykle jsou hierarchické.

Vyhledávací adresáře jsou organizovány stejným způsobem jako tematické adresáře velkých knihoven. S odkazem na adresu vyhledávaného adresáře najdeme na jeho hlavní stránce seznam kategorií předmětů, například „Jurisprudence“, „Vzdělání“, „Sport“ atd.

Každá položka v seznamu kategorií je hypertextový odkaz. Kliknutím na něj se otevře další stránka vyhledávacího adresáře, kde je vybrané téma prezentováno podrobněji. Jak se budete ponořovat do tohoto tématu, můžete přejít na seznam konkrétních webových stránek a vybrat zdroj, který je nejvhodnější pro řešení vašeho problému. Můžete také použít tlačítko Hledat ve vyhledávacím adresáři k upřesnění vyhledávání stránek, které potřebujete.

Vyhledávací adresáře vytvářejí většinou ručně vysoce vyškolení redaktoři, kteří procházejí WWW, vybírají, co je podle nich ve veřejném zájmu, a katalogizují adresy.

Yahoo (www.yahoo.com) -uznáván jako nejpopulárnější katalog na světě. Hledání v ruštině je možné.

Ruské katalogy:

« Seznam. Ru» (www. seznam. ru),

„Constellation Internet“ (www. hvězdy. ru),

„Rusko v síti“ (www.ru) jiný.

Úvod. - 4

1. Systém vyhledávání informací. - Pět

1.1. Dokumentární IPS. - 6

1.2. Faktorografický IPS. - osm

2. Vyhledávač globální sítě „Internet“. - devět

2.1. Jak fungují vyhledávače. - devět

2.2. Vyhledávací technologie. - čtrnáct

3. Vyhledávače globálního internetu. - 18

3.1. Jak hledat na internetu - 18

3.2. Prohledat adresáře. - 21

3.3. Hledat ukazatele. - 23

4. Srovnávací charakteristiky dvou vyhledávačů

systémy založené na Rambler.ru a Yandex.ru. - 29

4.1. Rambler.ru - 29

4.2. Yandex.ru. - 35

Závěr. - 40

Literatura. - 42

Aplikace. - 43

Úvod


Internet výrazně zjednodušil život moderní společnosti, globalizoval jej, zvýšil schopnosti některých lidí a snížil schopnosti ostatních. Dnes je mnohem pohodlnější a výhodnější používat poštovní služby přes internet (například dopis z Tobolska do Londýna dorazí za 5 sekund).

Podle mých pozorování se internet stal zdrojem podnikání, zdrojem světové kultury, zdrojem vzdělání, hromadnými sdělovacími prostředky.

Dnes může každý uživatel na internetu získat přístup ke všem světovým burzám a muzeím za pár sekund. Každý uživatel může získat vzdělání prostřednictvím internetu, seznámit se s předními světovými elektronickými novinami.

Informace se staly virtuálním zlatem naší doby a on bude dosahovat stále rychlejšího a většího úspěchu, kdo ji může získat rychleji. A bez ohledu na to, kdo jste, podnikatel, který hledá nový prodejní trh, nebo student, který hledá materiály pro práci v kurzu, jak potřebují informace, tak jim je může poskytnout internet, pokud mají dostatek znalostí, aby se jich zúčastnili.

Vypsat výhody internetu pro občany Země by mi trvalo dlouho, ale obávám se, že to brzy nedokončím.

Chci si všimnout hlavní věci na internetu, jejího určitého „základního kamene“, jsou to informace a jejich hlavní vlastnosti:

1) Široká dostupnost

2) Rychlost

Nezkušení uživatelé mají mýtus, že internet má všechno. Moje zkušenost s internetem ve skutečnosti prokázala, že tomu tak není. Materiály pro zveřejňování na webu připravují skuteční lidé, a proto zde najdete pouze to, co považovali za nezbytné (ve smyslu toho, že jsou pro sebe užitečné nebo prospěšné), aby je mohli publikovat. Řeka je však napájena potoky a díky jejich kreativitě jsou dnes na internetu asi dvě miliardy webových stránek. Výsledkem je, že katalogizace zdrojů dostupných na webu se stala vážným problémem. Navzdory skutečnosti, že se jím zabývají tisíce organizací, problém se nejen nepřibližuje k řešení, ale také se stává akutnějším. Procento katalogizovaných (nebo indexovaných) zdrojů neustále klesá. V posledních dvou letech se tento pokles stal katastrofickým. Pokud se tedy v roce 2000 procento indexovaných zdrojů přiblížilo k 40%, pak za pouhý jeden příští rok kleslo na 25%. Stánek s jídlem je jednoduchý: webový prostor se zaplňuje rychleji, než je organizován. Internetoví odborníci bohužel nemají důvod se domnívat, že se v blízké budoucnosti může něco změnit k lepšímu. Výsledkem je, že hledání informací v síti WWW lze považovat za nejtěžší úkol na internetu.

V souvislosti s výše uvedeným je vysoce kvalitní vyhledávání informací na internetu jedním z nejnaléhavějších témat naší doby, tento problém se mě dotkl vícekrát.

Téma mé seminární práce mě zaujalo svou originalitou a novostí a chci se ji pokusit odhalit. Mým úkolem bude kvalitní organizace vyhledávání informací na internetu.

1. Systém vyhledávání informací


Než se dostaneme ke konkrétním vyhledávacím mechanismům v globálním internetu, je nutné analyzovat teoretické základy takových otázek jako „co jsou informace?“, „Informační procesy?“, „Systém vyhledávání informací a jeho typy?“

Neexistuje jednoznačná odpověď, že takové informace nejsou, můžete uvést pouze některé z vlastností charakterizujících tento výraz:

" Informace - jsou informace, které jsou předmětem ukládání; toto je obsah zprávy, signálu, paměti a také informace obsažené ve zprávě, signálu, paměti. “

Procesy přenosu, uchovávání a zpracování informací hrály v životě společnosti vždy důležitou roli. Lidé si vyměňují ústní zprávy, poznámky, zprávy. Předávají si navzájem žádosti, objednávky, zprávy o provedené práci, soupis majetku; vydávat reklamy a vědecké články; uschovejte staré dopisy a dokumenty; Dlouho uvažují o přijatých zprávách nebo okamžitě spěchají, aby se řídili pokyny svých nadřízených. To vše jsou informační procesy. Informace jsou vždy spojeny s nosičem materiálu a jeho přenosem - s náklady na energii. Stejné informace však mohou být uloženy v jiné hmotné formě (na papíře, ve formě foto-negativu, na magnetické páske ...) a přenášeny s různými náklady na energii (poštou, telefonem, kurýrem atd.), důsledky přenášených informací - včetně závažných - navíc vůbec nezávisí na fyzických nákladech na jejich přenos. Například lehké stisknutí tlačítka spustí těžkou divadelní oponu nebo vyhodí do vzduchu velkou budovu, červený semafor zastaví vlak a neočekávané špatné zprávy mohou způsobit infarkt. Informační procesy proto nelze redukovat na fyzické a informace spolu s hmotou a energií jsou jednou ze základních entit světa kolem nás. Ve 20. století. s rozvojem technologie se objevila nová zařízení: komunikační prostředky, automatizační zařízení a od 40. let. - počítačová technologie. Ukázalo se, že je nemožné popsat efektivitu jejich práce pomocí fyzikálních konceptů a že základní charakteristiky těchto zařízení je třeba popsat zcela odlišně. Ve výsledku se poprvé objevil přesný pojem informace a matematická teorie informace. Ukázalo se, že komunikační prostředky, bez ohledu na to, jaké fyzické procesy používají, jsou prostředky pro přenos informací. Sjednocení pojmů „informace“ a „management“ vedlo ve 40. letech N. Wienera. k vytvoření kybernetiky, která zejména poprvé naznačila shodnost informačních procesů v technologii, společnosti a živých organismech.

Využití pojmu informace mělo významný dopad na vývoj moderní biologie, zejména jejích oborů, jako je neurofyziologie a genetika. A nakonec v souvislosti s rozvojem výpočetní techniky, který stimuloval informatizaci celé společnosti, vznikl komplex věd o různých aspektech práce s informacemi - informatikou.

" Systém vyhledávání informací je systém, ve kterém je uloženo informační pole, ze kterého jsou podle požadavků uživatele vydávány potřebné informace. “

Hledání informací na žádost uživatele se provádí buď automaticky, nebo ručně (jako v knihovnách, když čtenář požádá o zaměstnance referenčního fondu a zaměstnanec použije katalogový systém). V druhém případě se používají počítače vybavené speciálním softwarem, který analyzuje procesy požadavků, vyhledává a vydává potřebné dokumenty. Systémy pro získávání informací (ISS) tedy implementují vztah otázek a odpovědí, který přibližuje úkoly, jimž čelí tvůrci těchto systémů, těm, které řeší tvůrci systémů člověk-stroj.

Systémy pro vyhledávání informací se dělí na dva typy:

1. Dokumentární IPS.

2. Faktorografický IRS.

1.1 Dokumentární IRS


Na takové ISS jsou všechny uložené dokumenty nějakým zvláštním způsobem indexovány. Každému dokumentu (článku, zprávě, protokolu atd.) Je přiřazen individuální kód, který tvoří vyhledávací obrázek dokumentu. Hledání neprobíhá podle samotných dokumentů, ale podle jejich vyhledávacích obrázků, které obsahují informace (adresu) o umístění dokumentu. Takto hledají knihy na objednávku čtenáře ve velkých knihovnách (v malých knihovnách si knihy obvykle vyhledává sám). Na žádost čtenáře nejprve najdou kartu v katalogu a poté podle kódu, který je na ní uveden, je nalezena samotná kniha.

Rozdíly mezi dokumentárním IRS jsou určeny podle toho, jak je uspořádán vyhledávací obrázek dokumentu. V nejjednodušším případě se jedná pouze o jeho samostatný název (například název, autor, rok vydání knihy). Ve složitějších případech neexistuje žádná osobní korespondence mezi prohledávaným obrázkem dokumentu a samotným dokumentem. Je docela možné, že vyhledávací obrázek dokumentu odpovídá několika různým dokumentům a naopak stejný dokument neodpovídá jednomu, ale několika vyhledávacím obrázkům.


Tuto nejednoznačnost mají například vyhledávání obrázků dokumentů v systémech deskriptorů. „Deskriptor je slovo nebo slovní spojení, které úzce souvisí s obsahem dokumentu. Soubor deskriptorů definuje skupinu dokumentů s podobným obsahem.“ V v poslední době časopisy vydávající vědecké články vyžadují, aby jejich autoři u každého článku uvedli seznam klíčových slov, která hrají roli deskriptorů. Pokud například popisujete článek, který čtete, pomocí klíčových slov, pak bude jeden z možných seznamů následující: vyhledávání informací, systém vyhledávání informací, deskriptor, tezaurus, obrázek načítání dokumentů.

Díky sadě těchto klíčových slov (sada deskriptorů) najdete tento článek mezi všemi články knihy, pokud zadáte jeho obsah článek po článku do libovolného ISS typu deskriptoru.

Obecné blokové schéma ISP typu deskriptoru je znázorněno na obr. Tento obvod má dva vstupy. Jeden po druhém se doplňuje informační pole dokumentů uložených v systému a druhý se používá k přijímání požadavků uživatelů.

1.2 Faktické IRS

Na rozdíl od IRS v dokumentech IRS tohoto typu neukládá dokumenty, ale fakta týkající se jakékoli oblasti předmětu. Uložená fakta lze extrahovat z různých dokumentů. Například je nutné přepracovat historii osmnáctého století v databázi faktů, jsou navzájem propojeny systémem různých vztahů. Taková síť v ISS se nazývá doménový tezaurus. Žádosti přicházející do faktického IRS používají tezaurus k hledání odpovědí na požadavky. Hledání se provádí metodou vyhledávání podle modelu široce používaného ve znalostních základnách systémů umělé inteligence.

Například je nutné přepracovat historii osmnáctého století, shromáždit všechny informace o Kateřině II.

IRS věcného typu se ve své organizaci a fungování postupně přibližují k rozvinutým databázím a znalostem.

2. Vyhledávač globální sítě „Internet“.


Nechci se dostat do džungle vnitřního fungování vyhledávače (na elektronické úrovni), protože to nesplňuje cíle mé práce a podle mého názoru se jedná o práci špičkových programátorů, o kterou se nyní snažím.

Chci rozebrat a roztřídit „police“, jak jsem pochopil technologii získávání informací a mechanismus samotného získávání informací.

2.1 Technologie získávání informací na internetu


Samotná vyhledávací technologie je na obrázku 2 jasnější.

1) Nejprve uživatel vyřeší problém, který chce najít a kde může být.

2) Poté přejde na internet, do obvyklého okna Internet Exploer (Prohlížeč) (obr. 3). Pokud uživatel zná název webu, na kterém se nachází zajímavá informace, jednoduše uvede své jméno a zadá jej.

Příklad. Uživatel chce znát distribuci filmu pro dnešek a přejde na web film.ru. (obr. 3).

Jedná se o nejprimitivnější způsob vyhledávání informací na internetu a hledání by tím mohlo skončit.

informace o filmu, který byl již dlouho přerušen, například najděte film „Brother-2“, stačí v okně



Hledání se provádí automaticky na základě počtu slov nalezených na serveru. První skupina nalezených odkazů s nejlepšími indikátory podle počtu nalezených výskytů hledaných slov bude přenesena do jeho počítače.

Spolu s odkazem lze často zobrazit stručné informace o dokumentu. Pokud mezi nalezenými dokumenty nejsou žádné potřebné dokumenty, můžete zobrazit následující skupinu - celkový počet dokumentů je obvykle v tisících. Chcete-li přejít na server, na kterém se nacházejí nalezené informace, jednoduše klikněte na odkaz ve výsledku hledání.

Jedná se o nejprimitivnější způsob vyhledávání informací na internetu a hledání by tím mohlo skončit.

Existují také vnitřní (místní) vyhledávací systémy.

Příklad. Ve stejném filmu.ru existuje příležitost prohlédnout si

informace o filmu dlouho mimo pokladnu,

například v okně najděte film „Brother-2“

hledání zadejte slovo Brother-2. (obr. 3)

3) Pokud uživatel nezná název webu, kde může najít informace, které ho zajímají, uchýlí se k pomoci nějakého vyhledávače. Existuje značné množství systémy nápovědy... Po zadání zadaného serveru obdrží na obrazovce formulář žádosti, ve kterém musí zadat informace pro vyhledávání. Formulář má obvykle možnost omezit oblast hledání (například podle předmětu). Může zadat požadovaný termín, definovat oblast hledání a pokusit se získat odpověď.

Hledání se provádí automaticky na základě počtu slov nalezených na serveru. První skupina nalezených odkazů s nejlepšími indikátory podle počtu nalezených výskytů hledaných slov bude přenesena do jeho počítače. Spolu s odkazem lze často zobrazit stručné informace o dokumentu. Pokud mezi nalezenými dokumenty nejsou žádné potřebné dokumenty, můžete zobrazit následující skupinu - celkový počet dokumentů je obvykle v tisících. Chcete-li přejít na server, kde se nacházejí nalezené informace, stačí kliknout na odkaz ve výsledku hledání.

Hledání dvojice klíčových slov obvykle vede k desítkám tisíc odkazů na dokumenty obsahující tyto výrazy. Takový objem výsledků vám zřídka umožní efektivně najít „klenot“ mezi nesouvisejícími materiály. Co můžete poradit?

Nejprve musí uživatel zúžit oblast vyhledávání. Pokuste se na serverech určit, který profil, ve které zemi atd. s největší pravděpodobností najdete zajímavé materiály. Zamyslete se nad tím, jaká další klíčová slova mohou charakterizovat hledané objekty, použijte několik klíčových slov.

Pokud je vyhledávacím objektem zadáno několik výrazů, vyhledávač vyhledá výskyt každého slova v dokumentu samostatně. To znamená, že v důsledku hledání můžete získat dokument, který obsahuje pouze jedno slovo, ale několikrát. Proto je při definování podmínek, kterými se vyhledávání provádí, možné a nutné použít logické operace.

Například zadáním word_1 a word_2 budete nuceni hledat ty stránky, kde jsou použity první i druhý výraz.

Zadruhé musíte provést vyhledávání na všech známých vyhledávačích. Každý z nich používá vlastní, mírně odlišnou vyhledávací technologii. Absolutně podobné vyhledávání proto může vést k různým výsledkům. Většina vyhledávačů je zdarma, takže vám nic nebrání v provedení tolik vyhledávání, kolik potřebujete.

Zatřetí, výsledek může často přinést vyhledávání dokumentů na základě možných odkazů na ně.

Uživatel by se měl pokusit určit, které dobře známé dokumenty mohou obsahovat odkazy na jeho témata. A již prostřednictvím hypertextových odkazů v dokumentech k dosažení požadovaného zdroje. Tato cesta je často efektivní. Zkuste najít organizace (WWW servery), které mají profil podobný předmětu vašeho hledání. Někdy můžete prostřednictvím odkazů v dokumentech těchto serverů přejít na potřebné materiály.

Začtvrté, zkuste najít konferenci na podobná témata, tj. prostě jdi na nějaký CHAT. Například na www.anekdotov.net.ru. Otázka „hodená“ na telekonferenci často poskytne dostatek základních informací.

Nakonec se nezapomeňte zeptat svých přátel. Mohou navrhnout neočekávané řešení.

V každém případě se musíte naladit na to, že vyhledávání může trvat poměrně dlouho a vyžaduje od něj velké úsilí.

Příklad. Uživatel zadá vyhledávač Yandex.ru a do vyhledávacího okna zadá slovo Brother-2, poté se vyhledá vše, co lze nějak spojit s tímto slovem. Yandex doporučí odkazovat na mnoho webů, včetně film.ru a přímo na web o filmu samotném. (obr. 4)

2.2 Jak fungují vyhledávače

Vyhledávač obvykle hledá informace, které potřebujete, ve třech fázích:

I) Fáze: Robot (agent, pavouk nebo prohledávač) cestuje po webu a shromažďuje informace.

II) Fáze: Všechny informace shromážděné roboty vstupují do databáze ve formě odkazů - jsou indexovány.

III) Fáze: Spustí se vyhledávač, který uživatelé používají jako rozhraní pro interakci s databází. ty. databáze vydávala hypertextové odkazy a poté uživatel běžně prohledává potřebné odkazy.

Tyto fáze jsou jasně vyjádřeny v práci vývojového diagramu (obr. 2)

První dva jsou přípravné a pro uživatele neviditelné.

Zvažme podrobněji fáze vyhledávání informací

Vyhledávač:

I) Fáze. Vyhledávač shromažďuje informace z webu. Pro toto použití speciální programypodobné prohlížečům. Jsou schopni zkopírovat danou webovou stránku na indexovací server vyhledávání, zobrazit ji, najít všechny hypertextové odkazy, které obsahuje, přejít na adresy URL v nich uvedené, zkopírovat zdroje, které se tam nacházejí, znovu vyhledat hypertextové odkazy v nich atd. atd. Jedná se o speciální programy, jako jsou agenti, pavouci, prohledávače a roboti, kteří vyhledávají stránky na webu, extrahují hypertextové odkazy na těchto stránkách a automaticky indexují informace, které najdou, aby vytvořili databázi. Každý vyhledávač má vlastní sadu pravidel, kterými se řídí shromažďování dokumentů. Někteří sledují každý odkaz na každé stránce, kterou najdou, a pak zase prozkoumají každý odkaz na každé nové stránce atd. Někteří lidé ignorují odkazy, které vedou ke grafice, zvukovým souborům, animacím; ostatní jsou instruováni, aby nejdříve procházeli nejoblíbenější stránky.

Agenti - nejinteligentnější vyhledávací nástroje. Mohou dělat víc než jen hledat: mohou zanechat zprávu o vaší návštěvě webu. Již mohou vyhledávat weby s konkrétním tématem a vracet seznamy webů seřazené podle jejich účasti. Agenti mohou zpracovávat obsah dokumentů, vyhledávat a indexovat další typy zdrojů, nejen stránky. Lze je také naprogramovat tak, aby získávaly informace z již existujících databází. Bez ohledu na informace, které agenti indexují, předávají je zpět do databáze vyhledávače.

Obecné vyhledávání informací na webu se provádí pomocí programů známých jako pavouci. Pavouci nahlásit obsah nalezeného dokumentu, indexovat jej a načíst souhrnné informace. Rovněž sledují záhlaví, některé odkazy a odesílají indexované informace do databáze vyhledávače.

Prohledávače prohlédnout záhlaví a vrátit pouze první odkaz.

Roboty lze naprogramovat tak, aby sledovaly různé odkazy s různou hloubkou vnoření, indexovaly a dokonce kontrolovaly odkazy v dokumentu. Vzhledem ke své povaze se mohou zaseknout ve smyčkách, takže ke sledování odkazů potřebují významné webové zdroje. Existují však metody, jejichž cílem je zabránit robotům ve vyhledávání na webech, jejichž vlastníci nechtějí, aby byli indexováni.

Roboti načteny a indexovány různé druhy informace. Některé například indexují každé slovo v dokumentu, se kterým se setkal, zatímco jiné indexují pouze nejdůležitějších 100 slov v každém, indexují velikost a počet dokumentů, název, nadpisy a podnadpisy atd.

Typ vytvořeného indexu určuje, které vyhledávání může vyhledávač provádět a jak budou interpretovány výsledné informace.

Lidé, kteří chtějí poskytovat informace široké veřejnosti nebo chtějí na svém webu více provozu, vloží krátké výňatky o tom, co je tento web přímo do indexu, a vyplní speciální formulář pro sekci, o které si myslí, že ji vyhledávací robot kontaktuje, a vytáhnou tento web do databáze a poskytnou ji nějaký uživatel.

Pokud někdo chce najít informace dostupné na internetu, navštíví stránku vyhledávače a vyplní formulář s podrobnostmi o potřebných informacích. Zde lze použít klíčová slova, data a další kritéria. Kritéria ve vyhledávacím formuláři se musí shodovat s kritérii používanými roboty k indexování informací, které najdou při procházení webu.

Indexované informace se odesílají do databáze vyhledávače stejným způsobem, jak je popsáno výše.

II) Fáze: Po zkopírování prohledávaných webových zdrojů na server vyhledávače začíná druhá fáze práce - indexování. V průběhu indexování se vytvářejí speciální databáze, pomocí kterých je možné zjistit, kde a kdy se na internetu určité slovo setkalo. Indexovaná databáze je druh slovníku. Je to nutné, aby vyhledávač mohl velmi rychle reagovat na dotazy uživatelů.

Databáze načte předmět dotazu na základě informací poskytnutých v vyplněném formuláři a odešle příslušné dokumenty připravené databází. Databáze používá algoritmus hodnocení k určení pořadí, ve kterém bude seznam dokumentů zobrazen. V ideálním případě se dokumenty, které jsou nejvíce relevantní pro dotaz uživatele, umístí na první místo v seznamu.

„Operace třídění získaných výsledků se nazývá hodnocení.“

Různé vyhledávače používají různé algoritmy hodnocení, ale základní principy pro určení relevance jsou následující:

Počet dotazovaných slov v textovém obsahu dokumentu (tj. V html kódu).

Značky, kde jsou tato slova umístěna.

Umístění hledaných slov v dokumentu.

Podíl slov, pro která je relevance určena, na celkovém počtu slov v dokumentu.

Tyto zásady platí pro všechny vyhledávače. A níže uvedené jsou používány některými, ale docela dobře známými (jako AltaVista, HotBot).

Čas - jak dlouho byla stránka v databázi vyhledávače. Zpočátku se zdá, že se jedná o poměrně nesmyslný princip. Pokud se ale zamyslíte nad tím, kolik stránek na internetu existuje maximálně měsíc! Pokud web existuje již dlouhou dobu, znamená to, že vlastník má s tímto tématem velké zkušenosti a uživatel je vhodnější pro web, který do světa vysílá o pravidlech chování tabulky už několik let, než ten, který se objevil před týdnem se stejným tématem.

Citační rejstřík - kolik odkazů na danou stránku vede z jiných stránek registrovaných v základně vyhledávače. Databáze zobrazuje podobně seřazený seznam dokumentů HTML a vrací jej uživateli, který podal požadavek. Různé vyhledávače také volí různé způsoby zobrazení výsledného seznamu - některé zobrazují pouze odkazy; ostatní zobrazují odkazy s několika prvními větami obsaženými v dokumentu nebo s názvem dokumentu spolu s odkazem.

III) Fáze. Požadavek uživatele je zpracován a výsledky vyhledávání jsou mu vráceny ve formě seznamu hypertextových odkazů. Poté přichází práce uživatele na recyklaci odkazů poskytovaných databází. Když klikne na odkaz na jeden z dokumentů, které ho zajímají, je tento dokument požadován od serveru, na kterém se nachází, pokud ho informace uživatele na tomto webu neuspokojují, klikne na jiný odkaz. Tato fáze může trvat dlouho a pro uživatele se ukáže jako nejobtížnější.


3. Vyhledávače

Na internetu existuje velké množství vyhledávačů (vyhledávačů), jsou různých typů, z nichž každý má své výhody a nevýhody. Uživatel bude vždy přemožen takovými otázkami: jak hledat na internetu, které auto je lepší. Pokusím se tedy na tyto otázky odpovědět.

3.1 Jak vyhledávat na internetu

Při hledání na internetu jsou důležité dvě složky - úplnost (nic není ztraceno) a přesnost (nebylo nalezeno nic navíc). Obvykle se to všechno nazývá jedním slovem - relevance, tj. Korespondence odpovědi na otázku.

1. Pokrytí a hloubka. Pokrytím se rozumí objem základny vyhledávače: který se měří třemi indikátory - celkový objem indexovaných informací, počet jedinečných serverů a počet jedinečných dokumentů. Hloubka znamená - existuje limit

počet stránek nebo hloubka vnoření adresářů na jednom serveru.

Jak zkontrolovat: Některé stroje zapisují statistiky robotů na své webové stránky. Ale můžete to zkontrolovat sami - musíte nastavit několik vyhledávacích dotazů skládajících se z jednoho slova (aby se vyloučil vliv jazyka dotazu, včetně odlišné interpretace prostoru), a zároveň se podívat na statistiky výsledků vydaných strojem - obvykle na začátku seznamu je uvedeno, kolik všechny dokumenty byly nalezeny. Kromě toho, že by slova měla být z různých oblastí, je také dobré vzít slova různých „vah“ - vzácných, „průměrných“ a „těžkých“ (frekvence) a porovnat nalezené množství. Těžká slova testují zejména fulltextový obsah (indexování všech slov v dokumentu) vyhledávače.

Je obtížnější zkontrolovat hloubku pohybu robota - k tomu je třeba vzít některé stránky, například s rozvětvenou strukturou archivů, a zkontrolovat, zda jsou dokumenty, ke kterým lze přistupovat, indexovány pouze například 6 kliknutími na odkazy.

2. Rychlost procházení a relevance odkazů.

Rychlost procházení v síti ukazuje, jak rychle je nově přidaný prostředek indexován a jak rychle jsou aktualizovány informace v databázi. Důležitým ukazatelem kvality vyhledávače (jeho robota) je nejen „zachycení“ nových území: ale také

sledování stavu již zahrnutých. Servery zmizí a objeví se, stránky na nich se aktualizují. Odkazy, které vyhledávač uvádí v seznamu nalezených, musí za prvé existovat a za druhé musí jejich obsah odpovídat požadavku.

Jak zkontrolovat: Objektivní informace lze získat analýzou protokolů serveru - robot vyhledávače je obvykle reprezentován názvem svého stroje (nebo podobným způsobem), takže můžete vidět, jak často server navštěvuje, kolik stránek si prohlíží atd. Pro studium je bohužel obvykle k dispozici pouze protokol vašeho webu, takže zůstává experimentální metoda.

Chcete-li určit rychlost procházení, musíte někde vytvořit stránku s textem, přidat ji do vyhledávačů a zjistit, jak rychle se začne hledat. Nebo změňte stávající stránku. Chcete-li zjistit relevanci odkazů - zkontrolujte dokumenty alespoň na první stránce seznamu, kde najdete několik dotazů. Zpráva „ Nenalezeno"označuje, že dokument již neexistuje."

3. Kvalita vyhledávání (subjektivní indikátor).

Každý vyhledávač má svůj vlastní algoritmus pro třídění výsledků vyhledávání. Čím blíže k horní části seznamu dokument, který potřebujete, tím lépe funguje relevance.

Jak zkontrolovat:Pouze experimentem. Pro srovnání se doporučuje zadávat dotazy různých délek. Můžete také použít dotazovací jazyk, zatímco ti, kteří si nechtějí přečíst popis, mohou použít stránku rozšířeného dotazu („rozšířené vyhledávání“ v Aportu a Yandexu, „podrobný dotaz“ v Rambleru - možnosti překladu do ruštiny „rozšířené vyhledávání“).

Kromě relevance existují důležité uživatelské vlastnosti.

1. Rychlost vyhledávání. Pokud vyhledávač reaguje pomalu, je neúčinné s ním pracovat. Je třeba dodat, že rychlost viditelná pro uživatele závisí nejen na samotném vyhledávači, ale také na internetových kanálech.

Jak zkontrolovat: Experimentem - musíte hledat dotazy různých délek, různé „závažnosti“ slov a v různé denní době (zatížení serveru je během dne výrazně nerovnoměrné, maximální doba je asi tři až čtyři hodiny dne).

2. Možnosti vyhledávání (práce s jazykem dokumentu, jazyk dotazu). Dalším srovnávacím bodem je, co přesně a jak vyhledávač zadává do indexu. Fulltextový vyhledávač indexuje všechna slova textu, která jsou viditelná pro uživatele. Přítomnost morfologie umožňuje najít požadovaná slova ve všech deklinacích nebo konjugacích. Kromě toho existují v HTML značky, které lze zpracovat také vyhledávačem (nadpisy, odkazy, titulky obrázků atd.). Téměř všechny stroje mají dotazovací jazyk ve formě standardních logických operátorů (AND, OR, NOT). Někteří lidé vědí, jak hledat fráze nebo slova v dané vzdálenosti - to je často důležité pro dosažení rozumného výsledku. Další příležitost je vyhledávání v oblastech dokumentu - záhlaví, odkazy, klíčová slova (META KEYWORDS) atd. Další funkcí dotazovacího jazyka je dotaz v přirozeném jazyce, který nevyžaduje znalost operátorů.

Jak zkontrolovat:Obvykle jsou tyto informace zveřejňovány na serveru vyhledávače (v nápovědě „e). Doporučuje se však kontrolovat skutečné dotazy, protože někdy se přání přeje jako skutečné.

3. Další vybavení. Toto jsou další příležitosti, které vyhledávač poskytuje uživatelům. To zahrnuje všechny druhy možností vyhledávání (specializované stránky, vyhledávání podobných dokumentů, omezení oblasti hledání) a seznam nalezených serverů, vyhledávání podle dat a serverů a pohodlné rozhraní vyhledávače a možnost přizpůsobení.

Jak zkontrolovat: Informace lze částečně zveřejnit na serveru vyhledávače, ale je nejlepší se pokusit s těmito možnostmi pracovat sami.

Vyhledávače se skládají z prohledávat adresáře a indexy, mnoho indexů vyhledávání také obsahuje adresáře. Zvažme je.

3.1 Hledání adresářů

Každá kniha začíná obsahem a končí abecedním rejstříkem. Navzdory skutečnosti, že jsou umístěny na různých místech knihy a vypadají úplně jinak, mají stejný úkol: pomoci najít v knize přesně část, která je v tento moment potřeboval. Obsah je příkladem katalogizace.

Když si člověk vybere téma, které je pro něj zajímavé, použije ho k vyhledání čísla stránky, kde je toto téma odhaleno. Abecední index je příkladem indexování (v angličtině je index index). Osoba najde požadovaný výraz v indexu a získá číslo stránky, na které se objeví.

Adresáře a liší se od vyhledávačů. Adresáře jsou kolekce webů shromážděných v nadpisech předmětů. Tyto nadpisy lze zase rozdělit na podnadpisy, které mohou mít ještě menší podadresáře atd.

Adresáře z pohledu uživatele jsou stejné vyhledávače. Ale tyto katalogy nejsou vyplňovány „roboty“, jako na znameních, ale nejživějšími lidmi. To je pro uživatele velmi dobré, protože ve srovnání s vyhledávači vytváří relevantnější výsledky. Vyhledávací rejstřík částečně obsahuje i katalog, který je prezentován ve formě obsahů (hypertextových odkazů) na nejoblíbenější témata.

Při katalogizaci zdroje jej zkušený editor pečlivě zkontroluje, určí, do které oblasti znalostí zdroj patří, nastaví jeho kategorii v tomto odvětví a zadá zdroj do katalogu. Největším adresářem na internetu je Yahoo (www.yahoo.com). Zaměstnává více než 150 kvalifikovaných editorů. Je to velká organizace, ale její úsilí stačí pouze k udržení adresáře na úrovni přibližně 1 milionu zdrojů. Další expanze je omezena potřebou


v ruské části internetu v tabulce 1. [příloha]

3.3 Vyhledávací ukazatele

Indexy vyhledávání jsou automatizované systémy... Jsou schopni fungovat bez lidského zásahu, a proto jsou jejich znalosti skutečných zdrojů webu mnohem (několik řádů) větší než znalosti adresářů. Počet indexovaných webových stránek lze měřit na stovky milionů.

Index vyhledávání funguje ve třech fázích, které jsou uvedeny v odstavci 2.2.

Specifické pokyny pro výběr indexu vyhledávání velmi rychle stárnou. Situace na internetu se mění doslova před našimi očima. Neuplyne ani půl roku, aby se ve vyhledávačích něco nezměnilo. Systém, který byl včera nejlepší, nemusí být nejlepší dnes a zítra velmi špatný. Popularita je zároveň ošemetná věc. Vydělává tvrdě, ale pak žije dlouho. Ve výsledku se velmi často setkáváme se situací, kdy nejpopulárnější zdaleka není nejlepší systém... Pomůžeme čtenáři naučit se samostatně kontrolovat různé vyhledávače a vybrat ty, které poskytují nejlepší výsledky pro práci. Při ověřování není velikost ukazatele hledání kritická. Koneckonců, nepotřebujeme miliony odkazů, ale pouze dva nebo tři, ale nejlépe ty nejlepší. Proto je důležité nejen to, kolik webových stránek indexoval vyhledávač, ale také kdy to naposledy udělal, jak často později kontroloval relevanci odkazů a jak správně prezentuje výsledky vyhledávání.

Srovnávací recenze vyhledávačů.

Není třeba podrobně hovořit o tom, jak používat vyhledávací adresáře. Jelikož stačí přejít na web, vyberte kategorii, která vás zajímá, vyberte v ní část atd., Dokud se neotevře seznam konkrétních odkazů.

Je mnohem zajímavější zvážit techniky používání ukazatelů vyhledávání, zejména proto, že tyto techniky se u různých ukazatelů liší. Než však začneme studovat konkrétní systém, je třeba zvážit obecné pojmy, které platí stejně pro všechny vyhledávací indexy, jako příklad budu považovat takové populární a podle mého názoru nejvhodnější vyhledávače jako Yandex a Rambler.

A začnu tím, že se podívám na hlavní typy vyhledávání. V zásadě existují pouze čtyři typy vyhledávání.

Všechny vyhledávací indexy implementují několik vyhledávacích algoritmů. Patří mezi ně: Jednoduché vyhledávání, Pokročilé vyhledávání, Kontextové vyhledávání a Speciální vyhledávání.

Jednoduché vyhledávání. Při jednoduchém hledání se do pole dotazu zadá jedno nebo více slov, která mohou charakterizovat obsah dokumentu. Pokud je toto slovo jedno, pak se zpravidla vrací tak velké množství odkazů, ze kterých není jasné, co dělat. Pokud je zadáno více slov, výsledek závisí na tom, jak jsou slova zadána, a to zase závisí na konkrétním použitém systému. Recepce jednoduché vyhledávání v různých vyhledávačích jsou zpravidla jejich vlastní a před jejich použitím je vhodné si přečíst pokyny. Jednoduché Ramblerovo vyhledávání je prezentováno na

rýže-8. Když zadáte frázi: Všechno je v domě Oblonských zmateno, indexy vyhledávání poskytnou následující výsledky: Rambler 9 (dokumenty)

Yandex 2400 (dokumenty)

Pokročilé vyhledávání. Pokročilé vyhledávání vždy znamená dotaz ze skupiny slov. V pokročilém vyhledávání je ve většině případů povoleno propojovat klíčová slova s \u200b\u200blogickými operátory AND (AND), OR (OR), NOT (NOT) a dalšími. Hlavní výhodou pokročilého vyhledávání je, že pravidla pro psaní klíčových slov a logických operátorů v různých systémech jsou stejná nebo velmi podobná. Jakmile tedy jednou pokročilé techniky vyhledávání zvládnete, můžete je použít kdekoli. Musíte pouze nejprve přepnout systém do požadovaného režimu (obr. 9).

Když zadáte frázi: Všechno je v domě Oblonských zmateno, v rozšířeném vyhledávání poskytnou indexy vyhledávání následující výsledky: Rambler 9 (dokumenty)

Yandex 2400 (dokumenty)

Obr. 8 Jednoduché vyhledávání v Rambleru


Obr. 9 Přepnutí systému do režimu pokročilého vyhledávání.

Kontextové vyhledávání. Jedná se o velmi užitečnou formu vyhledávání, která bohužel není implementována ve všech indexech vyhledávání. Je třeba ocenit zejména systémy, které jej podporují. Kontextové vyhledávání vyžaduje přesnou shodu fráze nebo skupiny slov, například „Vše

smíchané v domě Oblonských “. Ve většině vyhledávačů, které tuto metodu obsahují, musí být klíčová fráze uzavřena v uvozovkách: „Všechno je v domě Oblonských smícháno.“ (Obr. 10)

Když zadáte frázi: „Všechno je v domě Oblonských smícháno“, vyhledávací indexy vrátí následující výsledky:

Rambler 0 (dokumenty)

Yandex 8 (dokumenty)

Obr. Kontextové vyhledávání v RAMDLER.RU


Speciální vyhledávání. Další informace se hledají pomocí speciálních vyhledávacích příkazů. Například takové příkazy vám umožní určit, jak často jsou na webu hypertextové odkazy směřující na prostředek, s jejich pomocí můžete najít klíčová slova,

zahrnuty v záhlaví webových stránek atd. Speciální vyhledávací příkazy v různých vyhledávačích se zpravidla liší.

Musíte také zvážit hlavní pravidla prohledávat záznamy příkazů.


Obecná pravidla pro psaní vyhledávacích příkazů:

Slova oddělená mezerou

Řekněme, že uživatel potřebuje najít webovou stránku, která říká něco o operačním systému. Microsoft Windows... Je logické zadat do vyhledávacího pole slova Microsoft Windows a počkat na výsledek. Výsledek však může být odrazující. Některé vyhledávače chápou takový záznam jako Microsoft AND Windows - poskytnou to, co uživatel hledá. Jiní mohou tuto položku interpretovat jako Microsoft NEBO Windows - pak budou nalezeny všechny webové stránky, které obsahují buď první slovo, druhé nebo obojí. Uživatel se samozřejmě zajímá pouze o ty stránky, na kterých se obě slova nacházejí společně, ale budou doslova pohřbeny mezi ostatními stránkami, které nepotřebuje.

Když začnete s neznámým systémem, musíte začít kontrolou toho, jak zachází se skupinami klíčových slov. Nejprve se zadá jedno slovo: Microsoft. Můžete vidět, kolik výsledků systém dá.

Rambler 28184 (dokumenty)

Yandex 1048379 (dokumenty)

Poté se zadá druhé slovo: Windows. Množství se znovu zkontroluje. Zadávají se obě slova: Microsoft Windows.

Když zadáte frázi: Microsoft, vyhledávací indexy vrátí následující výsledky:

Rambler 6641 (dokumenty)

Yandex 259276 (dokumenty)

Pokud je počet nalezených webových stránek větší než v prvním a ve druhém případě, znamená to, že systém zvažuje, že klíčová slova souvisejí s OR (sady jsou kombinovány). Pokud je výsledek menší než v každém z prvních testů, použije systém poměr AND (sady se protínají). A ve skutečnosti a v jiném případě budete muset přečíst základní informace, abyste zjistili, jak dosáhnout opačného výsledku. Například všechny hlavní ruské vyhledávače standardně vkládají operátor AND mezi slova, ačkoli systém Yandex má své vlastní charakteristiky (viz tabulka 2). Předpokládá se, že tato dvě slova by neměla být současně přítomna ne v dokumentu, ale v jedné větě. Pokud stačí, že jsou v dokumentu přítomny, musíte před každým slovem dát znaménko<+>... Současně vzniká inverzní problém: jak provést vyhledávání dokumentů obsahujících jedno z daných - klíčových slov, tedy jak nastavit relaci OR?

Rambler: Microsoft NEBO Windows; (50986 dokumentů)

Yandex: Microsoft | Okna; (2034641 dokumentů)

Role velkých písmen

Ve většině vyhledávačů se „chléb“ nerovná „CHLÉB“, ale „CHLÉB“ * „chléb“. Obecným pravidlem je, že pokud klient zadal malá písmena, hledají se malá i velká písmena, ale pokud klient použil velká písmena, pak se přesná shoda hledá pouze s velkými písmeny. Klasickým příkladem je Červená Karkulka. Pokud je zadáte tímto způsobem, pomocí velkých písmen, pak pouze dokumentů, ve kterých jsou

kombinace Červené Karkulky. Pokud jsou však klíčová slova napsána jako malá červená kukla, bude prohledáno více dokumentů. Všechny dokumenty, které obsahují kombinace, projdou sítem výběru: Červená Karkulka, Červená Karkulka, Červená Karkulka a Červená Karkulka. Proto byste neměli zneužívat použití velkých písmen v žádosti a používat je, pouze pokud je absolutní jistota výsledku.

Některé vyhledávače se však liší. Například v Ramblerově systému jsou při indexování všechna velká písmena násilně „snížena“ na malá písmena. To znamená, že je zbytečné používat velká písmena v dotazu na tomto systému.

Když zadáte frázi: Červená Karkulka, vrátí index vyhledávání následující výsledky:

Rambler 2921 (dokumenty)

Yandex 16458 (dokumenty)

Role vyhrazených slov

Rezervovaná slova jsou slova, která se při zpracování požadavku nepočítají. Během indexování webových stránek je program vyhodí z textu, což výrazně zmenší velikost ukazatelů a zkrátí dobu hledání. K vyhrazeným slovům obvykle

zahrnuje neinformativní slova: předložky, spojky, zájmena, články a jiná malá slova. Pokud například hledáte v systému Yandex frázi „Všechno se mísí v domě Oblonských“, budou vyhledány také dokumenty obsahující Co se mísí v domě Oblonských? - a kde se to mísí? V domě Oblonských? V některých systémech mohou být vyhrazena slova, která jsou extrémně běžná, a proto nejsou informativní. Pokud je například systém zaměřen na vyhledávání knih, pak slovní kniha pro něj není informativní. Slovo auto je neinformativní pro vyhledávač, který se zabývá automobilovými záležitostmi, a slova počítač a internet jsou neinformativní pro systémy zaměřené na vyhledávání informací o výpočetní... Při kontextovém vyhledávání je zvláště důležité vzít v úvahu roli vyhrazených slov. kontextové vyhledávání vyžaduje přesnou shodu mezi tím, co si uživatel objednal, a tím, co se nachází ve webových dokumentech. Pokud vyhledávací stroj „odstranil“ webové dokumenty z vyhrazených slov ve fázi indexování, pak se nedokáže vyrovnat s kontextovým vyhledáváním, snad s výjimkou „nahlédnutí“ do kopií webových stránek, pokud existují, ale zabere to hodně času. Poctivé kontextové vyhledávání ve vyhledávačích je proto vzácné. Například v Rusku Yandex i Rambler jen předstírají, že poskytují příležitost pro kontextové vyhledávání, proto musí být požadovaná fráze uvedena v uvozovkách. Po několika jednoduchých testech je však snadné se přesvědčit, že se nejedná o kontextové vyhledávání, ale o hledání s přesností vyhrazených slov. Příklad, když dotaz „Vše je smícháno v domě Oblonských“ vrátí výsledek Co je smícháno v domě Oblonských. V tabulce 2 poskytuji srovnávací popis hlavních vyhledávačů (vyhledávačů). [Příloha]


4. Srovnávací charakteristiky dvou vyhledávačů založené naRambler. ru aYandex. ru


4.1 RAMBLER

Rambler.ru je historicky (před Yandexem) nejoblíbenější vyhledávač v Rusku. Začala pracovat dříve než ostatní a na dlouhou dobu byl lídrem v oblasti velikosti indexu a kvality vyhledávacích služeb. Bohužel, tyto úspěchy jsou dnes minulostí. Navzdory skutečnosti, že velikost vyhledávacího indexu "Rambler" je přibližně 12 milionů webových stránek, nebyl ve skutečnosti dlouho aktualizován a poskytuje zastaralé výsledky. Rambler je dnes populární portál, nejlepší systém klasifikace a hodnocení v Rusku a reklamní platforma. (Obr. 10)

Vyhledávací techniky v systému Rambler:

Hledat dotazovací jazyk

Vyhledávací dotaz se může skládat z jednoho nebo více slov, může obsahovat interpunkční znaménka. Makeup jednoduché dotazy je to možné, aniž bychom šli do složitosti dotazovacího jazyka. Pokud tedy do řádku pro vyhledávání zadáte několik slov bez interpunkčních znamének a logických operátorů, dokumenty obsahující všechna tato slova budou nalezeny (a v omezené vzdálenosti od sebe).

Znalost a správné používání vyhledávacího jazyka vyhledávače však pomůže učinit hledání na Rambleru rychlé a efektivní.

Registrovat

Obecně platí, že případ pravopisu hledaných slov a operátorů nezáleží, to znamená, že house a DOM, Not a nOt jsou vnímány stejně. A jen někdy, aby se zlepšila kvalita vyhledávání, případ slov vyhledávací dotaz vzít v úvahu.

Pokud se například dotaz skládá ze dvou, tří nebo čtyř slov, z nichž každé je psáno velkým písmenem, předpokládá se hledání podle vlastního jména a omezení vzdálenosti mezi slovy dotazu se automaticky změní z výchozí hodnoty na hodnotu (n-1) * 2 , kde n je počet slov v dotazu. To vám umožní najít skupinu dotazovaných slov, ve kterých není více než jedno „extra“ slovo nebo interpunkční znaménko, například „Baden-Baden“, „A. Puškin“, „Fjodor Michajlovič Dostojevskij“.

Operátoři

Víceslovný dotaz může obsahovat operátory. Operátoři nejsou v dokumentu prohledáváni, slouží pouze jako pokyny pro vyhledávač. Všichni operátoři vyhledávačů jsou binární, to znamená, že mají levou a pravou část, přičemž každá z nich je také dotazem (ve výchozím nastavení sestává z jednoho slova). Ke změně rozsahu operátorů (seskupení více slov dotazu do argumentu operátoru) se používají závorky a uvozovky. Dva dotazy spojené operátorem AND (logické AND) tvoří složitý dotaz, který je uspokojen pouze dokumenty, které současně splňují oba tyto dotazy. Jinými slovy, dotaz „pes AND kočka“ najde pouze dokumenty, které obsahují slovo „pes“ i slovo „kočka“.

Složitý dotaz skládající se ze dvou dotazů propojených operátorem OR (logické OR) je uspokojen všemi dokumenty, které splňují alespoň jeden z těchto dvou dotazů. Vyhledávací dotaz „pes NEBO kočka“ najde dokumenty, které obsahují alespoň jedno ze slov „pes“ nebo „kočka“ (nebo obě tato slova společně). Operátor NOT (logický AND NOT) tvoří dotaz, na který odpovídají dokumenty, které splňují levou stranu dotazu a nevyhovují pravé. Výsledkem hledání pro dotaz „pes NENÍ kočka“ tedy budou všechny dokumenty, které obsahují slovo „pes“, nikoli slovo „kočka“. Pokud není výslovně zadán žádný operátor, použije se výchozí operátor AND: budou nalezeny pouze dokumenty obsahující všechna slova dotazu. Dotaz „kredit informační technologie“ bude tedy interpretován jako „informace AND technologie AND úvěr“. Na stránce Rozšířené hledání lze výchozí operátor nahradit OR (Hledat slova dotazu: alespoň jedno).

Každý z operátorů má zkratku:

Zkratka operátora

Dotaz na několik slov rozptýlených operátory bude interpretován podle jejich priority. Operátory AND a NOT mají tradičně vyšší prioritu, takže dotaz několika slov je nejprve seskupen podle operátorů AND a NOT a teprve poté od operátorů OR. Pořadí seskupení můžete změnit pomocí závorek.

Citáty

K hledání nabídek můžete použít uvozovky. Slova dotazu uzavřená do uvozovek se prohledávají v dokumentech přesně v pořadí a ve formách, ve kterých se v dotazu objevují. Dvojité uvozovky lze tedy také jednoduše použít k vyhledání slova v daném tvaru (ve výchozím nastavení se slova nacházejí ve všech formách). Například dotaz „letadlo“ doplnilo palivo „přistání“ je uspokojeno dokumentem obsahujícím text „... letadlo přistálo a doplnilo palivo ...“ a dokument obsahující „.. letadlo přistálo natankovat ...“ nevyhovuje.

Závorky

Při vytváření dotazů je někdy nutné kombinovat slova dotazu do skupin, které budou argumenty nějakého operátora. Takové skupiny jsou uzavřeny v závorkách. Část dotazu v závorkách je sama o sobě dotazem a podléhá pravidlům jazyka pro vytváření dotazů. Používání závorek

umožňuje vytvářet vnořené dotazy a předávat je operátorům jako argumenty a přepsat výchozí prioritu operátorů. Pokud je dotaz bez závorek „auto letadlo | letiště“ ekvivalentní dotazu „auto A letadlo NEBO letiště“ a podle priorit operátora znamená „najít dokumenty obsahující buď slova„ auto “a„ letadlo “nebo slovo letiště, pak dotaz s závorky „auto (letadlo | letiště)“ jsou ekvivalentní výrazům „auto A (letadlo NEBO letiště)“, což znamená „najít dokumenty obsahující slovo„ auto “a jedno ze slov„ letadlo “nebo„ letiště ““.

Metaznaky

Rambler dosud nepodporuje hledání řetězců pomocí metaznaků („*“, „?“), Kterými se obvykle rozumí „libovolný podřetězec“ a „libovolný jeden znak“. Tito operátoři jsou však vyhrazeni pro podobné budoucí použití.

Pomocí dotazovacího jazyka

Každá žádost adresovaná vyhledávacímu stroji Rambler je zpracována v souladu s pravidly jazyka dotazu. Některá slova a symboly jsou považovány za operátory dotazovacího jazyka a jsou zpracovávány zvláštním způsobem. Ve skutečnosti dotazovací jazyk popisuje určitý vzorec, který se používá při vyhledávání - každý z dokumentů je s ním „spárován“ a výsledkem vyhledávání jsou pouze ty dokumenty, které jej splňují. Například dotaz „letadlo“ uspokojí všechny dokumenty, ve kterých bylo slovo „letadlo“ v jakékoli formě alespoň jednou narazeno. Dotaz skládající se z několika slov je uspokojen dokumenty obsahujícími každé z těchto slov v jakékoli formě (za určitých podmínek). Otázka, jak dokument odpovídá složitějšímu dotazu, je dána logikou operátorů a konstrukcí dotazovacích jazyků.

Morfologie

Pro každé slovo dotazu se vyhledávání provádí s přihlédnutím k pravidlům skloňování příslušného jazyka. Rambler rozumí a rozlišuje mezi slovy v ruském a anglickém jazyce - ve výchozím nastavení se vyhledávání provádí ve všech formách slova. Například při hledání slova „osoba“ najdete také dokumenty obsahující slova „osoba“, „osoba“, „osoba“ a dokonce „lidé“. Chcete-li vyhledat pouze jednu konkrétní formu slova, musíte jej uvést do uvozovek nebo použít hledání přesné fráze v rozšířeném vyhledávání.

Přestaň slova

Některá slova a symboly jsou ve výchozím nastavení z požadavku vyloučeny kvůli jejich nízkému informačnímu obsahu. Jedná se o takzvaná stop slova - nejčastější slova v ruském a anglickém jazyce, například předložky, částice a články. Přítomnost těchto slov může zpomalit vyhledávání a negativně ovlivnit úplnost výsledků. Potřebu těchto slov je možné v dotazu označit převzetím dotazu v uvozovkách nebo vyhledáním přesné fráze v rozšířeném hledání.

Omezení vzdálenosti

Pokud je dotaz složen z jednoho nebo více slov bez použití operátorů a konstruktů dotazovacího jazyka, budou nalezeny dokumenty, ve kterých jsou nalezena všechna slova dotazu. Zároveň pro každý požadavek existuje vždy takzvané kontextové omezení - kladné číslo, standardně se rovná vzdálenosti 40 slov. Dokument obsahující všechna slova dotazu bude vrácen, pouze pokud je vzdálenost slov mezi výskyty slov dotazu menší než toto číslo. Například dotaz „červená armáda“ najde dokumenty, ve kterých se slova „červená“ a „armáda“ objeví alespoň jednou za méně než 40 slov od sebe. Hodnotu omezení kontextu lze změnit konstrukcí „(číslo, dotaz)“, kde číslo je libovolné kladné číslo, dotaz je jakýkoli správný dotaz z pohledu vyhledávače, který se skládá z více než jednoho slova (je zřejmé, že v případě jednoslovného dotazu je omezení vzdálenosti mezi slovy dává smysl). Na žádost „(2, červená armáda)“ tedy budou pouze ty dokumenty, ve kterých mezi slovy „červená“ a „armáda“ nebude alespoň jednou jediné slovo (protože pouze v případě jejich bezprostřední blízkosti je rozdíl v pořadovém počtu slov méně než 2, tj. rovno 1)

Slova nebyla nalezena

Pokud se dotaz skládá z několika slov a některá z nich nelze na internetu vůbec najít, vrátí se výsledky hledání pro částečný dotaz, ze kterého jsou vyloučena slova, která na internetu chybí. V tomto případě se odpovídající diagnostika zobrazí na stránce s výsledky vyhledávání.


Výsledky třídění

Ve výchozím nastavení jsou nalezené dokumenty seřazeny podle relevance (odpovídající dotazu). Můžete však požádat, aby nejnovější (nebo nejstarší dokumenty) byly místo toho umístěny v horní části seznamu. Chcete-li to provést, vyberte příslušné nastavení v nabídce „Řadit podle ...“ na stránce podrobných požadavků. Můžete také omezit vyhledávání na dokumenty vytvořené v určitém časovém období: za tímto účelem musíte na stránce s podrobnými požadavky zadat „Od data ... do data ...“.

Vzdálenost mezi slovy

Můžete požadovat, aby Rambler vrátil pouze ty dokumenty, kde jsou slova z dotazu v minimální vzdálenosti od sebe. Režim „Omezit vzdálenost mezi slovy“ lze povolit v podrobném dotazu. Všechna výše uvedená pravidla lze použít společně v požadovaném pořadí.

Dodání výsledků

Ve výchozím nastavení jsou výsledky hledání vráceny v částech 15 dokumentů. Nabídka „Vydat do ...“ na stránce s podrobnými požadavky umožňuje zvýšit tento počet na 30 nebo 50. Nabídka „Výstupní formulář ...“ umožňuje přijímat popisy dokumentů se zvýšenými nebo sníženými podrobnostmi.


4.2 YANDEX

Yandex.ru je vyhledávač schopný na vyžádání vyhledat nejvhodnější webové stránky v ruské části internetu. Yandex každý den prohledává stovky tisíc webových stránek a hledá změny nebo nové odkazy. Sbírka odkazů neustále roste. Yandex nevyžaduje znalost speciálních vyhledávacích příkazů. Yandex najde v elektronických obchodech každého, kdo odkazoval na stránku, soubory s požadovaným obrázkem, nejnovější zprávy nebo produkty. Srdcem systému Yandex je největší index - asi 27 milionů webových stránek, ale není to jen velikost. Není to jen ukazatel na zdroje, ale ukazatel na nejrelevantnější zdroje. Pokud jde o relevanci, Yandex je dnes nesporným lídrem (obr. 4)

Vyhledávací techniky v systému Yandex

Než přistoupím k popisu dotazovacího jazyka systému Yandex, poznamenávám, že je znatelně výkonnější a složitější než dotazovací jazyky jiných domácích vyhledávačů. Průměrného uživatele však není třeba zastrašit. I když opravdu nerad čte a navíc studuje pokyny, může se systémem pracovat intuitivně.

Systém Yandex v zásadě používá při své práci heuristické algoritmy, které nejsou z matematického hlediska zcela striktní. Výsledkem může být, že uživatel získá různé výsledky, například když vyhledá dokumenty se slovy Bush Gore volby a Bush Gore volby. Ale díky těmto algoritmům poskytuje intuitivní přístup k vytváření dotazů (bez pokynů pro čtení) velmi dobrý výsledek, navíc za velmi krátkou dobu.

Hledání podle jednoho slova

Když uživatel zadá hledané slovo do vyhledávacího pole a klikne na tlačítko Najít, hledají se slova ve všech možných tvarech slov, což je zvláště důležité pro ruský jazyk. Pokud je například zadáno slovo sníh, budou nalezeny dokumenty, které obsahují slova sníh, sníh atd., Ale ne zasněžené, zasněžené atd. Pokud není hledání slovních tvarů povinné, lze jej zrušit pomocí vykřičníku podepsat například! sníh.

Hledání podle skupiny slov

Pokud jsou slova oddělena mezerou, prohledají se dokumenty, ve kterých jsou všechna zadaná slova nalezena v jedné větě. Takže na žádost voleb Bushe Gorea

systém rozdává dokumenty s frázemi jako ... V předvečer voleb hackeři vnikli na webové stránky Bushe a Gorea. Mezi výsledky takového vyhledávání jsou možné laxní shody - vyhledávač ukazuje jeho inteligenci. Chcete-li přísně zajistit vzhled slov ve větě, musíte před ně umístit znaménko +, například: + Bush + Gore + volby. Znaménko + musí být psáno společně se slovem, na které odkazuje (bez mezery). Prostor hraje roli operátoru AND, který lze také zadat explicitně (symbol &), například volby + Bush & + Horus & +. Vpravo a vlevo od logického operátoru musí být mezery.

Pokud potřebujete současnou přítomnost slov nejen ve větě, ale v celém dokumentu, použije se operátor &&, například: + Bush && + Gore && + volby.

Nyní zvážím techniky vyloučení slov z vyhledávání. K tomu použijte: sign - (přísné vyloučení z věty), znak ~ (nikoli přísné vyloučení z věty) a ~~ (vyloučení z celého dokumentu). Například volby + Bush + Gore ~~ volby tedy umožní

vyberte dokumenty, ve kterých se slova Bush a Gore nacházejí v jedné větě, ale celý dokument neobsahuje slovo voleb a jeho deriváty (volba, při volbách, po volbách atd.).

V případech, kdy potřebujete kombinovat klíčová slova pomocí operátoru OR, použijte | (svislá čára). Například žádost Bush | Volby Gore && + vyberou dokumenty, které zmiňují buď George W. Bushe nebo Alberta Gora, ale bez problémů

existuje slovo volby.

Hledat podle vzdálenosti

Před dlouhou dobou se ve vyhledávačích objevil operátor NEAR, který vám umožňuje najít dokumenty, ve kterých jsou dvě slova umístěna blízko sebe. Je pravda, že každý systém chápe „zavřít“ odlišně. Ve vyhledávači Yandex můžete přesně určit, jak daleko by tato slova měla být od sebe.

V dokumentu má každé slovo své vlastní číslo pozice. Čísla pozic dvou sousedních slov se liší o jedno (číslo pozice slova vpravo je větší). Operátor vzdálenosti je zapsán jako / + n, kde n je číslo odpovídající vzdálenosti. Například operátor / + 1 odpovídá dvěma po sobě jdoucím slovům, to znamená, že Microsoft / + 1 Windows je stejný jako Microsoft Windows.

Provozovatel vzdálenosti může být také záporný. To znamená, že druhé slovo uvedené v požadavku se musí objevit před prvním v dokumentu. Například požadavek Microsoft / -5 Windows může odkazovat na dokument obsahující frázi o operačních systémech, které nahradí Windows, uvedl výkonný ředitel společnosti Microsoft.

Při vyhledávání zadáním vzdálenosti můžete zadat nikoli přesnou vzdálenost mezi slovy, ale rozsah, například / (- 5 +5). V tomto případě budou vybrány dokumenty, ve kterých slova zadaná v dotazu jako klíčová slova spadají do zadaného rozsahu. Ve skutečnosti, pokud není zadán znak parametru, pak se jedná také o hledání rozsahu. Operátor / 5 by tedy měl být skutečně považován za rozsah / (- 5 +5). Žádost o Bushe / 5 Gorea najde návrhy jako: Ženy sympatizující s Bushem a muži sympatizující s Gorem nebo Gorem Bushem nebyly o nic sladší.

Systém - Yandex má poměrně složitá pravidla pro dotazovací jazyk (ve srovnání s Ramblerem), ale má rozsáhlé možnosti. Například vzdálenosti lze měřit nejen mezi slovy, ale také mezi větami. Tato jednotka se používá, když se v dotazu použije dvojité && nebo ~~. Dotaz Bush / + 1 && Gore tedy vrátí dokumenty, ve kterých se slova Bush a Gore vyskytují buď ve stejné větě, nebo v sousedních.

Používání závorek

Hledání je v podstatě logický výraz, který funguje jako filtr při prohlížení dokumentů v databázi vyhledávače. V

v logickém výrazu, stejně jako v aritmetice, můžete použít závorky. Slouží ke kontrole pořadí akcí. Případová studie: Bush & Gore & (volby | hlasování). Takový dotaz vrátí odkazy na webové stránky obsahující návrhy, které obsahují slova Bush, Gore, volební nebo Bush, Gore, volební.

Správa hodnocení

Cílem hodnocení je zajistit, aby webové stránky, které

ty, které nejlépe odpovídaly dotazu, byly zobrazeny v seznamu výsledků co nejdříve. Algoritmy, které vyhledávač používá pro hodnocení, jsou jeho záležitosti. Uživatelé jsou buď spokojeni se svou prací, nebo se obrátí na jiný vyhledávač. V systému Yandex je možné nezávisle měnit algoritmus hodnotícího mechanismu pomocí váhových faktorů. Takový faktor lze přiřadit libovolnému klíčovému slovu nebo celému výrazu, pokud je uveden v závorkách: Váhy se zadávají dvojtečkou, například Bush: 5 Gore volby. S takovým dotazem mají dokumenty, ve kterých se slovo Bush vyskytuje častěji, přednost a objeví se ve výsledném seznamu na vyšších pozicích.

S technikou slova souvisí další technika řízení hodnocení. Jedná se o slovo, které nemusí být obsaženo ve vybraných dokumentech, ale pokud tam je, pak tento dokument získá prioritu hodnocení. Za znaky se zadává kvalifikační slovo<_. Например, при поиске по ключевым словам Гор Буш<_младший выборы получат преимущество Web-страницы, в которых речь идет не просто о Джордже Буше, а о Джордже Буше-младшем.

Speciální vyhledávání

Techniky vyhledávání informací obsažených ve speciálních polích záhlaví webových stránek (každá webová stránka má v záhlaví pole služeb) nebo hledání speciálních prvků obsažených ve webových stránkách, například hypertextové odkazy, stojí od sebe. V Yandexu začínají speciální vyhledávací příkazy v polích nadpisů

se znakem $ a příkazy pro vyhledání jednotlivých prvků webových stránek se znakem #. Všechna ad-hoc vyhledávání jsou znatelně pomalejší než běžná vyhledávání.

Příkaz

Popis

Příklad

Vysvětlení

$ titul (výraz)

Hledání klíčových slov uvedených ve výrazu se provádí pouze v nadpisech webových stránek


$ title (mezera)


Hledány jsou pouze webové stránky, které mají v názvech slovo Cosmos (obr. 7.10)



Hledání klíčových slov uvedených ve výrazu se provádí pouze v kotvách interních odkazů webových stránek


$ anchor (úvod)


Vnitřní (výraz)


#keywords \u003d (výraz)


#keywords - (novinky)



#abstract \u003d (výraz)


Hledání anotace webové stránky

#abstract \u003d (Bush | Gore)


#image \u003d "název souboru"


Vyhledejte ilustrační soubory podle jejich názvu


#image - „Bush. *“

Pokud předem nevíte, jakou příponu může mít název souboru, použijte zástupný znak „*“, který nahradí libovolný počet libovolných znaků


#hint - (výraz)

Najděte slova v alternativním textu ilustrací


(Bush | Gore)



#url \u003d " URL-adresa"

Vyhledejte web nebo webovou stránku


# uri. \u003d "www.anysite.ru"


Obvykle se používá k lokalizaci vyhledávání. Například k omezení rozsahu vyhledávání na jeden web nebo naopak k jeho vyloučení z rozsahu hledání


#odkaz - adresa"

Obvykle se používá " URL- k identifikaci webových stránek, které mají hypertextové odkazy na jejich vlastní stránku


Závěr

Dokázal jsem plně odhalit položené otázky a zjistit toto téma (jak provést efektivní vyhledávání na internetu?). Z vlastní zkušenosti jsem byl přesvědčen, že v naší době vyspělých technologií není efektivní získávání informací řešitelné a zůstává jedním z hlavních problémů. Mohu to vysvětlit následovně.

Zaprvé, není to dokonalost samotných vyhledávačů, která zpochybňuje jakékoli vyhledávání.

Vyhledávačům chybí řád, struktura, struktura, strukturování, stejně jako systém, systematizace, systematizace, roboty většiny vyhledávačů přinášejí obrovské množství zbytečných hypertextových odkazů,

Zadruhé, nezkušenost uživatelů. hledat a najít to, co je potřeba v hromadě textů na internetu, je dovednost nejen vyhledávače, ale také uživatele, který se ptá.

Zatřetí, chamtivost programátorů a reklamních agentur, které je najímají, aby si jejich stránky vyžádaly co nejčastěji. Tito „chamtiví“ programátoři klamou roboty a rozdávají na internetu web, který údajně obsahuje informace, které uživatel potřebuje, a existují reklamní brožury nebo automatický hypertextový odkaz požadující inzertní web, nebo ještě hůře placený web. I když se specialisté obsluhující vyhledávače s tímto fenoménem potýkají, stále získává každý den rozsáhlé dimenze.

Dnes používá 23% uživatelů internet jako referenci, 15% jako výzkumný nástroj, 14% jako zábava a pouze 12% jako zpravodajský zdroj.

Nezní to optimisticky, že 10% uživatelů vždy a 73% často dokáže najít informace, které potřebují.

Na otázku, který vyhledávač je nejlepší a který nejraději používám, odpovím takto: musíte použít stroj, který je pohodlnější, a pro mě je výhodnější používat Yandex.

Internet usnadnil hledání a vyžadoval specifické znalosti o vyhledávání, dnes to není vždy efektivní, jsme jen na úsvitu jeho vývoje. A proto nezapomeňte na staré neméně efektivní vyhledávání informací, jedná se o knihy a knihovny, tento zdroj informací se ospravedlnil od doby „Alexandrijské knihovny“ a internet bude v blízké budoucnosti efektivnější a bude téměř nenahraditelný.

Seznam použité literatury


1. Andrey Alikberov „Několik slov o tom, jak fungují roboty vyhledávačů“.

# "#"\u003e Je použit jazyk vyhledávače Yandex

Hledání podle fráze

Předpony

Iterativní vyhledávání (ve výsledcích)

Po přihlášení klikněte na Více ...

nahrazení části slova

* (ne vždy správné)


Tabulka 2

Kontingenční tabulka nejlepších vyhledávačů


ndex

Aport!

AltaVista

Oblast hledání, velikost databáze

Ruská část internetu. Prohledávejte stránky webů v sekci katalogu podle regionů. Speciální vyhledávání zpráv, zboží, obrázků.

Ruská část internetu.

Ruská část internetu. Specializované vyhledávání zpráv, produktů, obrázků, MP3

Vyhrazené vyhledávání zpráv, produktů, zábavy, zvuku (MP3) a videa.

Specialized University Search USA, Apple, Linux, BSD

Základní objem na začátku roku 2001

Více než 31 milionů dokumentů

Více než 12 milionů dokumentů

Více než 14 milionů dokumentů

Více než 250 milionů dokumentů

1,25 miliardy stránek

Typ indexování

fulltextové indexování

fulltextové indexování

fulltextové indexování

fulltextové indexování a indexování podle odkazů

Dostupnost dalších služeb

Systém integruje vyhledávač a katalog a také řadu dalších projektů (Bookmarks.Ru, Narod.Ru, systém inteligentního výběru zboží, CY atd.).

Systém integruje vyhledávač, katalog a další služby (online nákupy atd.)

Systém integruje vyhledávač, katalog a řadu dalších služeb (hostování, registrace doménových jmen, překlady atd.)

Systém kombinuje vyhledávač a adresář obsahující 15 sekcí a 1,5 milionu webových stránek.

Hledejte syntaxi jazyka

logické AND

mezera nebo & (ve větě) && (v dokumentu)

AND, &, výchozí mezera mezi slovy

A, AND, &, +, výchozí mezera mezi slovy

AND, & (pouze komplexní vyhledávání)

výchozí pro všechna hledaná slova

logické NEBO

NEBO (výchozí pro jednoduché vyhledávání), | (pouze pro komplexní vyhledávání)

binární operátor NAND

~ (ve větě)

~ ~ (v dokumentu)

nepoužívá

nahrazeno operátorem předpony "-" (AND je výchozí mezera)

A NE ,! (pouze pro komplexní vyhledávání)

nahrazeno operátorem předpony "-"

předpony povinných (+) a zakázaných (-) slov

nepoužívá

+, - (pouze jednoduché vyhledávání)

seskupování slov

nepoužívá

vzdálenost mezi klíčovými slovy ve vyhledávání

/ (n m) - ve slovech, && / (n m) - ve větách (- zpět, + vpřed)

s pokročilým vyhledáváním - vydávání dokumentů pouze s minimální vzdáleností mezi slovy

sl2 (...), c2 (...), w2 (...), (- zpět, + vpřed)

NEAR (do 10 slov, pouze pro komplexní vyhledávání)

nepoužívá

hledání frází

náhradní znaky náhradních slov

* ,? (nahradit libovolný znak)

* (pouze na konci slova)

jazykové omezení dokumentu

volba: libovolná, cyrilice, latinka

volba: libovolná, ruština, angličtina

volba: ruština, angličtina

výběr z 25 jazyků

výběr z 25 jazyků

morfologie

všechna deklinace a konjugace ve výchozím nastavení ,! (hledat přesnou formu slova)

# (všechny tvary slov), @ (kořeny slov)

! (s uvedením normální formy)

vyhledávání podle data

omezit vyhledávání podle polí

Hledání v názvech, adresách, názvech dokumentů (pouze v rozšířeném vyhledávání). Vyhledejte podobné dokumenty.

Rozšířené možnosti formy, kvalita péče

nastavení rozšířeného formuláře

nastavení filtru slovníku, nastavení podle data, podle webu, odkazu, obrázku, zvláštního objektu

podle dokumentu, data a režimů AND, OR, vzdálenosti mezi slovy, zkrácení slova

podle dokumentu, názvu, data obrázku, 5 sekcí (weby, MP3, obrázky, produkty, novinky)

booleovským dotazníkem, datem, webovou stránkou, odkazem, obrázkem, textem atd.

přizpůsobení výstupu výsledků

nastavení počtu výsledků na stránku, výstupní formulář

stanovení formy vydání

nastavení počtu výsledků na stránce, všech prvků výstupního formuláře

nastavení počtu výsledků na stránce, všech prvků výstupního formuláře

hodnocení výsledků vyhledávání

seřadit podle relevance nebo data

podle popularity webu

podle podmínek uvedených v SORT

citací (odkazy na stránku z jiných stránek)

iterativní vyhledávání (ve výsledcích vyhledávání)

Ano. Hotovo zaškrtnutím políčka

Ano. Hotovo s přepínačem rozsahu hledání

Hotovo zaškrtnutím políčka

Hotovo s

sekce kvality pomoci

je zde podrobný popis dotazovacího jazyka, tabulka syntaxe a část o vyhledávání v kategoriích

krátká sekce HELP

podrobný odkaz na dotazovací jazyk, existuje mnoho ruských synonym pro hlavní operátory

největší on-line kurz o dotazovacím jazyce popsaný v této tabulce

velmi omezená sekce HELP

rodinný filtr