Organizace vyhledávání dat na internetu. Organizace vyhledávání informací na internetu

MINISTERSTVO POBOČKY RUSKA

Státní vzdělávací instituce vyššího odborného vzdělávání

"RUŠTINA

STÁTNÍ HUMANITÁRNÍ UNIVERZITA"

Pobočka Ruské státní humanitní univerzity v Petrohradě.

Petrohrad 2011

Úvod 3

1. Internet jako moderní zdroj informací 4

2. Specifičnost informací ve vzdělávací činnosti žáka 6

3. Vlastnosti využití internetu při vyhledávání informací pro vzdělávací činnost žáka 8

Závěr 13

Seznam pramenů a literatury 14

Úvod

Dnes se student bez PC neobejde. Komunikace s počítačem začíná již ve škole, kde žáci ovládají základy výpočetní techniky, seznamují se s výukovými internetovými weby. Zpravidla při nástupu na vysokou školu mnoho uchazečů již dobře zná počítač a většina jej má doma.

Aby si studenti usnadnili proces učení, často se uchylují k používání internetu, stahování abstrakt a esejí. Takový přístup k třídám se zatím může vymstít. Studium na vysoké škole však předpokládá serióznější přístup a vyžaduje zvládnutí různých specifických věd. Internet v tomto smyslu již není spolehlivým zdrojem informací a v jistém smyslu je zcela škodlivý.

Moderní internet má mnoho sociálních a kulturních aspektů, je univerzálním informačním médiem. V tomto ohledu je aktuální problematika internetu jako zdroje informací ve vzdělávací činnosti studenta.

Úkoly práce jsou:

    Popište internet jako moderní zdroj informací.

    Odhalit specifika informací ve vzdělávací činnosti žáka.

    Zvažte zvláštnosti používání internetu při vyhledávání informací pro vzdělávací aktivity žáka.

1. Internet jako moderní zdroj informací

Podle webu wikipedia.org: Internet (vyslovujte [Internet]; anglicky Internet) je celosvětový systém propojených počítačových sítí, postavený na použití protokolu IP a směrování datových paketů. Internet tvoří globální informační prostor, slouží jako fyzická základna pro World Wide Web a mnoho dalších systémů (protokolů) pro přenos dat. Často označované jako „ Celosvětová síť"A" Globální síť ". V každodenním životě se někdy říká „internet“ 1.

V dnešní době, kdy se slovo „internet“ používá v každodenním životě, nejčastěji znamená World Wide Web a informace v něm dostupné, nikoli samotnou fyzickou síť.

Internet se dnes stává jedním z hlavních zdrojů informací díky obrovskému množství dat umístěných v síti a možnosti snadného přístupu k nim. Vyhledávání v síti zároveň získává stále praktičtější hodnotu, protože s rychlým nárůstem množství dostupných dat je postup hledání potřebných informací stále složitější 2.

Síť obsahuje obrovské množství informačních zdrojů. Podle některých odhadů počet dokumentů přesáhl 65 milionů a nadále rychle roste 3. Takový objem informací vyžaduje správnou organizaci procesu vyhledávání a použití speciálních technologických nástrojů, jako jsou vyhledávače. Prosté vyhledávání podle klíčového slova obvykle vynese od desítek tisíc až po několik milionů odkazů, je zřejmé, že pracovat s takovým množstvím dokumentů je prakticky nemožné, tedy obsahuje informace nepodstatné.

Kromě problému vyhledávání je zde problém spolehlivosti informací na internetu. Snadný přístup a zveřejňování údajů umožňuje snadno šířit chybné a často záměrně nepravdivé informace 4.

Tyto dva problémy: vyhledávání a spolehlivost určují specifika internetu jako zdroje informací.

2. Specifičnost informací ve vzdělávací činnosti studenta

Podle webu wikipedia.org: Termín informace pochází z latinského slova informace, což znamená „informace, objasnění, prezentace“ 5.

V současné době se věda snaží najít obecné vlastnosti a vzorce, které jsou pojmu „informace“ vlastní, ale zatím tento pojem zůstává převážně intuitivní a dostává různé sémantické obsahy v různých odvětvích lidské činnosti.

V každodenním životě jsou informace jakékoli údaje nebo informace, které někoho zajímají, například zpráva o jakýchkoli událostech, o něčí činnosti atd. Informovat v tomto smyslu znamená sdělit něco dříve neznámého.

Informace - informace o objektech a jevech prostředí, jejich parametrech, vlastnostech a stavu, které snižují dosavadní míru nejistoty o nich, neúplnost znalostí 6.

Jedna a ta samá informační zpráva (článek v novinách, oznámení, dopis, telegram, nápověda, příběh, kresba, rozhlasové vysílání atd.) může obsahovat různé množství informací pro různé lidi v závislosti na jejich nashromážděných znalostech, na úrovni porozumění. tato zpráva a zájem o ni 7.

Na základě výše uvedeného můžeme konstatovat, že informace ve vzdělávací činnosti žáka by měly mít řadu specifických rysů.

1. Informace by měly odpovídat stupni připravenosti studenta, úrovni jeho znalostí. Příliš vysoká obtížnost snižuje stravitelnost a snižuje motivaci studentů. Příliš nízká úroveň – snižuje informační obsah a negativně ovlivňuje efektivitu procesu učení.

2. Informace používané studentem musí být aktuální, tzn. odpovídají moderní úrovni vědeckého poznání a rozvoji společnosti.

3. Informace použité studentem musí být přesné.

4. Informace by měly být dostupné z hlediska katalogizace a vyhledávání.

3. Vlastnosti využití internetu při vyhledávání informací pro vzdělávací činnost žáka

Moderní student, vyzbrojený osobním počítačem, dobře ví, co a kde na internetu. Docela suverénně získává na internetu vše, co potřebuje k vytvoření další povinné tvorby: esej, esej, projekt kurzu, diplom atd. A po malé revizi, která často spočívá pouze v uvedení svého jména a čísla skupiny, po vytištění na tiskárně předá „svou práci“ učiteli 8.

Jeho lenost se přitom mnohonásobně zvyšuje a tento přístup snižuje pravděpodobnost úspěchu v budoucí kariéře. Stojí za zmínku, že praktika podvádění, která je v podstatě plagiátem, je v Rusku mnohem běžnější než na Západě, což snižuje šance na získání prestižní práce v konkurenci absolventů západních univerzit.

Chcete-li dosáhnout úspěchu v soutěži, měli byste se naučit zpracovávat kolosální množství informací, umět si prohlížet ukázky písemných prací, všímat si jejich silných a slabých stránek, snažit se „rozpitvat“ cizí text, abyste od sebe izolovali nejvýznamnější část. to. Na základě výsledné kostry by se měl student naučit, jak požadované dílo vytvořit. Tato práce byla v podstatě prováděna v knihovnách s knihami před boomem internetu 9. Důležitá je zde i práce učitele, který by měl studenta kompetentně vést, nezakazovat používání internetu, ale upozorňovat na možná úskalí a dávat návod, jak jej používat. Například pro zúžení okruhu vyhledávání může učitel poradit určité informační zdroje, čímž zajistí přizpůsobení výukového materiálu přípravě žáka, navíc učitel pomůže odfiltrovat nepravdivé a nesprávné informace.

V moderní informační společnosti se zvyšuje role učitele. Například učitelé "staré školy" mohou léta číst stejné přednášky a vůbec je nezajímají nejnovější úspěchy v tomto odvětví, oboru činnosti. Navíc student s jakýmkoli mobilním zařízením připojeným k internetu může zmást každého učitele. Učitel již není vnímán jako jediný zdroj poznání. Student s internetem může kdykoli učitele opravit, kritizovat a postavit se proti neřešitelné otázce. Učitel na to musí být připraven, to je výzva moderní společnosti modernímu vzdělávacímu systému. Učitel by se neměl zlobit, vyhýbat se odpovědi nebo skládat odpověď za pochodu. Jestliže dříve byl vztah učitel-žák postaven na principu senior-junior, nyní by měl být blíže principu internetu: peer-to-peer.

Existuje ještě jedno nebezpečí, které v sobě drží mobilitu internetu, a to nedostatek potřeby si cokoliv zapamatovat. za co? Pokud se můžete vždy zeptat Yandex. Aby student nespadl do této pasti, musí splnit všechny úkoly zrádce, nebýt líný, zapisovat, pamatovat, učit. Právě zavazadlo znalostí v lidské paměti tvoří jeho obecnou erudici a schopnost řešit aplikované problémy v dané tematické oblasti. Extrémní míra tohoto efektu mobility spočívá v tom, že si student při setkání s neznámým pojmem říká: „Na význam tohoto pojmu se mohu kdykoliv podívat na internetu. Teď nemám čas, podívám se později “- takto vznikají mezery ve vzdělání. Před érou internetu by si student myslel jinak: „Význam tohoto pojmu si mohu vyhledat ve slovníku (učebnici, encyklopedii, ...). Teď nemám čas, ale budu se muset podívat na význam tohoto termínu a zapamatovat si ho, protože nemůžu pořád chodit se slovníkem."

Z hlediska sebevzdělávání se student a vlastně celá společnost potýká s problémem informační krize 10. Informační krize spočívá v rozporuplné jednotě „informačního hladu“ a „informační exploze“, tedy v nedostatku informací v podmínkách jejich nadprodukce 11. Množství informací o určité oblasti lidské činnosti přesahuje kapacitu lidského mozku 12. Zvyšuje se tedy potřeba systematizace informací a filtrování informačního šumu. Žák by měl používat důvěryhodné zdroje doporučené učitelem, uvedené v bibliografii učebnice.

Rychlost růstu informací je měřitelná. Knihovník R. Barton a fyzik R. Kebler z USA představili pojem „poločas rozpadu“ vědecké články analogicky s poločasem rozpadu radioaktivních látek. Poločas publikace je doba, během níž byla vydána polovina veškeré aktuálně používané literatury o daném odvětví nebo tématu 13. Pokud je například poločas rozpadu publikace ve fyzice 4,6 roku, pak to znamená, že 50 % všech aktuálně používaných (citovaných) publikací v této oblasti není starších než 4,6 let. I když taková definice poskytuje číselné hodnocení stárnutí informací, je třeba s takovým hodnocením zacházet opatrně a v konečném světle si každý specialista sám určuje hloubku a míru preskripce, kterou v každém konkrétním případě potřebuje 14. Pro studenta míra relevance informací pomůže určit vedoucího práce.

Dalším rysem informací na internetu je jejich rozptýlení po souboru zdrojů – Bradfordův zákon 15. Zjednodušeně to lze formulovat následovně: 1/3 vědeckých článků na konkrétní téma bude publikováno v malém počtu zdrojů přímo souvisejících s tímto tématem. Další třetina bude publikována ve více zdrojích souvisejících s tímto tématem. A poslední třetina bude zveřejněna ve zdrojích, které s tématem nemají nic společného a poměr počtu zdrojů v těchto zónách podle Bradforda je stejný. S ohledem na tento vzorec je třeba poznamenat, že dosažení úplného informačního obsahu o konkrétním tématu je nemožné, pokud je výzkumník omezen na řadu zdrojů k této problematice, aniž by se uchýlil k pomoci speciálních informačních, servisních a bibliografických služeb. Ve většině případů bude studentovi stačit první třetina, ale pro hlubší práci, jako je ročníková práce v odborných oborech, diplomová práce, musí student hledat pomoc v tomto druhu elektronických katalogů.

Navzdory tomu, že svoboda přístupu uživatelů internetu k informační zdroje není omezen státními hranicemi, ale jazykové hranice jsou zachovány. Převládajícím jazykem internetu je angličtina. Druhým nejoblíbenějším jazykem je čínština a třetím nejoblíbenějším je španělština. Ruský jazyk je na 9. místě 16. V tomto ohledu se student, který mluví cizími jazyky, především anglicky, dostane k mnohem většímu množství informací. Hovoříme-li o dělení informací na internetu, stojí za zmínku, že informace o různých oblastech lidské činnosti nejsou z hlediska objemu prezentovány rovnoměrně. Na internetu je více technických informací týkajících se programování, informačních technologií, počítačového designu a méně informací týkajících se humanitních věd. To lze vysvětlit tím, že techničtí specialisté jsou tak či onak spjati s informačními technologiemi a internetem povahou své práce, a proto je počet materiálů, které publikují, vyšší.

Závěr

Shrneme-li uvažované aspekty internetu jako zdroje informací ve vzdělávacích aktivitách studenta, můžeme vyzdvihnout hlavní klíčové vlastnosti a doporučení.

    Žák musí umět používat internet a zároveň se neustále zdokonalovat v používání internetu.

    Student by si měl na základě informací na internetu ověřit míru jejich spolehlivosti a relevance.

    Pro vyhledávání informací k danému tématu je vhodné využívat specializované elektronické bibliografické katalogy.

    Pro zvýšení efektivity používání internetu by si měl student zlepšit angličtinu jako nejrozšířenější jazyk na internetu.

    Při reakci na výzvy informační společnosti musí být student schopen zpracovat velké množství dat, extrahovat z nich klíčové informace a odfiltrovat nadbytečná a nepotřebná data.

    Internet poskytuje nejen skvělé příležitosti pro získávání informací, ale také plné nebezpečí v podobě cheat sheetu, který často dělá medvědí službu v procesu učení.

Je třeba si uvědomit, že podle bodů 2 a 3 musí student pracovat v přímém kontaktu se svým vedoucím.

Seznam pramenů a literatury

Literatura

    Blumenau, V. I. Informační a informační služba. / DI Blumenau. - L .: Nauka, 1989. - 192 s.

    Galeeva, IS Internet jako nástroj pro bibliografické vyhledávání / IS Galeeva; vědecký. vyd. M.I. Vershinin. - SPb .: Professiya, 2007 .-- 248 s.

    Efimov, A. N. Informační exploze: skutečné a imaginární problémy / A. N. Efimov. - M .: Nauka, 1985 .-- 160 s.

    Hledání informací na internetu: učebnice. příspěvek / V. I. Averčenkov, V. V. Miroshnikov, S. M. Roshchin a další,; Bryan. Stát tech. un-t. - Bryansk, 2001. - 28 s.

    Kuzin, F.A. Příručka pro postgraduální studenty a uchazeče o zaměstnání uch. Stupně / F.A.Kuzin. -. - M .: Os-89, 1999 .-- 208 s.

    Kuzněcov I. N. Internet ve vzdělávací a vědecké práci: Praktický průvodce. - 2. vyd. - M .: Vydavatelská a obchodní společnost "Dashkov and Co", 2005. - 192 s.

    Kuzněcov I. N. Učebnice o informační a analytické práci. M .: Yauza, 2001 .-- 320 s.

    Michajlov, O. A. Novinka v internetovém vyhledávání podle zdrojů roku 2000 / O. A. Michajlov; Vyrůst. Stát oblouk. vědecké a technické dokumentace. - M .: Max Press, 2001 .-- 171 s.

    Parshukova GB Metody vyhledávání odborných informací: studijní příručka. Manuál / G.B. Parshukova.- SPb.: Professiya, 2009. - 224 s.

    Solomenchuk V.G. Internet: Krátký kurz. SPb .: Petr, 2001 - 322 s.

Internetové zdroje

    URL: Internet

    URL: http://ru.wikipedia.org/wiki/Information

1 URL: http://ru.wikipedia.org/wiki/Internet

Účel práce: studovat principy organizace vyhledávání v Internetové sítě a získání praktických dovedností při psaní vyhledávacích dotazů.

2.1 Jednoduché techniky vyhledáváníWeb-stránky

Jednoduché vyhledávací techniky neznamenají použití výkonných vyhledávacích schopností internetu a jsou založeny na znalosti principů tvorby symbolických doménových jmen a intuici.

Hledat komerčníWeb-stránky. Chcete-li získat adresu, kterou hledáte, můžete k názvu firmy, podniku, organizace přidat doménu nebo jednoduché anglické podstatné jméno (klíčové slovo). com, předcházet www. Webové stránky s doménou nejvyšší úrovně v adrese. com., nejčastěji obsahují informace v angličtině.

Příklad 1 Vezměme název společnosti SONY, přidáme doménu. com a před www. - získat adresu webové stránky SONY: www. Sony. com... Podobně můžete získat:

www. cnn. com- CNN World News;

www. mtv. com- hudební zprávy MTV;

www.- časopis COSMOPOLITAN.

Pokud zadáte klíčové slovo adresní řádek Internet Badatel a stiskněte Ctrl+ Vstupte, pak se prohlížeč pokusí přejít na přesnou adresu URL, přičemž automaticky přidá název protokolu a webovou značku, například http: // www. a doména nejvyšší úrovně. com. Pokud například do adresního řádku napíšete mě a stisknete Ctrl-Enter, pak prohlížeč Internet Badatel se pokusí otevřít webovou stránku s adresou http:// www. . com... Pokud se uzel neotevře, pak neexistuje.

Vyhledávání podle regionů. Pro Rusko a další regiony platí výše uvedená metoda. PROTI tento případ doména nejvyšší úrovně regionu (dvoupísmenný kód země) je připojena ke klíčovému slovu, aby poskytla adresu webové stránky. Chcete-li například hledat ruské servery, můžete zkusit přidat doménu ke klíčovému slovu. ru.

Příklad 2. Je známo, že má server www. audi. com... Můžete zkusit najít její pobočku v Rusku nahrazením domény. com do domény. ru, - www. audi. ru.

Vyhledávání velkých vzdělávacích institucí. Doména se přidává k názvu nebo zkratce instituce. edu (hlavně pro americké a evropské regiony), který obvykle uvádí správnou adresu.

Příklad 3. Vezměme univerzitu OXFORD, přidáme doménu. edu a před www. - získat adresu webové stránky univerzity OXFORD: www. Oxford. edu... V adrese školního webu často chybí doména. edu. Registrovanou doménou druhé úrovně (nebo doménovým aliasem) může být zkrácený anglický název vzdělávací instituce. Chcete-li hledat ruskou vzdělávací instituci, můžete to vzít anglická zkratka, například MSU (Moscow State University), přidejte doménu. ru - www. msu. ru- Moskevská státní univerzita pojmenovaná po.

Adresa URL webové stránky často obsahuje Doménové jméno poskytovatel internetových služeb, na jehož počítači je tato webová stránka nainstalována, např. www. kgtu. runnet. ru- adresa Krasnojarské státní technické univerzity, kde ***** je název domény poskytovatele internetových služeb.

Mnoho zemí má registrovanou doménu druhé úrovně pro vzdělávací instituce. Například pro Spojené království je to doména AC (akademická). Každá webová stránka může mít několik aliasových adres, při jejichž přístupu se uživatel dostane na stejnou webovou stránku. Například pro OXFORD University jsou to adresy www. vůl. ac. Spojené království a www. Oxford. edu.

Jiné hledáníWeb-stránky. Můžete manipulovat s klíčovými slovy a doménami nejvyšší úrovně, abyste našli vládní (.gov), vojenské (.mil) a další organizace (.org). Například adresa Bílého domu vlády USA je: www. Bílý dům. vlád.

2.2 Webové vyhledávačeInternet

PROTI Internet disponuje výkonnými nástroji pro vyhledávání jakýchkoli informací: dokumentů, obrázků, programů, webových stránek atd. Vyhledávání probíhá v tzv. vyhledávače, které se také nazývají vyhledávací programy, vyhledávače, vyhledávače. Na internetu je mnoho vyhledávačů. Nejznámější systémy vyhledávání informací jsou uvedeny v tabulce 2.1. Na webové stránce je k dispozici seznam odkazů na různé vyhledávače www. mnich. nová pošta. ru.

Tabulka 2.1 – Nejoblíbenější vyhledávače

Název vyhledávače

Adresa

Yandex (ruština)

http://www. *****

Rambler (ruština)

http://www *****

Aport (rusky mluvící)

http: // w w w. *****

Yahoo! (anglicky mluvící)

AltaVista (anglicky)

Google (ruština)

http://www. *****

Vyhledávací systém implementována jako webová stránka s běžnou adresou, která obsahuje tzv vyhledávací řetězec a tlačítko Vyhledávání (Vyhledávání), a může také obsahovat katalog tematických zdrojů, odkazy na oblíbené stránky atd.

Chcete-li zavolat vyhledávač, musíte zadat jeho adresu do adresního řádku internetového prohlížeče. Po načtení vyhledávače do vyhledávacího pole musíte zadat poptávka (dotaz), což je řetězec textu (v libovolném jazyce) – klíčová fráze dokumentů, které na internetu hledáte, a klikněte na tlačítko Vyhledávání. Více efektivní vyhledávání je nutné, aby dotaz obsahoval slova nebo slovní spojení, které se bude na hledané webové stránce nebo ve hledaném dokumentu nacházet (je potřeba je „uhádnout“). Po chvíli se zobrazí obrazovka seznam adresWeb- stránky, obsahující odkazy na dokumenty, které hledáte, které jsou zpravidla doprovázeny komentáři. Kliknutím na odkaz můžete přejít na kterýkoli z nalezených dokumentů.

Chcete-li přejít na další stránku seznamu nalezených dokumentů, musíte kliknout na odpovídající číslo (1, 2, 3, ...) v hlavním okně s výsledkem hledání. Dokumenty z první desítky nalezených obvykle odpovídají dotazu co nejpřesněji.

Základem každého vyhledávače je speciální program - síťový robot nebo pavouk (Pavouk), někdy najdete jména červ (červ),crawler (liána). Vyhledávač rozesílá na internet takové „pavouky“, že maximální částka(pokud je to možné) poskytnutých na internetových stránkách a poté zaregistrovat jejich adresu (URL) a obsah ve své databázi. Poté, co uživatel zadá dotaz a klikne na tlačítko Vyhledávánívyhledávací systém prohledá databázi a zobrazí výsledek hledání.

Téměř všechny vyhledávače navíc umožňují zaregistrovat uživatelskou stránku na internetu. Chcete-li to provést, na stránce velkého vyhledávače, například YAHOO!, musíte vyvolat režim registrace a zadat adresu URL a popis své stránky. Vyhledávač dále rozešle vaše registrační údaje na všechny ostatní hlavní vyhledávací stránky, ty zase na další atd. Existují také globální registrační servery.

Vyhledávání adresářů jsou dostupné např. na vyhledávačích Rambler, Yahoo !, AltaVista atd. Pro vyhledávání v katalogu je potřeba vybírat témata myší, prohlubovat a zužovat rozsah vyhledávání, dokud se seznam zobrazených odkazů nezmenší na několik stránek které lze procházet ručně nebo do dostatečně velké skupiny, ve které lze provádět běžné vyhledávání (například ve vyhledávači Yapeeh: Studujte vysokoškolské vzdělání Moskevská státní univerzita).

2.3 Pravidla pro provádění dotazů ve vyhledávačích

Při provádění dotazů existují určitá pravidla, která se mohou v různých vyhledávačích částečně lišit, ale základní akce jsou podobné. Pravidla pro provádění dotazů naleznete vždy na webové stránce konkrétního vyhledávače v sekci Pomoc(tato sekce se může nazývat Pomoc, Jak hledat, Tipy pro vyhledávání, Pravidla dotazování atd.). Pravidla požadavku obvykle zahrnují použití dotazovací jazyk pro pokročilé vyhledávání.

Nejjednodušším pravidlem, které existuje pro všechny vyhledávače, je zadat jakoukoli frázi a kliknout Vyhledávání.

V další části se podíváme na některá pravidla pro provádění dotazů na příkladu Yandexu. Mnoho z těchto pravidel platí i pro jiné vyhledávače. Příklady dotazů jsou převzaty ze stránek nápovědy vyhledávače Yandex.

2.4 Příklady jednoduchých dotazů ve vyhledávači Yandex

Dotaz je obvykle tvořen pouze jedním nebo více klíčovými slovy, například: firemní mikroprocesoryIntel. Pro takovou žádost existují dokumenty, ve kterých se nacházejí všechna slova žádosti. Některá slova v žádosti jsou ignorována (spojky, předložky atd.), protože nemají sémantický význam. Například na požádání jablka ve sněhu budou nalezeny všechny dokumenty, které obsahují dvě slova současně: „jablko“ a „sníh“ (pořadí jejich zobrazení v seznamu se však bude lišit). Kde se slova v dokumentu nacházejí, v jaké gramatické formě se nacházejí - na tom nezáleží. Záminka na ignorován. Proto lze výše uvedený dotaz napsat takto: sníh na jablku. Výsledek hledání bude stejný.

Důležitá a velmi užitečná vlastnost vyhledávačů: bez ohledu na to, v jakém gramatickém tvaru napíšete slovo do dotazu, je v dokumentech ve všech podobách. Například na požádání muž chodil mimo jiné budou nalezeny dokumenty obsahující text „lidé přicházejí“. U běžných ruských slov funguje rozpoznávání všech tvarů. U exotických slov, neologismů atd. se neprovádí.

Operátory Yandex, jejich účel a příklady použití naleznete v části nápovědy systému.

K vizuálnímu vytváření složitých dotazů můžete použít možnosti pokročilého vyhledávání na stránce Rozšířené vyhledávání.

1. Podívejte se na teoretické informace.

2. Vytvořte webovou adresu světoznámé společnosti (Intel, IBM, Sony atd.) a otevřete ji v Internet Badatel. Uložte nalezené webové stránky do samostatné složky.

3. Stejnou technikou jeďte do Petrohradu státní univerzita a stejným způsobem otevřít webovou stránku katedry aplikované matematiky téže univerzity. Uložte nalezené webové stránky do samostatné složky.

4. V každém vyhledávači (tabulka 2.1) proveďte několik dotazů týkajících se problémů, které vás zajímají, a otevřete nalezené dokumenty.

5. Zkuste prohledat tematické adresáře.

6. Pomocí pokročilého vyhledávání na Yandexu porovnejte popularitu následujících stránek podle počtu stránek, které na ně odkazují: Prezident a vláda Ruská Federace; Moskevská státní univerzita a St. Petersburgská státní univerzita; Ermitáž a Louvre. Uložte nalezené webové stránky do samostatné složky. Vytvořit textový soubor, kde zaznamenejte počet odkazů na každý z nich.

7. Najděte informace o tom, kdy a kde jste se narodili. Uveďte jeho díla. Najděte jeho fotografie v různých letech jeho života. Uložte všechny informace do samostatné složky.

8. Vyhledávání informací na internetu k vybranému tématu seminární práce. Na základě výsledků vyhledávání vytvořte v textový editor Slovní tabulka podle vzoru (tabulka 2.3) a vyplňte ji.

Tabulka 2.3 – Ukázka zprávy o výsledcích vyhledávání

a / a

Charakteristika výsledků vyhledávání

URL nalezeného zdroje

Stručný popis zdroj

9. Pozvěte učitele na zprávu o pokroku.

10. Odstraňte soubory uložené během práce z pracovní složky.

2.6 Testové otázky

1. Popište jednoduché techniky vyhledávání informací na internetu.

2. Jaké jsou principy internetových vyhledávačů?

3. Formulujte základní pravidla pro skládání vyhledávacích dotazů.

4. Které z vyhledávačů, o kterých jste uvažovali, mají schopnost používat dotazovací jazyk?

5. Které z vyhledávačů, o kterých jste uvažovali, mají tematický katalog zdrojů?

6. Které z vyhledávačů, o kterých jste uvažovali, mají možnosti vyhledávání v různých kategoriích informačních zdrojů?

Kdo vlastní informace, vlastní svět. Pro asistenta manažera není touha mít určité znalosti diktována marnivostí nebo nápady dobýt svět, ale nejčastěji profesní nutností. Schopnost získávat užitečná data je nepochybně jedním z klíčových v práci osobního asistenta, protože ne vždy pravdivé nebo potřebné informace leží na povrchu.

Co je důvěrnost informací?

Podle odstavce 7 Čl. 2 federálního zákona ze dne 27.07.2006 č. 149-FZ "O informaci, informační technologie a o ochraně informací "(ve znění ze dne 24. listopadu 2014) důvěrnost informací – povinný požadavek na osobu, která získala přístup k určitým informacím, aby tyto informace nepředávala třetím stranám bez souhlasu jejich vlastníka... Dalším pojmem důvěrnosti je nepřístupnost informací určitému okruhu uživatelů. Tak či onak se jedná o informace, které jsou předávány pouze podle určitých pravidel stanovených jejich nositelem práv, ať už jde o právnickou osobu (organizaci) nebo fyzickou osobu (běžného občana, který nás z nějakého důvodu začal zajímat). Důvěrnost tedy na jedné straně poskytuje ochranu držiteli autorských práv k informacím a na druhé straně vytváří překážky pro ty, kteří mají zájem se k nim dostat.

Informační hádanka

Jednou ze speciálních vlastností informace je, že „žije“; přenášeny tak či onak pomocí různé metody a nástroje. Z tohoto důvodu dokonce důvěrná informace, který je často nemožné získat podáním oficiální žádosti, se objevuje ve veřejném vlastnictví kvůli nedbalosti držitele autorských práv nebo nedbalému přístupu k jeho datům. Dnes s ohledem na aktivní používání moderní technická zařízení, stejně jako internet, nejčastěji jsou v internetovém prostoru chaoticky rozházeny střípky mozaiky z obecného informačního obrázku jeho nositele autorských práv. Abyste skryli data, musíte to udělat cíleně, navíc musíte mít určité dovednosti a schopnosti. A navíc, napadlo by někoho, že by někoho napadlo provést informační šetření o jeho osobě nebo organizaci?

Stručně řečeno, aby asistent manažera získal potřebné informace, potřebuje mít pouze přístup k internetu, provádět potřebné dotazy, sbírat data a plně využívat své analytické schopnosti.

Špionážní motivy

Nedostatek informací je hlavním motivem doplňování informační zásoby. Je známo, že akce prováděné v podmínkách nedostatku informací mohou vést k nepříjemným následkům. Stanovení cílů v „informačním šetření“ hraje důležitou roli na jedné straně při stanovení očekávaného výsledku, na druhé straně při volbě zdrojů pro nalezení potřebných dat. V profesní činnosti může asistent manažera dostávat od svých nadřízených různé pokyny týkající se vyhledávání jakýchkoliv informací. Jejich seznam je individuální a jeho hranice jsou pravděpodobně neomezené. Je však možné identifikovat hlavní situace, pro jejichž řešení bude pro asistenta manažera užitečné uchýlit se ke sběru dalších informací.

  • Rozhovor. Změna zaměstnání a hledání nového vyžaduje zodpovědnost a pečlivou analýzu získaných dat o zaměstnavateli. Stává se, že podle výsledků jedné nebo více fází rozhovoru není dostatek údajů pro informované rozhodnutí „pro“ nebo „proti“. Nebo kvůli tomu, že zaměstnavatel nedodal potřebné materiály kvůli nedostatku času nebo jim prostě nepřikládal důležitost, nebo kvůli touze je záměrně skrývat. V každém případě je nepravděpodobné, že by zástupci společnosti byli připraveni během pohovoru upřímně odpovídat na „delikátní“ soukromé otázky, například na otázky týkající se zpoždění platů, fluktuace zaměstnanců nebo souvisejících otázek. běžné problémy V organizaci.

Pokud jsou k dispozici prvotní údaje, doporučuje se asistentovi manažera, aby si před pohovorem našel co nejvíce užitečných informací o společnosti: na jedné straně zajistit a klást potřebné otázky, na druhé straně být schopen prokázat profesionalitu a předvést povědomí a připravenost na setkání.

  • Odborné úkoly.Činnost moderních organizací je nevyhnutelně spojena se vzájemnou spoluprací. Každá firma má partnery, zákazníky, dodavatele atd. Právník tedy například před uzavřením smlouvy s určitou společností o dodávkách produktů nebo poskytování služeb požádá o ověření potřebného balíku dokumentů obsahujícího minimální nebo maximální úplný seznam – v závislosti na požadavcích vaší organizace na protistrany. Ne vždy advokát firmy prověřuje, v některých případech to za své nadřízené dělá asistent manažera. Zjišťování informací o nové firmě nebo jejím vedení proto může být součástí povinností osobního asistenta.
  • Osobní a profesní kontakty. Asistent manažera denně komunikuje s velkým množstvím lidí (kolegové, dodavatelé, noví známí v práci nebo v soukromém životě). Jsou chvíle, kdy je z nějakého důvodu nutné shromáždit další informace o osobě, například při přijímání nového zaměstnance: s kým dříve pracoval, jaké je jeho hobby, existují nějaké nedostatky v profesní biografii atd. . Poměrně osobní kontakty další znalosti také nebudou zbytečné, protože ve většině případů mají lidé tendenci skrývat osobní informace o sobě (v nejlepším případě - kvůli prostému lidskému podezření, v horším případě - když je skutečně co skrývat).

Ve velkých organizacích, tzv. bezpečnostní služba. Zabývá se profesionálním vyhledáváním veškerých informací o jednotlivcích či organizacích, pokud je to nutné pro zajištění obchodní, ekonomické, průmyslové bezpečnosti firmy. Specialisté této služby mají zpravidla k dispozici vlastní zdroje pro dotazy a sběr dat. Pokud má vaše organizace bezpečnostní službu, doporučuje se obrátit se na její specialisty a získat potřebné informace ze spolehlivých zdrojů.

Počáteční údaje

Při provádění „šetření informací“ nejsou žádné podrobnosti „malé“ nebo nadbytečné. V podmínkách nedostatku informací je navíc jakýkoli informační „háček“ nezbytným vodítkem k nalezení užitečných dat krok za krokem. „Háčky“ pro vyhledání potřebných materiálů v internetovém prostoru jsou správně formulované dotazy a také jakákoliv počáteční data, která asistent manažera aktuálně má. K zahájení pátrání vám budou stačit na první pohled „nejskromnější“ novinky.

Žádost o název organizace:

  • poskytne informace o názvu webových stránek společnosti;
  • vám umožní získat kontaktní údaje;
  • bude poskytovat výsledky vyhledávání na základě údajů ze zpravodajských a reklamních zdrojů;
  • poskytne informace o oboru činnosti, registračních údajích, lokalitě atd.

Žádost o celé jméno vedoucí organizace nebo soukromé osoby:

  • pomoci získat informace o názvu společnosti a oboru činnosti;
  • umožní vám seznámit se s informacemi o reklamě, obchodu, zpravodajských zdrojích;
  • poskytne výsledky vyhledávání pro životopisy, biografie, referenční materiály;
  • poskytne informace o „přítomnosti“ v obchodních a zábavních sociálních sítích atp.

Vyžádejte si firemní telefonní číslo nebo číslo mobilní telefon:

  • vám umožní získat informace o společnosti, pokud se jedná o telefonní číslo do kanceláře;
  • poskytne informace o příslušnosti čísla mobilního telefonu k určité oblasti Ruska;
  • poskytne vyhledávací údaje pro inzertní stránky, inzeráty, zveřejněná volná pracovní místa a nabídky organizace nebo jednotlivce atd.

Na poznámku. Uvedená výchozí data lze považovat za základní pro další sběr informací. Výsledky vyhledávání pro zadané dotazy by měly být použity jako data pro následující dotazy. Pokud bylo například zpočátku známo pouze telefonní číslo organizace, pak na základě výsledků takové žádosti můžete získat údaje o názvu organizace a poté informace s údaji o manažerech a zakladatelích.

Podívejme se na příklad vyhledávání informací a jejich použití.

Do vyhledávače zadejte původně známé telefonní číslo. Dostaneme následující výsledek (obr. 1):

Dále podle názvu organizace zadáme následující požadavek a získáme několik stránek s referenčními informacemi o organizacích. V tomto případě se seznamujeme s výsledky na webu rusprofil. ru(obr. 2).

Kdy mohou být tyto informace užitečné?

  • Asistentka manažera dostala pokyn, aby kontaktovala redakci časopisu za účelem zadávání inzerátů;
  • asistent vedoucího je pověřen, aby připravil oficiální dopis adresovaný generální ředitel jméno generálního ředitele však původně nebylo známé;
  • manažer přijal hovor s definicí telefonního čísla a jména kontaktní osoby a asistent byl požádán, aby objasnil, ze které společnosti volali.

Pro dotazy podle jména, telefonního čísla a názvu společnosti vyhledávače zpravidla poskytují mnoho výsledků s odkazy na různé zdroje a stránky. Doporučuje se, aby si asistent manažera pečlivě přečetl referenční materiály a pečlivě odfiltroval užitečná data ze „spamu“ a také věnoval zvláštní pozornost zdroji informací: v tomto případě se oficiální webová stránka organizace ukáže jako více spolehlivější než například reklamní a referenční webový zdroj.

S minimálními počátečními daty a dovednostmi v práci s internetovými vyhledávači tak může asistent manažera najít aktuálně požadované informace nebo získat další data pro další dotazy a pokračování „šetření informací“.

"Elementární Watsone!"

V internetovém prostoru každý z uživatelů tak či onak zanechává své „stopy“ a jím zveřejněné informace mají „ocásky“. Takže při použití dotazů v řádku Google vyhledávání, Yandex nebo jiné vyhledávače, asistent se může seznámit s informacemi:

  • o reklamách umístěných uživatelem na stránkách pro hledání zaměstnání nebo zaměstnanců, soukromých inzerátech na prodej nebo nákup, o poskytovaných nebo požadovaných službách;
  • o zveřejňovaných novinkách organizace nebo o funkcionářích, o účasti na jakýchkoliv obchodních akcích, výstavách, jiných aktivitách společnosti;
  • o vytvořených životopisech a životopisech, mluvíme-li o soukromé osobě;
  • přítomnost v sociálních sítích a skupinách;
  • o recenze produktů firmy nebo recenze firmy jako zaměstnavatele a mnoho dalších. dr.

I v případě, že informace o hledání práce nebo zaměstnanců, zveřejněná oznámení a novinky nejsou relevantní, nejsou vždy držiteli autorských práv smazány - ze zapomnětlivosti nebo pokud jsou zbytečné.

Co a kde hledáme? Jak to používáme?

Podle toho jakou informační úkol je na osobním asistentovi, aby rozhodl (zda shromažďuje nejúplnější informace nebo pouze kontroluje určité údaje o organizaci či jednotlivci), další lze zvolit efektivní metody vyhledávání na internetu. K jejich použití potřebujete také prvotní údaje (postačí informace o názvu firmy, případně kontaktní údaje, případně celé jméno jednatele či soukromé osoby) (viz tabulka).

Typ informace a příklady jejího použití

Typ informace

Příklady použití

Celý název společnosti a její činnosti

Úplný název, organizační a právní forma a úředně registrované druhy vykonávaných činností jsou základními údaji o společnosti. Bude se hodit jak při hledání nového zaměstnání pro sběr dat o zaměstnavateli, tak v práci osobního asistenta pro kontrolu činnosti partnera či protistrany.

Často bezohlední zaměstnanci organizací prezentují své společnosti jako „velké“ nebo dokonce „mezinárodní“, ale ve skutečnosti se ukazuje, že jde o běžné individuální podnikatele, jejichž výčet činností nezahrnuje pracovní místa, na která je vaše společnost plánovala přilákat.

Datum registrace v vládních orgánů

Datum registrace podniku u státních orgánů je důležité, pokud jsou pro vaši organizaci důležité dlouholeté zkušenosti protistrany nebo partnera v určitém oboru.

Pokud vám například společnost sdělila, že je na trhu déle než 10 let, ale ve skutečnosti byla zaregistrována před několika měsíci, může to vyvolat pochybnosti o solidnosti a spolehlivosti společnosti.

Informace o délce provozu podniku budou užitečné jak v profesionální práci asistenta manažera, tak v případě, že je nutné shromáždit nejúplnější údaje o novém zaměstnavateli.

Informace o zakladatelích a vůdcích organizace

Údaje o vedení a zakladatelích společnosti mohou obsahovat údaje o počtu zakladatelů, jejich celé jméno, podíly na účasti, počet jednatelů a jejich celé jméno. Užitečnost těchto dat spočívá v tom, že mohou sloužit jako základ pro následné vyhledávání informací. Takže například s vědomím zakladatelů a manažerů společnosti je nutné provést další žádost o celé jméno. a účast těchto osob na činnosti jiných organizací. Lze tedy pochopit, jak „velcí“ jsou zakladatelé, a pokud jsou jejich podíly velké, je možné, že jsou také investory několika společností. Na základě výsledků vyhledávání můžete jít dále a seznámit se s činností nově nalezených společností - vytvořit si co nejjasnější obrázek o podnikatelské činnosti jejích účastníků.

Navíc lze dodatečně získaná data o zakladatelích a ředitelích analyzovat z různých úhlů pohledu. Pokud jsou například jména v seznamu osob stejná, jedná se pravděpodobně o rodinnou firmu. Pokud se setkáte se jmény zahraničních osob, je možné, že společnost má spojení se zahraničními partnery nebo mateřskými organizacemi.

Firemní adresy a telefony

Potřebu kontaktních informací je těžké přeceňovat. Plní svou hlavní roli: poskytují možnost kontaktu s organizací nebo jejími jednotlivými zaměstnanci. Někdy však má smysl dodatečně se dotázat na adresu a telefonní čísla organizace.

Stává se, že na stejné adrese společnosti může sídlit několik právnických osob. Často se jedná jak o dceřiné společnosti, tak o třetí strany. K registraci na stejné adrese navíc často sahají bezohledné organizace, které nemají prostředky na pronájem plnohodnotné kanceláře. Poté se za určitých podmínek zakoupí legální adresa, ale ve skutečnosti se společnost na uvedené adrese nenachází.

Na žádost asistenta manažera se v různých „odpovědích“ vyhledávače může objevit telefonní číslo společnosti. Výsledky je nutné pečlivě číst, abyste pochopili, zda obsahují informace např. o zadání telefonní číslo na černé listiny zaměstnavatelů atd.

Adresa oficiálních webových stránek společnosti

Adresa oficiálních webových stránek společnosti je velmi informativním zdrojem:

  • pokud organizace nemá webové stránky, pak společnost pravděpodobně nemá prostředky na jejich vytvoření, nebo vznikly relativně nedávno;
  • množství informací poskytovaných společností záležitosti: přítomnost či nepřítomnost údajů o manažerech, zaměstnancích, novinkách, informacích o partnerech či zákaznících atd.;
  • datum vytvoření stránky a její rozhraní uvádí, kdy byla stránka vytvořena a jak byla profesionální, technicky a designově;
  • přítomnost nebo nepřítomnost kontaktních údajů (viz výše);
  • adresa domény webu obsahuje další informace, s jejichž pomocí existuje možnost dodatečného ověření

Velikost základního kapitálu společnosti

Velký význam má velikost základního kapitálu organizace. Existuje minimální výše základního kapitálu a mnoho společností se na něj při registraci omezuje. Pokud však společnost dodává vaší společnosti produkty nebo poskytuje služby za částku, která je desítky nebo stovkykrát vyšší, než je její autorizovaný kapitál, stojí za to pamatovat na to, že v případě nekalé práce nebo dodávky vaše organizace obdrží pouze to, co je v fond společnosti.

Dluhy vůči finančním úřadům

Údaj o absenci dluhů je pouze plusem a hovoří o firmě jako o svědomitém daňovém poplatníkovi. Je však třeba vzít v úvahu existenci dluhů vůči finančním úřadům a také výši těchto dluhů.

Při žádosti o zaměstnání bude užitečné vědět, zda má společnost dluhy vůči Penzijnímu fondu.

Když firma spolupracuje jako protistrana nebo partner, dluhy se mohou stát indikátorem jejího neférového obchodního přístupu nebo ztrátové pozice.

Účast v soudních sporech

Informace o účasti na soudním jednání jsou důležité, je však nutné se s jejich obsahem seznámit. Jedna věc je neplacení pokut za nesprávné parkování služebního auta, druhá pracovněprávní spory či jiné závažné případy. Je také důležité zvážit, zda společnost vystupovala jako žalobce nebo žalovaný.

Diskvalifikace funkcionáře

Stává se, že funkcionáři organizací, ať už jsou to manažeři nebo jiní funkcionáři, jsou v souladu se zákonem diskvalifikováni u soudu. Tyto informace budou užitečné při analýze nových partnerských společností nebo při ucházení se o zaměstnání. To je důležité zejména pro asistenta manažera, jehož práce přímo souvisí s odbornou činností šéfů.

Adresa E-mailem kontaktní osoba

Podle e-mailové adresy organizace nebo jejího zaměstnance lze posoudit její „solidnost“. V moderních organizacích je zpravidla obvyklé používat firemní emailová adresa hostované na jejich doménách (adresa domény za znakem @), aby bylo možné informační bezpečnost a indikátorem konkrétní firemní kultury. Pokud je adresa společnosti na veřejném serveru, například mail.ru nebo yandex.ru, pak má smysl ji dodatečně zkontrolovat zadáním dotazu na adresu do vyhledávacího pole. Na základě výsledků vyhledávání můžete analyzovat, ve kterých článcích byla adresa použita, ve kterých reklamách byla uvedena a zda byla zařazena na černé listiny uživatelů

Telefonní číslo

Podle čísla mobilního telefonu můžete zjistit, zda patří konkrétní společnosti – zda ​​se objevuje ve výsledcích vyhledávání v reklamách jménem právnická osoba... Kromě toho může být zaznamenán na stránkách soukromých reklam - bude užitečné seznámit se s jejich obsahem. Je třeba věnovat pozornost tomu, zda je zařazena na nějaké blacklisty uživatelů a zda k ní nejsou nějaké komentáře.

Navíc podle čísla mobilního telefonu můžete zjistit jeho příslušnost k určitému telefonní operátor a regionu

Osobní data

Pro účely charakterizace osobnosti budoucího lídra, nových kolegů nebo těch, se kterými se asistent manažera na aktuálním působišti protíná, se často hodí osobní údaje. Rodinný stav, fotografie, koníčky, styl komunikace, okruh přátel, zájmy – to vše je často dostupné na sociálních sítích. Nedoporučuje se ztrácet čas hledáním takových informací z planého zájmu, ale pro doplňkové vlastnostičlověk sociální sítě může osobnímu asistentovi poskytnout různé údaje: pozitivně i negativně charakterizující člověka

Recenze zaměstnanců, seznamy zaměstnavatelů

Zpětná vazba od bývalých zaměstnanců organizací a také těch, kteří se účastnili rozhovorů vedených organizací, je důležitá, pokud asistent manažera plánuje vykonávat svou odbornou činnost v organizaci. Stojí za zvážení, že vždy existují „uražení“ a „nespokojení“, nedoporučuje se vyvozovat závěry pouze na základě recenzí a komentářů jednotlivců. Je však nutné je zohlednit a porovnat s jinými údaji o firmě.

Kromě toho existují oficiální zdroje kteří pravidelně zveřejňují seznamy nejlepších a bezohledných zaměstnavatelů

Na internetu je mnoho zdrojů, které uživatelům nabízejí informace o vaší organizaci. Zároveň existují takové, na kterých jsou informace prezentovány ve veřejné doméně, stejně jako komerční stránky. Placené webové stránky často nabízejí, že vám za peníze poskytnou zdarma data, která najdete na jiné stránce. Nespěchejte s platbou za první informace, které se objeví, pečlivě si prostudujte dostupné zdroje vč. důvěryhodné zdroje - oficiální stránky různých služeb, než se uchýlí k placené žádosti.

Pro referenci.Údaje o společnostech publikované na referenčních zdrojích jsou zpravidla získávány z otevřených zdrojů (USRLE a Rosstat) a nepodléhají federálnímu zákonu č. 152-FZ ze dne 27. července 2006 „O osobních údajích“ (ve znění z 21. července, 2014) podle čl. 6 federálního zákona ze dne 08.08.2001 č. 129-FZ "Dne státní registrace právnické osoby a fyzické osoby podnikatelé „(ve znění ze dne 30.03.2015; ve znění ze dne 18.05.2015).

  • www.egrul.nalog.ru . Oficiální web Federální daňové služby poskytne asistentovi manažera bezplatné informace zveřejněné v souladu se zákonem a nedůvěrné. Tento prostředek umožňuje získat data o několika položkách uvedených v tabulce najednou.

Požadované počáteční údaje pro vyhledávání: název právnické osoby nebo fyzického podnikatele, OGRN nebo DIČ (obr. 3).

V tomto případě vyhledáváme podle názvu právnické osoby. Není nutné zadávat region umístění, ale pokud máte tyto informace, doporučujeme je zadat, abyste získali nejúplnější výsledky vyhledávání. Po zadání údajů stiskněte tlačítko Nalézt a dostaneme výsledek (obr. 4).

Vyhledávání na webu Federální daňové služby zobrazuje výsledky ve formátu pdf. Dokumenty jsou k dispozici ke stažení a obsahují úplné informace o registraci společnosti: údaje o zakladatelích, jednatelích, o datu zápisu, evidovaných druzích činností, adresní údaje apod. (obr. 5).

Zdroj daňové služby je také pohodlný v tom, že poskytuje možnost prohledávat další databáze, které lze zdarma použít kliknutím na požadovaný odkaz a zadáním počátečních údajů požadovaných pro žádost. Asistent manažera snadno vyhledá informace o diskvalifikovaných osobách, právnických osobách, které mají daňové nedoplatky a další užitečné údaje.

Stojí za zmínku, že možná budete muset hledat dodatečné informace, např. k vyhledání dluhů - DIČ poplatníka (obr. 6). Pokud původně nebylo DIČ známo, lze jej zobrazit v informacích o registraci právnických osob získaných z výsledků vyhledávání podle názvu společnosti.

Známky letových společností

Načítání
z Veřejných kritérií pro sebehodnocení rizik pro daňové poplatníky, používaných finančními úřady při výběru objektů pro provádění daňových kontrol v terénu,
schváleno nařízením Federální daňové služby Ruska ze dne 30. května 2007 č. MM-3-06 / [e-mail chráněný]
"O schválení Koncepce systému plánování pro terénní daňové kontroly"

(ve znění z 05/10/2012)

[...] Při posuzování daňových rizik, která mohou být spojena s povahou vztahů s některými protistranami, se daňovému poplatníkovi doporučuje prozkoumat následující ukazatele:

Nedostatek osobních kontaktů mezi vedením (oprávněnými osobami) dodavatelské společnosti a vedením (oprávněnými osobami) nakupující společnosti při projednávání dodacích podmínek i při podepisování smluv;

Nedostatek listinných důkazů o pravomocích vedoucího protistrany, kopie jeho dokladu totožnosti;

Nedostatek listinných důkazů o pravomocích zástupce protistrany, kopie jeho dokladu totožnosti;

Nedostatek informací o skutečném umístění protistrany, jakož i o umístění skladu a / nebo výroby a / nebo maloobchodních prostor;

Nedostatek informací o způsobu získávání informací o protistraně (chybí reklama v médiích, chybí doporučení partnerů či jiných osob, chybí webové stránky protistrany apod.). V tomto případě se negativita tohoto znamení zhoršuje přítomností dostupné informace(například v médiích, venkovní reklamě, na internetových stránkách apod.) o jiných účastnících trhu (včetně výrobců) stejného (podobného) zboží (díla, služby), včetně těch, kteří své zboží (díla, služby) nabízejí za nižší ceny ;

Nedostatek informací o státní registraci protistrany v Jednotném státním rejstříku právnických osob ( obecný přístup, oficiální webové stránky Federální daňové služby Ruska www.nalog.ru).

Přítomnost takových znaků naznačuje vysoký stupeň rizika kvalifikace takové protistrany daňovými úřady jako problematickou (neboli „jednodenní“) a transakce s takovou protistranou jsou pochybné.

Kromě toho tato rizika zvyšují současnou přítomnost následujících okolností:

Protistrana s výše uvedenými charakteristikami vystupuje jako zprostředkovatel;

Přítomnost podmínek ve smlouvách, které se liší od stávajících pravidel (zvyků) obchodního obratu (například dlouhé zpoždění plateb, dodání velkých zásilek zboží bez platby předem nebo garance platby, nesrovnatelné s důsledky porušení smluvními stranami smlouvy se sankcemi, vypořádání prostřednictvím třetích osob, vypořádání směnkou apod.) NS.);

Nedostatek zjevných důkazů (například kopie dokumentů potvrzujících, že protistrana má výrobní kapacity, potřebné licence, kvalifikovaný personál, majetek atd.), možnost skutečného plnění smluvních podmínek protistranou, jakož i existence důvodné pochybnosti o možnosti protistrany skutečně splnit podmínky smlouvy s přihlédnutím k době potřebné pro dodání nebo výrobu zboží, provedení práce nebo poskytnutí služby;

Nabývání zboží prostřednictvím zprostředkovatelů, jehož výroba a obstarávání je tradičně prováděno fyzickými osobami, které nejsou podnikateli (zemědělské produkty, druhotné suroviny (včetně kovového odpadu), průmyslové výrobky atd.);

Nedostatek skutečné akce ze strany plátce (nebo jeho protistrany) k vymáhání dluhu. Růst dluhu plátce (nebo jeho protistrany) na pozadí pokračování dodávek velkých zásilek zboží nebo významného objemu práce (služeb) dlužníkovi;

Emise, nákup / prodej směnek protistranami, jejichž likvidita není zřejmá nebo není vyšetřována, jakož i vydávání / přijímání úvěrů bez zajištění. Negativa této vlastnosti je zároveň umocněna neexistencí podmínek pro úročení dluhových závazků jakéhokoli druhu, stejně jako splatnost těchto dluhových závazků je více než tři roky;

Významný podíl nákladů na transakci s „problémovými“ protistranami na celkových nákladech daňového poplatníka, přičemž neexistuje žádné ekonomické opodstatnění pro proveditelnost takové transakce, přičemž neexistuje žádný pozitivní ekonomický efekt z její realizace atd.

Jak prověřit „realitu“ společnosti protistrany?

  1. Používejte elektronické služby na webových stránkách Federální daňové služby Ruska(http://www.nalog.ru/):
  • « Informace o osobách, u kterých je u soudu prokázána (potvrzena) skutečnost nemožnosti účasti (vedení) v organizaci."(https://service.nalog.ru/svl.do). Podle OGRN nebo TIN organizace můžete zjistit, zda osoba, která je podle Jednotného státního rejstříku právnických osob v čele nebo zakladateli organizace, neprohlásila, že s ní nemá nic společného;
  • « Informace zveřejněné v časopise „Státní registrační bulletin“ o rozhodnutích přijatých registrujícími orgány o nadcházejícím vyloučení neaktivních právnických osob z Jednotného státního rejstříku právnických osob (http://www.vestnik-gosreg.ru/publ/fz83/). Takové rozhodnutí může správce daně učinit, pokud společnost nepodala daňová přiznání a neprovedla v průběhu roku transakce alespoň na jednom bankovním účtu. Vyloučení společnosti z Jednotného státního rejstříku právnických osob se rovná její likvidaci, což znamená, že nemůže uzavírat a vykonávat smlouvy.

Naše rada: vytisknout nebo uložit do počítače webové stránky (snímky obrazovky) s informacemi o společnosti. To vám pomůže dále prokázat, že jste ověření provedli.

  1. Vyžádejte si ověřené kopie následujících dokumentů:
  • zakládací listina organizace;
  • osvědčení o státní registraci organizace;
  • osvědčení o registraci organizace u finančního úřadu v místě jejího sídla;
  • rozhodnutí o volbě (jmenování) vedoucího organizace;
  • pasy vedoucího organizace (str. 2, 3);

Mimochodem: Platnost cestovního pasu lze zkontrolovat podle jeho série a čísla pomocí služby „Kontrola seznamu neplatných ruských pasů“ na webových stránkách FMS Ruska ( http://services.fms.gov.ru/info-service.htm?sid=2000).

  • licencí, pokud je v rámci licencované činnosti uzavřen obchod s organizací. Kromě toho lze informace o licencích vydaných společnosti zkontrolovat na webových stránkách licenčních úřadů;
  • účetní výkazy za rok předcházející roku transakce. Účetní údaje organizace za jakékoli období lze také zdarma získat od Rosstatu (za předpokladu, že společnost předloží účetní záznamy statistickým úřadům). Chcete-li to provést, musíte odeslat žádost na jakýkoli územní úřad Rosstat ve schválené podobě.

Výsledky kontroly mohou být vystaveny ve formě certifikátu a předloženy vedoucímu.

Video návod na kontrolu protistrany - na webuhttp://egrul.nalog.ru/.

  • www. fssprus. ru . Oficiální stránka Federální služba exekutoři Ruska poskytuje uživatelům možnost seznámit se s bankou exekučního řízení a provést vyhledávání pomocí jednoduchého formuláře (http://fssprus.ru/iss/ip/) (obr. 7).

Databáze obsahuje informace o právnických a fyzických osobách. Pro provedení vyhledávání je nutné zadat údaje fyzické, resp. právnické osoby nebo do samostatné záložky vyhledávacího formuláře číslo exekučního řízení, je-li známo (obr. 8).

Poznámka! Na rozdíl od webu Federální daňové služby je zavedení údajů o územních orgánech na webu FSSP povinné.

Pokud má společnost nebo jednotlivec nějaké dluhy a bylo proti nim zahájeno exekuční řízení, pak ve výsledcích vyhledávání asistent manažera obdrží tyto údaje: úplný název společnosti a adresu sídla, číslo a datum zahájení exekuce řízení, podrobnosti o prováděcím dokumentu, jakož i výši nesplaceného dluhu. V příkladu byla některá data tabulky odstraněna, ale sloupce jsou zachovány pro přehlednost zobrazení výsledků vyhledávání.

  • www. rusprofil. ru . Projekt RusProfile je referenční systém pro společnosti, který lze použít k rychlému vyhledání organizace, kontaktních údajů a registračních údajů.

V sekci "Firmy" musíte zadat název společnosti a získat výsledky vyhledávání (obr. 9).

Internet poskytuje neomezený přístup k informačním zdrojům, a to jak z oblasti právní vědy, tak i praktického zákonodárství. Vyhledávače výrazně usnadňují hledání potřebných informací, jakýchkoli dat, článků, monografií a programů. Internetové zdroje se stávají účinným prostředkem k získávání nových znalostí a umožňují také přístup k elektronickým verzím nejen právnických časopisů a novin, ale také k nejrůznější právní literatuře dostupné v bezplatné i placené podobě.

Téměř každý právník se může vyzkoušet jako „poradce na dálku“ v právních problémech. K tomu není nutné vytvářet osobní webovou stránku, stačí se stát členem některého ze stávajících internetových projektů. Například na ruském internetu je velmi populární tzv. „Virtuální právní poradenství“ (www.uristy.ru). Práce na této konzultaci se může zúčastnit každý odborník s právním vzděláním, stačí se pouze zaregistrovat do systému.

Je však třeba poznamenat, že dostupnost a snadné umístění informací, stejně jako téměř úplná nezávislost serverů na sobě navzájem na internetu, změnily globální úspěch v chaos. Proto je rok od roku problém najít potřebné informace na internetu stále naléhavější. To je důležité zejména v podmínkách omezeného času a v případě, kdy by rozhodnutí mělo být založeno na konkrétním dokumentu.

Nejjednodušší způsob, jak něco najít, je zadat klíčová slova přímo do adresního řádku prohlížeče. Vyhledávání probíhá v systému WSN Search společnosti Microsoft.

Obr. 18 Vyhledávací systém WSN

Dalším způsobem vyhledávání je použití tlačítka Hledat na liště prohlížeče. Při použití tohoto tlačítka je okno rozděleno na dvě části. Vlevo je řádek pro zadávání klíčových slov, seznam nalezených stránek a vpravo si můžete vybrané stránky prohlédnout. Pomocí tlačítka můžete použít jiný vyhledávač Naladit v panelu Vyhledávání.

Internetové vyhledávače:

Vyhledávače lze rozdělit do následujících skupin:

    hledat adresáře

    vyhledávače nebo vyhledávací indexy

Vyhledávání adresářů.

Adresáře zdrojů – globální, místní, specializované – jsou webové databáze s adresami zdrojů. Tyto databáze mohou mít různé množství nashromážděných informací. Obvykle jsou hierarchické.

Vyhledávací katalogy jsou organizovány stejně jako tematické katalogy velkých knihoven. S odkazem na adresu vyhledávacího adresáře najdeme na jeho hlavní stránce seznam oborových kategorií, jako je „Právo“, „Vzdělávání“, „Sport“ atd.

Každá položka v seznamu kategorií je hypertextový odkaz. Kliknutím na něj se otevře další stránka vyhledávacího adresáře, kde je vybrané téma podrobněji představeno. Jak budete pokračovat v ponoření do tématu, můžete sejít dolů na seznam konkrétních webových stránek a vybrat zdroj, který je pro řešení vašeho problému nejvhodnější. Pro upřesnění hledání stránek, které potřebujete, můžete také použít tlačítko Hledat ve vyhledávacím adresáři.

Vyhledávací adresáře jsou vytvářeny většinou ručně vysoce kvalifikovanými editory, kteří procházejí WWW, vybírají, co je podle nich ve veřejném zájmu, a katalogizují adresy.

Yahoo(www.yahoo.com) - uznávaný jako nejoblíbenější katalog na světě. Vyhledávání v ruštině je možné.

Ruské katalogy:

« Seznam. Ru» (www. seznam. ru),

"Internet souhvězdí" (www. hvězdy. ru),

"Rusko na síti" (www.ru) jiný.

Úvod. - 4

1. Systém vyhledávání informací. - 5

1.1. Dokumentární IPS. - 6

1.2. Faktografický IPS. - osm

2. Vyhledávač globální sítě "Internet". - devět

2.1. Jak fungují vyhledávače. - devět

2.2. Technologie vyhledávání. - čtrnáct

3. Vyhledávače globální sítě "Internet". - osmnáct

3.1. Jak hledat na internetu - 18

3.2. Vyhledávání adresářů. - 21

3.3. Vyhledávací ukazatele. - 23

4. Srovnávací charakteristiky dvou vyhledávačů

systémy založené na Rambler.ru a Yandex.ru. - 29

4.1. Rambler.ru - 29

4.2. Yandex.ru. - 35

Závěr. - 40

Literatura. - 42

Aplikace. - 43

Úvod


Internet hodně usnadnil život moderní společnost globalizoval, zvýšil schopnosti některých lidí a snížil schopnosti jiných. Dnes je mnohem pohodlnější a výhodnější používat poštovní služby přes internet (například dopis z Tobolska do Londýna dorazí za 5 sekund).

Podle mých pozorování se internet stal zdrojem podnikání, zdrojem světové kultury, zdrojem vzdělání, masmédiem.

Dnes může každý uživatel internetu získat přístup ke všem světovým burzám a muzeím během několika sekund. Každý uživatel se může vzdělávat prostřednictvím internetu, seznámit se s předními světovými elektronickými novinami.

Informace se staly virtuálním zlatem naší doby a ten, kdo je získá rychleji, bude dosahovat stále většího úspěchu. A nezáleží na tom, kdo jste, obchodník hledající nový prodejní trh nebo student, který hledá materiál seminární práce Oba potřebují informace a internet jim je může poskytnout, pokud mají dostatek znalostí, aby je získali.

Vyjmenovat výhody internetu pro občany Země by mi trvalo dlouho, ale obávám se, že bych brzy neskončil.

Chci poznamenat hlavní věc na internetu, některé jeho „základní kámen“, to jsou informace a jejich hlavní vlastnosti:

1) Široká dostupnost

2) Rychlost

Nezkušení uživatelé mají mýtus, že internet má všechno. Ve skutečnosti moje zkušenost na internetu prokázala, že tomu tak není. Materiály pro zveřejnění na webu připravují skuteční lidé, a proto tam najdete jen to, co považovali za nutné (ve smyslu pro ně užitečné nebo prospěšné) zveřejnit. Řeka je však napájena potoky a díky jejich práci jsou dnes na internetu již asi dvě miliardy webových stránek. V důsledku toho se katalogizace zdrojů dostupných na webu stala vážným problémem. Navzdory tomu, že se v něm angažují tisíce organizací, problém se nejen nepřibližuje k vyřešení, ale je stále aktuálnější. Procento katalogizovaných (nebo indexovaných) zdrojů neustále klesá. V posledních dvou letech se tento pokles stal katastrofálním. Pokud se tedy v roce 2000 procento indexovaných zdrojů přiblížilo 40 %, pak jen v jednom příštím roce kleslo na 25 %. Řešení je jednoduché: webový prostor se zaplní rychleji, než se zorganizuje. Internetoví odborníci bohužel nemají důvod se domnívat, že se v blízké budoucnosti může cokoliv změnit k lepšímu. V důsledku toho lze hledání informací na World Wide Web považovat za nejobtížnější úkol na internetu.

V souvislosti s výše uvedeným je kvalitní vyhledávání informací na internetu jedním z nejpalčivějších témat naší doby, tento problém se mě nejednou dotkl.

Téma mé semestrální práce mě zaujalo svou originalitou a neotřelostí a chci se ho pokusit odhalit. Mým úkolem bude zorganizovat kvalitní vyhledávání informací na internetu.

1. Systém vyhledávání informací


Než se dostaneme ke konkrétním vyhledávacím mechanismům v globálním internetu, je nutné analyzovat teoretický základ takových otázek, jako je "co je informace?", "informační procesy?", "systém vyhledávání informací a jeho typy?"

Neexistuje jednoznačná odpověď, že taková informace není, můžete uvést pouze část vlastností charakterizujících tento termín:

" Informace - jedná se o informace, které jsou předmětem uložení; toto je obsah zprávy, signálu, paměti, stejně jako informace obsažené ve zprávě, signálu, paměti."

Procesy přenosu, ukládání a zpracování informací vždy hrály důležitou roli v životě společnosti. Lidé si vyměňují ústní zprávy, poznámky, zprávy. Navzájem si převádějí požadavky, objednávky, zprávy o provedené práci, inventarizaci majetku; zveřejňovat reklamy a vědecké články; uchovávat staré dopisy a dokumenty; Dlouho přemítají o přijatých zprávách nebo okamžitě spěchají plnit pokyny svých nadřízených. To vše jsou informační procesy. Informace je vždy spojena s hmotným nosičem a jeho přenos - s výdaji energie. Stejné informace však mohou být uloženy v jiné hmotné podobě (na papíře, ve formě fotonegativu, na magnetické pásce, ...) a předány s různými náklady na energii (poštou, telefonicky, kurýrem , atd.), Důsledky - včetně materiálních - přenášených informací navíc vůbec nezávisí na fyzických nákladech na jejich přenos. Například lehké stisknutí tlačítka spustí těžkou divadelní oponu nebo vyhodí do vzduchu velkou budovu, červený semafor zastaví vlak a nečekané špatné zprávy mohou způsobit infarkt. Informační procesy tedy nejsou redukovatelné na fyzikální a informace jsou spolu s hmotou a energií jednou ze základních esencí světa kolem nás. Ve 20. století. s rozvojem techniky se objevila nová zařízení: komunikační prostředky, automatizační zařízení a od 40. let. - počítačová technologie. Ukázalo se, že je nemožné popsat efektivitu jejich práce pomocí fyzikálních konceptů a že podstatné vlastnosti takových zařízení by měly být popsány zcela odlišnými způsoby. V důsledku toho se poprvé objevil přesný pojem informace a matematická teorie informace. Ukázalo se, že komunikační prostředky, bez ohledu na to, jaké fyzické procesy používají, jsou prostředky pro přenos informací. Sjednocení pojmů „informace“ a „řízení“ vedlo N. Wiener ve 40. letech. k vytvoření kybernetiky, která zejména poprvé naznačila shodnost informačních procesů v technice, společnosti a živých organismech.

Využití pojmu informace mělo významný dopad na rozvoj moderní biologie, zejména takových úseků, jako je neurofyziologie a genetika. A konečně v souvislosti s rozvojem výpočetní techniky, která podnítila informatizaci celé společnosti, vznikl komplex věd o různých aspektech práce s informacemi - informatika.

" Systém vyhledávání informací - jedná se o systém, kde je uloženo informační pole, ze kterého jsou vydávány potřebné informace podle požadavků uživatelů."

Vyhledávání informací na žádost uživatele probíhá buď automaticky, nebo manuálně (jako v knihovnách, kdy si čtenář vyžádá pracovníka referenčního fondu a ten využívá katalogový systém). Ve druhém případě se používají počítače vybavené speciálním softwarem, který analyzuje procesy žádostí, vyhledávání a vydávání potřebných dokumentů. Systémy vyhledávání informací (ISS) tedy implementují vztah otázky a odpovědi, který spojuje úkoly, kterým čelí tvůrci takových systémů, s těmi, které řeší tvůrci systémů člověk-stroj.

Systémy vyhledávání informací se dělí na dva typy:

1. Dokumentární IPS.

2. Faktografický IZS.

1.1 Dokumentární IRS


V takové ISS jsou všechny uložené dokumenty nějakým speciálním způsobem indexovány. Každému dokumentu (článek, zpráva, protokol atd.) je přiřazen individuální kód, který tvoří vyhledávací obrázek dokumentu. Vyhledávání neprobíhá podle dokumentů samotných, ale podle jejich vyhledávacích obrázků, které obsahují informaci (adresu) o umístění dokumentu. Takto hledají knihy na objednávku čtenáře ve velkých knihovnách (v malých knihovnách si knihovník většinou shání knihy sám). Na žádost čtenáře nejprve najdou kartu v katalogu a poté podle kódu, který je na ní uveden, naleznou samotnou knihu.

Rozdíly v dokumentárním ISS jsou určeny tím, jak je uspořádán vyhledávací obrázek dokumentu. V nejjednodušším případě jde jednoduše o její individuální název (například název, autor, rok vydání knihy). Ve složitějších případech neexistuje žádná osobní korespondence mezi vyhledávaným obrázkem dokumentu a dokumentem samotným. Je docela možné, že hledaný obrázek dokumentu odpovídá několika různým dokumentům a naopak tentýž dokument neodpovídá jednomu, ale několika hledaným obrázkům.


Takovou nejednoznačnost mají například vyhledávací obrázky dokumentů v deskriptorových systémech. "Deskriptor je slovo nebo fráze, která úzce souvisí s obsahem dokumentu. Kolekce deskriptorů definuje skupinu dokumentů s podobným obsahem." PROTI V poslední doběčasopisy publikující vědecké články vyžadují, aby jejich autoři u každého článku uvedli seznam klíčových slov, která hrají roli deskriptorů. Pokud například popíšete článek, který čtete, pomocí klíčových slov, pak jeden z možných seznamů bude následující: vyhledávání informací, systém vyhledávání informací, deskriptor, tezaurus, obrázek pro vyhledávání dokumentů.

Podle množiny těchto klíčových slov (soubor deskriptorů) můžete tento článek najít mezi všemi články knihy, pokud jeho obsah článek po článku zadáte do libovolného ISS typu deskriptor.

Obecné blokové schéma deskriptoru typu ISS je znázorněno na Obr. Tento obvod má dva vstupy. Jeden po druhém se doplňuje informační pole dokumentů uložených v systému a druhý se používá pro příjem požadavků uživatelů.

1.2 Faktografický IZS

Na rozdíl od IRS s grafikou dokumentů IRS tohoto typu neuchovává dokumenty, ale fakta související s jakoukoli tematickou oblastí. Uložená fakta lze extrahovat z různých dokumentů. Třeba dějiny osmnáctého století je třeba přepracovat v databázi faktů, jsou vzájemně propojeny systémem různých vztahů. Taková síť na ISS se nazývá doménový tezaurus. Dotazy přicházející do věcného IRS používají tezaurus k nalezení odpovědí na dotazy. Vyhledávání je prováděno vyhledávací metodou, podle modelu široce používaného ve znalostních bázích systémů umělé inteligence.

Například je třeba přepracovat historii osmnáctého století, shromáždit všechny informace o Kateřině II.

IZS věcného typu se postupně svou organizací a fungováním přibližují k rozvinutým databázím a znalostem.

2. Vyhledávač globální sítě "Internet".


Nechci se dostat do džungle vnitřního fungování vyhledávače (na elektronické úrovni), tk. to nesplňuje cíle mé práce a je to podle mého názoru práce špičkových programátorů, o kterou nyní usiluji.

Chci rozebrat a utřídit na „poličkách“, jak jsem pochopil technologii vyhledávání informací a samotný mechanismus vyhledávání informací.

2.1 Technologie vyhledávání informací na internetu


Samotná vyhledávací technologie je na obrázku 2 jasnější.

1) Nejprve uživatel vyřeší problém, který chce najít, a kde může být.

2) Poté se přihlásí na Internet, do běžného okna Internet Exploreru (Prohlížeč) (obr. 3). Pokud uživatel zná název webu, na kterém se nachází informace, které ho zajímají, jednoduše nahlásí své jméno a zadá jej.

Příklad. Uživatel chce znát distribuci filmu pro dnešek a přejde na stránku film.ru (obr.-3).

Jde o nejprimitivnější způsob hledání informací na internetu a tím hledání může skončit.

informace o filmu, který se již dlouho nevyrábí, například najděte film "Brother-2", stačí v okně



Vyhledávání se provádí automaticky na základě počtu slov nalezených na serveru. Do jeho počítače se přenese první skupina nalezených odkazů s nejlepšími ukazateli z hlediska počtu nalezených výskytů hledaných slov.

Často lze spolu s odkazem zobrazit stručné informace o dokumentu. Pokud mezi nalezenými nejsou žádné potřebné dokumenty, pak si můžete zobrazit následující skupinu - celkový počet dokumentů se obvykle pohybuje v tisících. Chcete-li přejít na server, na kterém se nacházejí nalezené informace, jednoduše klikněte na odkaz ve výsledku vyhledávání.

Jde o nejprimitivnější způsob hledání informací na internetu a tím hledání může skončit.

Existují také vnitřní (místní) vyhledávací systémy.

Příklad. Na stejném film.ru je možnost prohlédnout si

informace o filmu dlouho mimo pokladny, do

například najděte film "Brother-2", stačí v okně

hledejte zadejte slovo Brother-2. (Obr.-3)

3) Pokud uživatel nezná název stránky, kde najde informace, které ho zajímají, pak se uchýlí k pomoci nějakého vyhledávače. Existuje značný počet systémy pomoci... Po zadání zadaného serveru se mu na obrazovce zobrazí formulář žádosti, do kterého musí zadat informace pro vyhledávání. Obvykle má formulář možnost omezit oblast hledání (například podle tématu). Může zadat požadovaný výraz, definovat rozsah vyhledávání a pokusit se získat odpověď.

Vyhledávání se provádí automaticky na základě počtu slov nalezených na serveru. Do jeho počítače se přenese první skupina nalezených odkazů s nejlepšími ukazateli z hlediska počtu nalezených výskytů hledaných slov. Často lze spolu s odkazem zobrazit stručné informace o dokumentu. Pokud mezi nalezenými nejsou žádné potřebné dokumenty, pak si můžete zobrazit následující skupinu - celkový počet dokumentů se obvykle pohybuje v tisících. Chcete-li přejít na server, kde se nacházejí nalezené informace, jednoduše klikněte na odkaz ve výsledku vyhledávání.

Výsledkem hledání dvojice klíčových slov jsou obvykle desítky tisíc odkazů na dokumenty obsahující tyto výrazy. Takový objem výsledků málokdy umožňuje efektivně najít „perlu“ mezi nesouvisejícími materiály. Co poradíte?

Nejprve musí uživatel zúžit oblast hledání. Zkuste zjistit na serverech, který profil, ve které zemi atd. s největší pravděpodobností budou nalezeny zajímavé materiály. Přemýšlejte o tom, jaká další klíčová slova mohou charakterizovat vyhledávací objekty, použijte několik klíčových slov.

Pokud je hledaným objektem určeno několik výrazů, hledá vyhledávač výskyt každého slova v dokumentu nezávisle. To znamená, že v důsledku vyhledávání můžete získat dokument, který obsahuje pouze jedno slovo, ale několikrát. Proto při definování pojmů, kterými se vyhledávání provádí, je možné a nutné používat logické operace.

Například zadání word_1 & word_2 vás donutí hledat ty stránky, kde je použit první i druhý výraz.

Za druhé, je nutné provést vyhledávání na všech známých vyhledávačích. Každý z nich používá svou vlastní, trochu odlišnou technologii vyhledávání. Zcela podobná vyhledávání proto mohou vést k různým výsledkům. Většina vyhledávačů je zdarma, takže vám nic nebrání v hledání tolika, kolik potřebujete.

Za třetí, velmi často může výsledek přinést vyhledávání dokumentů na základě možných odkazů na ně.

Uživatel by se měl pokusit určit, které známé dokumenty mohou obsahovat odkazy na jeho témata. A to již prostřednictvím hypertextových odkazů v dokumentech k dosažení požadovaného zdroje. Tato cesta je často účinná. Pokuste se najít organizace (WWW servery), které mají profil podobný předmětu vašeho hledání. Někdy můžete pomocí odkazů v dokumentech těchto serverů přejít na potřebné materiály.

Za čtvrté zkuste najít konferenci na podobná témata, tzn. stačí jít na nějaký CHAT. Například na www.anekdotov.net.ru. Častokrát otázka „hozená“ na diskusní skupinu poskytuje dostatek informací o pozadí.

A nakonec se nezapomeňte zeptat svých přátel. Mohou navrhnout nečekané řešení.

V každém případě se musíte naladit na to, že hledání může trvat poměrně dlouhou dobu a vyžadovat od něj velké úsilí.

Příklad. Uživatel vstoupí do vyhledávače Yandex.ru a do vyhledávacího okna zadá slovo Brother-2, poté se vyhledá vše, co může být s tímto slovem nějak spojeno. Yandex doporučí odkazovat na mnoho stránek, včetně film.ru a přímo na stránky o filmu samotném. (obr.-4)

2.2 Jak fungují vyhledávače

Vyhledávač obvykle vyhledává požadované informace ve třech fázích:

I) Fáze: Robot (agent, pavouk nebo crawler) cestuje po webu a shromažďuje informace.

II) Fáze: Veškeré informace shromážděné roboty vstupují do databáze ve formě odkazů – jsou indexovány.

III) Fáze: Spustí se vyhledávač, který uživatelé používají jako rozhraní pro interakci s databází. ty. databáze vydávala hypertextové odkazy a pak následuje běžné vyhledávání potřebných odkazů uživatelem.

Tyto fáze jsou jasně vyjádřeny v práci vývojového diagramu (obr.-2)

První dva jsou přípravné a pro uživatele neviditelné.

Podívejme se podrobněji na fáze vyhledávání informací

Vyhledávač:

I) Jeviště. Vyhledávač shromažďuje informace z World Wide Web. Chcete-li to provést, použijte speciální programy podobně jako prohlížeče. Mohou zkopírovat danou webovou stránku na vyhledávací indexový server, zobrazit ji, najít všechny hypertextové odkazy, které obsahuje, přejít na adresy URL v nich uvedené, zkopírovat zdroje, které se tam najdou, znovu v nich vyhledat hypertextové odkazy atd. atd. Jedná se o speciální programy, jako jsou agenti, pavouci, prohledávače a roboti, které vyhledávají stránky na webu, extrahují hypertextové odkazy na těchto stránkách a automaticky indexují nalezené informace za účelem vytvoření databáze. Každý vyhledávač má svůj vlastní soubor pravidel, jak shromažďovat dokumenty. Někteří sledují každý odkaz na každé stránce, kterou naleznou, a poté prozkoumají každý odkaz na každé nové stránce a tak dále. Někteří lidé ignorují odkazy, které vedou na grafické a zvukové soubory, animační soubory; ostatní mají pokyn, aby nejprve procházeli nejoblíbenějšími stránkami.

Agenti - nejinteligentnější z vyhledávacích nástrojů. Mohou dělat víc než jen hledat: mohou zanechat zprávu o vaší návštěvě na webu. Již nyní mohou vyhledávat stránky s konkrétním tématem a vracet seznamy stránek seřazené podle návštěvnosti. Agenti mohou zpracovávat obsah dokumentů, vyhledávat a indexovat další typy zdrojů, nejen stránky. Mohou být také naprogramovány tak, aby získávaly informace z již existujících databází. Bez ohledu na informace, které agenti indexují, je předávají zpět do databáze vyhledávače.

Obecné vyhledávání informací na webu provádějí programy známé jako pavouci. Pavouci ohlásit obsah nalezeného dokumentu, indexovat jej a získat souhrnné informace. Prohlížejí také záhlaví, některé odkazy a zasílají indexované informace do databáze vyhledávače.

Crawlery prohlédněte si záhlaví a vraťte pouze první odkaz.

Roboty lze naprogramovat tak, aby sledovali různé odkazy s různou hloubkou vnoření, prováděli indexování a dokonce kontrolovali odkazy v dokumentu. Vzhledem ke své povaze se mohou zaseknout ve smyčkách, takže ke sledování odkazů potřebují značné webové zdroje. Existují však metody, které mají zabránit robotům ve vyhledávání na stránkách, jejichž majitelé si nepřejí, aby byly indexovány.

Roboti načteno a indexováno různé druhy informace. Některé například indexují každé jednotlivé slovo v nalezeném dokumentu, zatímco jiné indexují pouze 100 nejdůležitějších slov v každém z nich, indexují velikost dokumentu a počet slov v něm, název, nadpisy a podnadpisy a tak dále.

Typ vytvořeného indexu určuje, jaké vyhledávání může vyhledávač provést a jak budou výsledné informace interpretovány.

Lidé, kteří chtějí poskytovat informace široké veřejnosti nebo chtějí zvýšit návštěvnost svých stránek, umístí krátké úryvky o tom, co tato stránka je, přímo do indexu a vyplní speciální formulář pro sekci, o které si myslí, že se na ni vyhledávací robot obrátí. a stáhnout tento web do databáze a poskytnout mu nějakého uživatele.

Když chce někdo najít informace dostupné na internetu, navštíví stránku vyhledávače a vyplní formulář s podrobnými informacemi, které potřebuje. Zde lze použít klíčová slova, data a další kritéria. Kritéria ve vyhledávacím formuláři musí odpovídat kritériím používaným roboty k indexování informací, které najdou při procházení webu.

Indexované informace jsou odeslány do databáze vyhledávače stejným způsobem, jak je popsáno výše.

II) Fáze: Po zkopírování hledaných webových zdrojů na server vyhledávače začíná druhá fáze práce - indexování. V průběhu indexace jsou vytvářeny speciální databáze, pomocí kterých je možné zjistit, kde a kdy se na internetu s konkrétním slovem setkalo. Indexovaná databáze je druh slovníku. Je to nutné, aby vyhledávač mohl velmi rychle reagovat na dotazy uživatelů.

Databáze vyhledá předmět dotazu na základě informací uvedených ve vyplněném formuláři a vydá odpovídající dokumenty připravené databází. Databáze používá hodnotící algoritmus k určení pořadí, ve kterém bude seznam dokumentů zobrazen. V ideálním případě budou dokumenty nejrelevantnější pro dotaz uživatele umístěny na prvním místě v seznamu.

"Operace třídění získaných výsledků se nazývá hodnocení."

Různé vyhledávače používají různé algoritmy hodnocení, ale základní principy pro určení relevance jsou následující:

Počet dotazovaných slov v textovém obsahu dokumentu (tj. v html kódu).

Značky, ve kterých se tato slova nacházejí.

Umístění hledaných slov v dokumentu.

Podíl slov, pro která je určena relevance, na celkovém počtu slov v dokumentu.

Tyto principy uplatňují všechny vyhledávače. A ty níže uvedené používají někteří, ale docela dobře známí (jako AltaVista, HotBot).

Čas – jak dlouho je stránka v databázi vyhledávače. Zpočátku se zdá, že jde o zcela nesmyslný princip. Ale když se zamyslíte nad tím, kolik stránek na internetu existuje, které žijí maximálně měsíc! Pokud stránka existuje již delší dobu, znamená to, že její vlastník je v tomto tématu velmi zkušený a uživatel má pravděpodobněji stránku, která již několik let vysílá do světa o pravidlech tabulek, než ta, která se objevil před týdnem se stejným tématem.

Citační index - kolik odkazů na danou stránku vede z jiných stránek registrovaných v základně vyhledávačů. Databáze zobrazí podobně seřazený seznam HTML dokumentů a vrátí jej uživateli, který podal požadavek. Různé vyhledávače také volí různé způsoby zobrazení výsledného seznamu – některé zobrazují pouze odkazy; ostatní zobrazují odkazy s několika prvními větami obsaženými v dokumentu nebo názvem dokumentu spolu s odkazem.

III) Etapa. Požadavek uživatele je zpracován a výsledky vyhledávání jsou mu vráceny ve formě seznamu hypertextových odkazů. Poté přichází práce uživatele na recyklaci odkazů poskytovaných databází. Když klikne na odkaz na jeden z dokumentů, který ho zajímá, je tento dokument vyžádán ze serveru, na kterém se nachází, pokud ho informace uživatele na této stránce neuspokojují, klikne na jiný odkaz. Tato fáze může trvat dlouho a ukáže se, že je pro uživatele nejobtížnější.


3. Vyhledávače

Na internetu existuje velké množství vyhledávačů (vyhledávačů), mají různé typy, každý má své výhody a nevýhody. Uživatel bude vždy překonán takovými otázkami: jak hledat na internetu, které auto je lepší. Pokusím se tedy na tyto otázky odpovědět.

3.1 Jak vyhledávat na internetu

Při vyhledávání na internetu jsou důležité dvě složky – úplnost (nic se neztratí) a přesnost (nebylo nalezeno nic nadbytečného). Obvykle se to vše nazývá jedním slovem - relevance, tedy shoda odpovědi na otázku.

1. Pokrytí a hloubka. Pokrytím rozumíme objem báze vyhledávačů: který se měří třemi ukazateli - celkovým objemem indexovaných informací, počtem unikátních serverů a počtem unikátních dokumentů. Hloubkou se rozumí, zda existuje omezení

počet stránek nebo hloubka vnoření adresářů na jednom serveru.

Jak zkontrolovat: Některé stroje píší statistiky robotů na své webové stránky. Můžete si to ale ověřit sami - musíte nastavit několik vyhledávacích dotazů skládajících se z jednoho slova (aby se vyloučil vliv jazyka dotazu, včetně odlišné interpretace prostoru), a zároveň se podívat na statistiky výsledků vydaný strojem - obvykle je na začátku seznamu uvedeno, kolik všech dokladů bylo nalezeno. Kromě toho, že by slova měla být z různých oblastí, je dobré vzít i slova různé „váhy“ – rare, „medium“ a „heavy“ (frekvence), a porovnat nalezené množství. Zejména těžká slova testují plný textový obsah (indexování všech slov v dokumentu) vyhledávače.

Je obtížnější zkontrolovat hloubku pohybu robota - k tomu je třeba vzít některé stránky, například s rozvětvenou strukturou archivů, a zkontrolovat, zda jsou dokumenty, ke kterým lze přistupovat, indexovány pouze v 6. klikne na odkazy.

2. Rychlost procházení a relevance odkazů.

Rychlost procházení sítě ukazuje, jak rychle je nově přidaný prostředek indexován a jak rychle se aktualizují informace v databázi. Důležitým ukazatelem kvality vyhledávače (jeho robota) je nejen „ukořistění“ nových území: ale také

sledování stavu již pokrytých. Servery mizí a objevují se, stránky na nich se obnovují. Odkazy, které vyhledávač uvádí v seznamu nalezených, musí za prvé existovat a za druhé jejich obsah musí odpovídat požadavku.

Jak zkontrolovat: Objektivní informace lze získat analýzou protokolů serveru - robot vyhledávače je obvykle reprezentován názvem svého stroje (nebo podobným způsobem), abyste viděli, jak často server navštěvuje, kolik stránek si prohlíží atd. . Bohužel je obvykle ke studiu k dispozici pouze protokol vašeho webu, takže zůstává experimentální metoda.

Chcete-li určit rychlost procházení, musíte někde vytvořit stránku textu, přidat ji do vyhledávačů a zjistit, jak rychle se začne nacházet. Nebo změnit existující stránku. Chcete-li zjistit relevanci odkazů - zkontrolujte dokumenty alespoň na první stránce nalezeného seznamu pro několik dotazů. Zpráva " Nenalezeno"označuje, že dokument již neexistuje.

3. Kvalita vyhledávání(subjektivní ukazatel).

Každý vyhledávač má svůj vlastní algoritmus pro řazení výsledků vyhledávání. Čím blíže k horní části seznamu je požadovaný dokument, tím lépe funguje relevance.

Jak zkontrolovat: Pouze experimentem. Pro srovnání se doporučuje provádět dotazy různé délky. Můžete také použít jazyk dotazu, zatímco ti, kteří nechtějí číst popis, mohou použít stránku s rozšířeným dotazem („rozšířené vyhledávání“ v Aportu a Yandexu, „podrobný dotaz“ v Rambleru – možnosti překladu do ruštiny „rozšířené vyhledávání“) .

Kromě relevance existují důležité uživatelské vlastnosti.

1. Rychlost vyhledávání. Pokud vyhledávač reaguje pomalu, je neefektivní s ním pracovat. Je třeba dodat, že rychlost viditelná pro uživatele závisí nejen na samotném vyhledávači, ale také na internetových kanálech.

Jak zkontrolovat: Experimentem je potřeba hledat dotazy různé délky, různé „závažnosti“ slov a v různou denní dobu (vytížení serveru je v průběhu dne výrazně nerovnoměrné, vrchol je zhruba tři až čtyři hodiny dne).

2. Možnosti vyhledávání (práce s jazykem dokumentu, dotazovacím jazykem). Dalším bodem srovnání je, co přesně a jak vyhledávač zadává do indexu. Fulltextový vyhledávač indexuje všechna slova textu, která jsou pro uživatele viditelná. Přítomnost morfologie umožňuje najít požadovaná slova ve všech deklinacích nebo konjugacích. Navíc jsou v HTML tagy, které umí zpracovat i vyhledávač (nadpisy, odkazy, popisky obrázků atd.). Téměř všechny stroje mají dotazovací jazyk ve formě standardních logických operátorů (AND, OR, NOT). Někteří lidé vědí, jak hledat fráze nebo slova na danou vzdálenost – to je často důležité pro dosažení rozumného výsledku. Další příležitost je vyhledávání v oblastech dokumentu - názvy, odkazy, klíčová slova (META KEYWORDS) atd. Další funkcí dotazovacího jazyka je dotaz v přirozeném jazyce, který nevyžaduje znalost operátorů.

Jak zkontrolovat: Obvykle jsou tyto informace zveřejňovány na serveru vyhledávače (v Nápovědě "e), ale doporučuje se zkontrolovat skutečné dotazy, protože někdy se zbožné přání vydává za skutečné.

3. Další vybavení. Toto jsou další příležitosti, které vyhledávač uživatelům poskytuje. To zahrnuje všechny druhy možností vyhledávání (specializované stránky, vyhledávání podobných dokumentů, omezení oblasti vyhledávání) a seznam nalezených serverů a vyhledávání podle dat a serverů a pohodlné rozhraní vyhledávače a možnost personalizace .

Jak zkontrolovat: Informace mohou být částečně zveřejněny na serveru vyhledávače, ale nejlepší je zkusit si s těmito možnostmi pracovat sami.

Vyhledávače se skládají z hledat adresáře a vyhledávací indexy, mnoho vyhledávacích indexů také obsahuje adresáře. Zvažme je.

3.1 Vyhledávání v adresářích

Každá kniha začíná obsahem a končí abecedním rejstříkem. Navzdory tomu, že se nacházejí na různých místech knihy a vypadají úplně jinak, mají stejný úkol: pomoci najít v knize přesně tu sekci, která je v tento moment potřeboval. Obsah je příkladem katalogizace.

Když si člověk vybere téma, které je pro něj zajímavé, vyhledá si podle něj číslo stránky, kde je toto téma odhaleno. Abecední rejstřík je příkladem indexování (v angličtině je index index). Člověk najde v indexu požadovaný výraz a dostane číslo stránky, na které se vyskytuje.

Adresáře a se liší od vyhledávačů. Adresáře jsou kolekce webů, které jsou seskupeny do předmětových hesel. Tyto nadpisy lze zase rozdělit na podnadpisy, které mohou mít i menší podadresáře atd.

Adresáře z pohledu uživatele jsou stejné vyhledávače. Ale tyto katalogy neplní "roboti", jak je na cedulích, ale nejvíce žijících lidí. To je pro uživatele velmi dobré, protože ve srovnání s vyhledávači přináší relevantnější výsledky. Částečně obsahuje rejstřík vyhledávání také katalog, je prezentován ve formě obsahů (hypertextových odkazů) na nejoblíbenější témata.

Při katalogizaci zdroje jej zkušený editor pečlivě naskenuje, určí, do které oblasti znalostí zdroj patří, nastaví jeho kategorii v tomto odvětví a vloží zdroj do katalogu. Největším adresářem na internetu je Yahoo (www.yahoo.com). Zaměstnává více než 150 kvalifikovaných redaktorů. Je to velká organizace, ale její úsilí stačí pouze na udržení adresáře na úrovni přibližně 1 milionu zdrojů. Další expanze je omezena potřebou


v ruské části internetu v tabulce 1. [příloha]

3.3 Ukazatele vyhledávání

Indexy vyhledávání jsou automatizované systémy... Jsou schopni fungovat bez lidského zásahu, a proto jsou jejich znalosti o skutečných zdrojích webu mnohem (o několik řádů) větší než u adresářů. Počet indexovaných webových stránek lze měřit ve stovkách milionů.

Práce s vyhledávacím indexem probíhá ve třech fázích, které jsou uvedeny v odstavci 2.2.

Konkrétní pokyny pro výběr indexu vyhledávání velmi rychle stárnou. Situace na internetu se nám mění doslova před očima. Neuběhne ani půl roku, aby se ve vyhledávačích něco nezměnilo. Systém, který byl včera nejlepší, nemusí být nejlepší dnes a zítra velmi špatný. Popularita je přitom ošemetná věc. Tvrdě vydělává, ale pak žije dlouho. V důsledku toho se velmi často setkáváme se situací, kdy nejoblíbenější zdaleka není nejlepší systém... Pomůžeme čtenáři naučit se nezávisle kontrolovat různé vyhledávače a vybrat ty, které dávají nejlepší výsledky pro práci. Při ověřování není velikost indexu vyhledávání kritická. Koneckonců nepotřebujeme miliony odkazů, ale jen dva nebo tři, ale nejlépe ty nejlepší. Je tedy důležité nejen to, kolik webových stránek vyhledávač indexoval, ale také kdy to naposledy udělal, jak často později kontroloval relevanci odkazů a jak správně prezentuje výsledky vyhledávání.

Srovnávací recenze vyhledávačů.

O tom, jak používat vyhledávací adresáře, není třeba podrobně mluvit. Vzhledem k tomu, že stačí přejít na web, vybrat kategorii, která vás zajímá, vybrat v ní sekci a tak dále, dokud se neotevře seznam konkrétních odkazů.

Mnohem zajímavější je uvažovat o metodách použití vyhledávacích indexů, zejména proto, že se tyto metody pro různé indexy liší. Než však začnete studovat konkrétní systém, je nutné zvážit obecné pojmy, které jsou stejně relevantní pro všechny vyhledávací indexy, jako příklad uvedu takové populární a podle mého názoru nejpohodlnější vyhledávače jako Yandex a Rambler.

A začnu tím, že se podívám na hlavní typy vyhledávání. V zásadě existují pouze čtyři typy vyhledávání.

Všechny vyhledávací indexy implementují několik vyhledávacích algoritmů. Patří sem: Jednoduché vyhledávání, Pokročilé vyhledávání, Kontextové vyhledávání a Speciální vyhledávání.

Jednoduché vyhledávání. Při jednoduchém vyhledávání se do pole dotazu zadá jedno nebo více slov, která mohou charakterizovat obsah dokumentu. Pokud je toto slovo jedno, pak se jako odpověď zpravidla vrací takové množství odkazů, s nimiž není jasné, co dělat. Pokud je zadáno více slov, výsledek závisí na tom, jak jsou slova zadána, a to zase závisí na konkrétním použitém systému. Recepce jednoduché vyhledávání v různých vyhledávačích, zpravidla jejich vlastních, a před jejich použitím je vhodné přečíst si pokyny. Jednoduché vyhledávání v Rambleru je uvedeno na

rýže - 8. Když zadáte frázi: V domě Oblonských je všechno zmatené, vyhledávací indexy poskytnou následující výsledky: Rambler 9 (dokumenty)

Yandex 2400 (dokumenty)

Pokročilé vyhledávání. Pokročilé vyhledávání vždy zahrnuje dotaz ze skupiny slov. V rozšířeném vyhledávání je ve většině případů povoleno propojovat klíčová slova logickými operátory AND (AND), OR (OR), NOT (NOT) a dalšími. Hlavní výhodou pokročilého vyhledávání je, že stejně jako pravidla pro psaní klíčových slov a logických operátorů různé systémy buď stejné nebo velmi podobné. Jakmile si jednou osvojíte pokročilé vyhledávací techniky, můžete je použít kdekoli. Stačí nejprve přepnout systém do požadovaného režimu (obr. 9.)

Když zadáte frázi: V domě Oblonských je všechno zmatené, v rozšířeném vyhledávání indexy vyhledávání dávají následující výsledky: Rambler 9 (dokumenty)

Yandex 2400 (dokumenty)

Obr-8 Jednoduché vyhledávání v Rambleru


Obr-9 Přepnutí systému do režimu pokročilého vyhledávání.

Kontextové vyhledávání. Jedná se o velmi užitečnou formu vyhledávání, která bohužel není implementována ve všech vyhledávacích indexech. Ocenit je třeba především systémy, které to podporují. Kontextové vyhledávání vyžaduje přesnou shodu fráze nebo skupiny slov, například „Vše

smíšené v domě Oblonských “. Ve většině vyhledávačů, které zahrnují tuto metodu, musí být klíčová fráze uzavřena v uvozovkách: „V domě Oblonských je všechno pomíchané.“ (Obr. 10).

Když zadáte frázi: "V domě Oblonských je všechno popletené", indexy vyhledávání vrátí následující výsledky:

Rambler 0 (dokumenty)

Yandex 8 (dokumenty)

Obr-10. Kontextové vyhledávání v RAMDLER.RU


Speciální vyhledávání. Pomocí příkazů speciální vyhledávání hledají další informace. Takové příkazy vám například umožňují určit, jak často jsou na webu hypertextové odkazy, které ukazují na zdroj, s jejich pomocí můžete najít klíčová slova,

obsažené v záhlaví webových stránek atd. Týmy speciálního vyhledávání v různých vyhledávačích jsou zpravidla různé.

Musíte také zvážit hlavní pravidla prohledávat záznamy příkazů.


Obecná pravidla pro psaní vyhledávacích příkazů:

Slova oddělená mezerou

Řekněme, že uživatel chce najít webovou stránku, která říká něco o operačním systému. Microsoft Windows... Do vyhledávacího pole je logické zadat slova Microsoft Windows a počkat na výsledek. Výsledek ale může odradit. Některé vyhledávače chápou takový záznam jako Microsoft AND Windows – dají to, co uživatel hledá. Ostatní mohou tuto položku interpretovat jako Microsoft NEBO Windows – pak budou nalezeny všechny webové stránky, které obsahují buď první slovo, druhé slovo nebo obojí. Uživatele samozřejmě zajímají pouze ty stránky, na kterých se obě slova nacházejí společně, ale doslova se zahrabou mezi další stránky, které nepotřebuje.

Když začínáte s neznámým systémem, musíte začít kontrolou, jak zachází se skupinami klíčových slov. Nejprve se zadá jedno slovo: Microsoft. Můžete vidět, kolik výsledků systém dá.

Rambler 28184 (dokumenty)

Yandex 1048379 (dokumenty)

Poté se zadá druhé slovo: Windows. Množství se znovu zkontroluje. Obě slova jsou zadána: Microsoft Windows.

Když zadáte frázi: Microsoft, vyhledávací indexy vrátí následující výsledky:

Rambler 6641 (dokumenty)

Yandex 259276 (dokumenty)

Pokud je počet nalezených webových stránek větší než v prvním a druhém případě, pak systém uváží, že klíčová slova spolu souvisí OR (množiny jsou kombinovány). Pokud je výsledek menší než v každém z prvních testů, pak systém použije poměr AND (množiny se protínají). V obou případech si budete muset přečíst základní informace, abyste zjistili, jak dosáhnout opačného výsledku. Například všechny velké ruské vyhledávače standardně vkládají mezi slova operátor AND, ačkoli systém Yandex má své vlastní charakteristiky (viz tabulka-2). Tam se věří, že tato dvě slova by neměla být současně přítomna v dokumentu, ale v jedné větě. Pokud stačí, že jsou v dokumentu přítomny, musíte před každé slovo umístit znak<+>... Zároveň vyvstává inverzní problém: jak provést vyhledávání dokumentů obsahujících jedno z daných - klíčových slov, tedy jak nastavit relaci OR?

Rambler: Microsoft OR Windows; (50986 dokumentů)

Yandex: Microsoft | Okna; (2034641 dokumentů)

Role velkých písmen

Ve většině vyhledávačů se „chléb“ nerovná „CHLEB“, ale „CHLEB“ * „chléb“. Obecným pravidlem je, že pokud klient zadal malá písmena, prohledají se malá i velká písmena, ale pokud klient použil velká písmena, najde se přesná shoda pouze s velkými písmeny. Klasickým příkladem je Červená karkulka. Pokud je zadáte tímto způsobem pomocí velkých písmen, pak pouze dokumenty, ve kterých se vyskytuje

kombinace Červené karkulky. Pokud jsou však klíčová slova napsána jako malá červená karkulka, bude se prohledávat více dokumentů. Výběrovým sítem projdou všechny dokumenty, které obsahují kombinace: Červená Karkulka, Červená Karkulka, Červená Karkulka a Červená Karkulka. Proto by se použití velkých písmen v žádosti nemělo zneužívat a používat je pouze tehdy, když je absolutní jistota výsledku.

Některé vyhledávače jsou však jiné. Takže například v systému Rambler se při indexování všechna velká písmena násilně „snižují“ na malá. To znamená, že je zbytečné používat v dotazu v tomto systému velká písmena.

Když zadáte frázi: Červená Karkulka, indexy vyhledávání vrátí následující výsledky:

Rambler 2921 (dokumenty)

Yandex 16458 (dokumenty)

Role vyhrazených slov

Vyhrazená slova jsou slova, která se při zpracování požadavku nepočítají. Při indexování webových stránek je program vyhazuje z textu, což výrazně snižuje velikost indexů a zkracuje dobu vyhledávání. Obvykle na vyhrazená slova

zahrnuje neinformativní slova: předložky, spojky, zájmena, členy a další malá slova. Pokud tedy například v systému Yandex vyhledáte frázi „Všechno je pomíchané v domě Oblonských“, budou vyhledány i dokumenty obsahující Co je pomíchané v domě Oblonských? - a kde se to plete? V domě Oblonských? V některých systémech mohou být vyhrazena slova, která jsou extrémně běžná, a proto nejsou informativní. Pokud je systém např. zaměřen na vyhledávání knih, pak pro něj slovo kniha není informativní. Slovo auto je neinformativní pro vyhledávač, který se zabývá automobilovými záležitostmi, a slova počítač a internet jsou neinformativní pro systémy zaměřené na vyhledávání informací o výpočetní... Je zvláště důležité vzít v úvahu roli vyhrazených slov při provádění kontextového vyhledávání. kontextové vyhledávání vyžaduje přesnou shodu mezi tím, co si uživatel objednal, a tím, co se objevuje ve webových dokumentech. Pokud vyhledávač „odstranil“ webové dokumenty z vyhrazených slov ve fázi indexování, pak si nemůže poradit s kontextovým vyhledáváním, snad s výjimkou „pohledu“ do kopií webových stránek, pokud jsou uloženy, ale to vyžaduje hodně času. čas. Proto je poctivé kontextové vyhledávání ve vyhledávačích vzácné. Například v Rusku Yandex i Rambler pouze předstírají, že poskytují příležitost pro kontextové vyhledávání, proto musí být požadovaná fráze uzavřena v uvozovkách. Po několika jednoduchých testech je však snadné zjistit, že se ve skutečnosti nejedná o kontextové vyhledávání, ale o vyhledávání s přesností vyhrazených slov. Příklad, když dotaz "v domě Oblonských se vše pomíchalo" vrátí výsledek Co se pomíchalo v domě Oblonských. V tabulce 2 uvádím srovnávací popis hlavních vyhledávačů (vyhledávačů). [Příloha]


4. Srovnávací charakteristiky dvou vyhledávačů na základěRAmbler. ruaYandex. ru


4.1 RAMBLER

Rambler.ru je historicky (před Yandexem) nejpopulárnějším vyhledávačem v Rusku. Začala pracovat dříve než ostatní a dlouho byla lídrem z hlediska velikosti indexu a kvality vyhledávacích služeb. Bohužel, dnes jsou tyto úspěchy minulostí. Navzdory skutečnosti, že velikost vyhledávacího indexu „Rambler“ je přibližně 12 milionů webových stránek, nebyl ve skutečnosti dlouho aktualizován a poskytuje zastaralé výsledky. Dnes je Rambler populární portál, nejlepší klasifikační a hodnotící systém v Rusku a navíc reklamní platforma. (obr.-10)

Techniky vyhledávání v systému Rambler:

Jazyk vyhledávacího dotazu

Vyhledávací dotaz se může skládat z jednoho nebo více slov a může obsahovat interpunkční znaménka. Můžete psát jednoduché dotazy, aniž byste zacházeli do složitosti dotazovacího jazyka. Pokud tedy zadáte do vyhledávacího řádku několik slov bez interpunkčních znamének a logických operátorů, budou nalezeny dokumenty obsahující všechna tato slova (a v omezené vzdálenosti od sebe).

Znalost a správná aplikace dotazovacího jazyka vyhledávače však pomůže zrychlit a zefektivnit vyhledávání na Rambleru.

Registrovat

Obecně nezáleží na pravopisu hledaných slov a operátorů, to znamená, že home a DOM, Not a nOt jsou vnímány stejně. A jen někdy, aby se zlepšila kvalita vyhledávání, případ slov vyhledávací dotaz vzít v úvahu.

Pokud se například dotaz skládá ze dvou, tří nebo čtyř slov, z nichž každé je napsáno velkým písmenem, předpokládá se vyhledávání podle vlastního jména a omezení vzdálenosti mezi slovy dotazu se automaticky změní z výchozí hodnota na hodnotu (n-1) * 2 , kde n je počet slov v požadavku. To vám umožní najít skupinu dotazových slov, ve kterých není více než jedno „extra“ slovo nebo interpunkční znaménko, například „Baden-Baden“, „A. Puškin“, „Fjodor Michajlovič Dostojevskij“.

Operátoři

Víceslovný dotaz může obsahovat operátory. Operátoři se v dokumentu nehledají, slouží pouze jako instrukce pro vyhledávač. Všechny operátory vyhledávačů jsou binární, to znamená, že mají levou a pravou část, z nichž každá je zároveň dotazem (ve výchozím nastavení se skládá z jednoho slova). Ke změně rozsahu operátorů (seskupení více dotazových slov do argumentu operátoru) se používají závorky a uvozovky. Dva dotazy spojené operátorem AND (logický AND) tvoří složitý dotaz, který uspokojí pouze dokumenty, které současně uspokojí oba tyto dotazy. Jinými slovy, dotaz „pes A kočka“ najde pouze dokumenty, které obsahují slovo „pes“ i slovo „kočka“.

Komplexní dotaz sestávající ze dvou dotazů spojených operátorem OR (logický OR) je splněn všemi dokumenty, které splňují alespoň jeden z těchto dvou dotazů. Pokud hledáte „pes NEBO kočka“, najdete dokumenty, které obsahují alespoň jedno ze slov „pes“ nebo „kočka“ (nebo obě tato slova dohromady). Operátor NOT (logický AND NOT) tvoří dotaz, na který odpovídají dokumenty, které vyhovují levé straně dotazu a nevyhovují pravé. Takže výsledkem hledání pro dotaz „pes NOT cat“ budou všechny dokumenty, které obsahují slovo „pes“ a nikoli slovo „kočka“. Není-li operátor výslovně uveden, použije se výchozí operátor AND: budou nalezeny pouze dokumenty obsahující všechna dotazovaná slova. Dotaz „kredit informačních technologií“ tedy bude interpretován jako „informace A technologie A kredit“. Na stránce Rozšířené vyhledávání lze výchozí operátor nahradit OR (hledat slova dotazu: alespoň jedno).

Každý z operátorů má svou zkratku:

Zkratka operátora

Dotaz na několik slov proložených operátory bude interpretován podle jejich priority. Operátory AND a NOT mají tradičně vyšší prioritu, proto je dotaz na několik slov nejprve seskupen podle operátorů AND a NOT a teprve poté podle operátorů OR. Pořadí seskupení můžete změnit pomocí závorek.

Citáty

K vyhledávání uvozovek můžete použít dvojité uvozovky. Dotazová slova uzavřená v uvozovkách jsou v dokumentech vyhledávána přesně v pořadí a ve formách, ve kterých se vyskytují v dotazu. Dvojité uvozovky lze tedy použít i jednoduše k vyhledání slova v daném tvaru (standardně se slova nacházejí ve všech tvarech). Například dotazu „letadlo“ natankovalo „přistání“ vyhovuje dokument obsahující text „... letadlo přistálo a natankovalo ...“ a dokument obsahující „.. letadlo přistálo, aby natankovalo .. .“ není spokojen.

Závorky

Při sestavování dotazů je někdy nutné spojit slova dotazu do skupin, které budou argumenty určitého operátoru. Takové skupiny jsou uzavřeny v závorkách. Část dotazu v závorkách je sama o sobě dotazem a podléhá pravidlům jazyka pro vytváření dotazů. Pomocí závorek

umožňuje vytvářet vnořené dotazy a předávat je operátorům jako argumenty a také přepisovat výchozí prioritu operátorů. Pokud je dotaz bez závorek "autoletadlo | letiště" ekvivalentní dotazu "auto A letadlo NEBO letiště" a podle priorit operátora znamená "najít dokumenty obsahující buď slova" auto "a" letadlo "nebo slovo letiště, pak dotaz se závorkami "auto (letadlo | letiště)" je ekvivalentní "auto AND (letadlo OR letiště)", což znamená "najít dokumenty obsahující slovo" auto "a jedno ze slov" letadlo "nebo" letiště " ".

Metaznaky

Rambler zatím nepodporuje vyhledávání řetězců pomocí metaznaků ("*", "?"), které se obvykle používají ve významu "jakýkoli podřetězec" a "libovolný jeden znak". Tito operátoři jsou však vyhrazeni pro podobné budoucí použití.

Použití dotazovacího jazyka

Každý požadavek adresovaný vyhledávači Rambler je zpracován v souladu s pravidly dotazovacího jazyka. Některá slova a symboly jsou považovány za operátory dotazovacího jazyka a zpracovávány zvláštním způsobem. Dotazovací jazyk ve skutečnosti popisuje určitý vzorec, který se používá při vyhledávání – každý z dokumentů je s ním „spárován“ a výsledkem hledání jsou pouze ty dokumenty, které mu vyhovují. Například dotazu „letadlo“ vyhovují všechny dokumenty, ve kterých se slovo „letadlo“ v jakékoli podobě alespoň jednou vyskytlo. Žádost skládající se z několika slov je uspokojena dokumenty obsahujícími každé z těchto slov v jakékoli formě (za určitých podmínek). Problém shody dokumentů je více složitý dotaz je určeno logikou operátorů a konstrukcí dotazovacího jazyka.

Morfologie

Pro každé slovo dotazu se vyhledávání provádí s přihlédnutím k pravidlům skloňování odpovídajícího jazyka. Rambler rozumí a rozlišuje mezi slovy ruských a anglické jazyky- ve výchozím nastavení se vyhledávání provádí ve všech tvarech slova. Například při hledání slova „osoba“ najdete také dokumenty obsahující slova „osoba“, „osoba“, „osoba“ a dokonce „lidé“. Chcete-li vyhledat pouze jeden konkrétní tvar slova, musíte jej uzavřít do dvojitých uvozovek nebo použít hledání přesné fráze v rozšířeném vyhledávání.

Zastavte slova

Některá slova a symboly jsou z požadavku standardně vyloučeny kvůli jejich nízkému informačnímu obsahu. Jedná se o tzv. stop slova - nejčastější slova ruského a anglického jazyka, například předložky, částice a členy. Přítomnost těchto slov může zpomalit vyhledávání a negativně ovlivnit úplnost výsledků. Potřebu těchto slov je možné v dotazu uvést tak, že dotaz vezmete v uvozovkách nebo použijete hledání přesné fráze v rozšířeném vyhledávání.

Omezení vzdálenosti

Pokud je dotaz složen z jednoho nebo několika slov bez použití operátorů a konstruktů dotazovacího jazyka, budou nalezeny dokumenty, ve kterých budou nalezena všechna dotazovaná slova. Zároveň je u každého požadavku vždy tzv. kontextové omezení - kladné číslo, standardně se rovná vzdálenosti 40 slov. Dokument obsahující všechna dotazovaná slova bude vydán pouze v případě, že vzdálenost ve slovech mezi výskyty dotazovaných slov je menší než toto číslo. Například dotaz „rudá armáda“ najde dokumenty, ve kterých se slova „rudá“ a „armáda“ vyskytují alespoň jednou v méně než 40 slovech od sebe. Hodnotu kontextového omezení lze změnit konstrukcí "(číslo, dotaz)", kde číslo je libovolné kladné číslo, dotaz je jakýkoliv správný dotaz z pohledu vyhledávače skládající se z více slov (samozřejmě, omezování vzdálenosti mezi slovy v případě jednoslovného dotazu nemá smysl). Na žádost „(2, rudá armáda)“ tedy budou pouze ty dokumenty, ve kterých se mezi slovy „červená“ a „armáda“ alespoň jednou nevyskytuje jediné slovo (protože pouze v případě jejich bezprostřední blízkosti , rozdíl v řadových číslech slov menší než 2, tedy roven 1)

Nenalezená slova

Pokud se dotaz skládá z několika slov a některá z nich nelze na internetu vůbec najít, vrátí se výsledky hledání pro částečný dotaz, ze kterého jsou vyloučena slova, která na internetu chybí. V tomto případě se odpovídající diagnostika zobrazí na stránce s výsledky vyhledávání.


Řazení výsledků

Ve výchozím nastavení jsou nalezené dokumenty seřazeny podle relevance (odpovídající dotazu). Můžete však požádat, aby byly nejnovější (nebo případně nejstarší dokumenty) umístěny na začátek seznamu. Chcete-li to provést, vyberte příslušné nastavení v nabídce „Seřadit podle ...“ na stránce podrobného požadavku. Můžete také omezit vyhledávání na dokumenty vytvořené v určitém časovém období: k tomu musíte na stránce s podrobným požadavkem zadat „Od data ... do data ...“.

Vzdálenost mezi slovy

Můžete požadovat, aby Rambler vrátil pouze ty dokumenty, kde jsou slova z dotazu od sebe v minimální vzdálenosti. Režim "Omezit mezery mezi slovy" lze povolit v podrobném dotazu. Všechna výše uvedená pravidla lze použít společně v požadovaném pořadí.

Doručování výsledků

Ve výchozím nastavení jsou výsledky hledání vráceny v částech 15 dokumentů. Nabídka "Vydání ..." na stránce s podrobným požadavkem umožňuje zvýšit toto číslo na 30 nebo 50. Nabídka "Výstupní formulář..." umožňuje přijímat popisy dokumentů se zvýšenou nebo sníženou podrobností.


4.2 YANDEX

Yandex.ru je vyhledávač schopný na požádání najít nejvhodnější webové stránky v ruské části internetu. Yandex každý den prohledává stovky tisíc webových stránek a hledá změny nebo nové odkazy. Sbírka odkazů se neustále rozrůstá. Yandex nevyžaduje znalost speciálních vyhledávacích příkazů. Yandex najde každého, kdo odkazoval na stránku, soubory s požadovaným obrázkem, nejnovější zprávy nebo produkty v elektronických obchodech. Srdcem systému Yandex je největší index – asi 27 milionů webových stránek, ale nejde jen o velikost. Není to jen ukazatel na zdroje, ale ukazatel na nejaktuálnější zdroje. Z hlediska relevance je dnes Yandex nesporným lídrem (obr. 4)

Techniky vyhledávání v systému Yandex

Než budu pokračovat v popisu dotazovacího jazyka systému Yandex, poznamenávám, že je znatelně výkonnější a složitější než dotazovací jazyky jiných domácích vyhledávačů. Běžný uživatel se však nemusí nechat zastrašit. I když ho opravdu nebaví číst a navíc studovat návod, dokáže se systémem pracovat intuitivně.

Systém Yandex v zásadě používá při své práci heuristické algoritmy, které nejsou z matematického hlediska zcela přísné. V důsledku toho může uživatel získat různé výsledky, například pokud hledá dokumenty se slovy Bush Gore volby a Bush Gore volby. Ale díky těmto algoritmům dává intuitivní přístup k vytváření dotazů (bez čtení pokynů) velmi dobrý výsledek, navíc ve velmi krátkém čase.

Hledejte podle jednoho slova

Když uživatel zadá hledané slovo do vyhledávacího pole a klikne na tlačítko Najít, slova se vyhledají se všemi možnými tvary slov, což je důležité zejména pro ruský jazyk. Pokud je například zadáno slovo sníh, pak budou nalezeny dokumenty, které obsahují slova sníh, sníh atd., ale nikoli zasněžený, zasněžený atd. Pokud není vyhledávání tvarů slov vyžadováno, lze jej zrušit pomocí například znak vykřičníku! sníh.

Vyhledávání podle skupiny slov

Pokud jsou slova oddělena mezerou, jsou prohledávány dokumenty, ve kterých jsou všechna zadaná slova nalezena v jedné větě. Tedy na žádost voleb Bushe Gorea

systém vydává dokumenty s frázemi jako... V předvečer voleb se hackeři nabourali na webové stránky Bushe a Gora. Mezi výsledky takového hledání jsou možné volné shody - vyhledávač ukazuje svou inteligenci. Chcete-li přísně zajistit vzhled slov ve větě, musíte před ně umístit znak +, například takto: + Bush + Gore + volby. Znak + musí být zapsán společně se slovem, ke kterému se vztahuje (bez mezery). Mezera hraje roli operátoru AND, který lze zadat i explicitně (symbol &), například: + Bush & + Horus & + volby. Napravo a nalevo od logického operátoru musí být mezery.

Pokud potřebujete současnou přítomnost slov nejen ve větě, ale v celém dokumentu, použije se operátor &&, např.: + Bush && + Gore && + volby.

Nyní budu uvažovat o technikách vyloučení slov z vyhledávání. K tomu použijte: znak - (přísná výjimka z věty), znak ~ (nepřísná výjimka z věty) a znak ~~ (výjimka z celého dokumentu). Takže například požadavek + Bush + Gore ~~ volby umožní

vyberte dokumenty, ve kterých jsou slova Bush a Gore v jedné větě, ale celý dokument neobsahuje slovo volby a jeho odvozeniny (volba, při volbách, po volbách atd.).

V případech, kdy potřebujete kombinovat klíčová slova pomocí operátoru OR, použijte | (svislý pruh). Například požadavek Bush | Volby Gore &&+ vyberou dokumenty, které zmiňují buď George W. Bushe, nebo Alberta Gorea, ale nepochybně

tam je slovo volby.

Vyhledávání podle vzdálenosti

Již dávno se ve vyhledávačích objevil operátor NEAR, který umožňuje najít dokumenty, ve kterých jsou dvě slova umístěna blízko sebe. Je pravda, že každý systém chápe „blízko“ jinak. Ve vyhledávači Yandex můžete konkrétně uvést, v jaké vzdálenosti by tato slova od sebe měla být.

V dokumentu má každé slovo své vlastní číslo pozice. Čísla pozic dvou sousedních slov se liší o jedna (číslo pozice slova vpravo je větší). Operátor vzdálenosti se zapisuje jako / + n, kde n je číslo odpovídající vzdálenosti. Například operátor / + 1 odpovídá dvěma po sobě jdoucím slovům, to znamená, že Microsoft / + 1 Windows je totéž jako Microsoft Windows.

Operátor vzdálenosti může být také záporný. To znamená, že druhé slovo uvedené v žádosti se musí objevit před prvním v dokumentu. Například dotaz Microsoft / -5 Windows může odkazovat na dokument obsahující frázi o operačních systémech, které nahradí Windows, řekl výkonný ředitel společnosti Microsoft.

Při vyhledávání zadáním vzdálenosti můžete zadat nikoli přesnou vzdálenost mezi slovy, ale rozsah, například / (- 5 +5). V tomto případě budou vybrány dokumenty, ve kterých slova zadaná v dotazu jako klíčová slova spadají do zadaného rozsahu. Ve skutečnosti, pokud není zadán znak parametru, jedná se také o hledání rozsahu. Takže operátor / 5 by měl být skutečně považován za rozsah / (- 5 +5). Žádost o Bush / 5 Gore najde návrhy jako: Ženy sympatizovaly s Bushem a muži sympatizovali s Gorem nebo Gorem Bushem nebylo o nic sladší.

Systém - Yandex má poměrně složitá pravidla pro dotazovací jazyk (ve srovnání s Ramblerem), ale má rozsáhlé možnosti. Například vzdálenosti lze měřit nejen mezi slovy, ale i mezi větami. Tato jednotka se používá, když je v dotazu použito dvojité && nebo ~~. Dotaz Bush / + 1 && Gore tedy vrátí dokumenty, ve kterých se slova Bush a Gore vyskytují buď ve stejné větě, nebo v sousedních větách.

Pomocí závorek

Vyhledávací úloha je v podstatě booleovský výraz, který funguje jako filtr při prohlížení dokumentů obsažených v databázi vyhledávače. PROTI

v logickém výrazu, stejně jako v aritmetickém výrazu, můžete použít závorky. Slouží ke kontrole pořadí akcí. Příklad: Bush & Gore & (volby | hlasování). Takový dotaz vrátí odkazy na webové stránky obsahující návrhy, které obsahují slova Bush, Gore, volby nebo Bush, Gore, hlas.

Řízení žebříčku

Účelem hodnocení je zajistit, aby webové stránky, které

ty, které nejlépe odpovídaly dotazu, byly zobrazeny v seznamu výsledků co nejdříve. Jaké algoritmy vyhledávač používá pro hodnocení, je jeho věc. Uživatelé jsou se svou prací buď spokojeni, nebo se obrátí na jiný vyhledávač. V systému Yandex je možné nezávisle měnit algoritmus hodnotícího mechanismu pomocí váhových faktorů. Takový faktor lze přiřadit libovolnému klíčovému slovu nebo celému výrazu, pokud je uzavřen v závorkách: Váhy se zadávají přes dvojtečku, například Bush: 5 Gore volby. Při takovém dotazu mají dokumenty, ve kterých se slovo Bush vyskytuje častěji, přednost a objevují se ve výsledném seznamu na vyšších pozicích.

Další technika pro řízení hodnocení souvisí s kvalifikačním slovem. Toto slovo nemusí být obsaženo ve vybraných dokumentech, ale pokud tam je, pak tento dokument dostane prioritu pořadí. Kvalifikační slovo se zadává za znaky<_. Например, при поиске по ключевым словам Гор Буш<_младший выборы получат преимущество Web-страницы, в которых речь идет не просто о Джордже Буше, а о Джордже Буше-младшем.

Speciální vyhledávání

Techniky vyhledávání informací obsažených ve speciálních polích záhlaví webových stránek (každá webová stránka má v záhlaví pole služeb) nebo hledání speciálních prvků obsažených na webových stránkách, jako jsou hypertextové odkazy, stojí stranou. V systému Yandex začínají speciální vyhledávací příkazy v polích záhlaví

se znakem $ a příkazy pro vyhledání jednotlivých prvků webových stránek se znakem #. Všechna ad-hoc vyhledávání jsou znatelně pomalejší než konvenční vyhledávání.

Příkaz

Popis

Příklad

Vysvětlení

$ titul (výraz)

Vyhledávání klíčových slov uvedených ve výrazu se provádí pouze v názvech webových stránek


$ title (Space)


Vyhledávají se pouze webové stránky se slovem Cosmos v názvu (obr. 7.10)



Hledání klíčových slov uvedených ve výrazu se provádí pouze v kotvách interních odkazů webových stránek


$ kotva (úvod)


Vnitřní (výraz)


#klíčová slova = (výraz)


#keywords - (novinky)



#abstrakt = (výraz)


Vyhledávání v anotaci webové stránky

#abstract = (Bush | Gore)


#image = "název souboru"


Vyhledejte soubory s ilustracemi podle jejich názvu


#image - "Bush. *"

Pokud předem nevíte, jakou příponu může mít název souboru, použijte zástupný znak „*“, který nahradí libovolný počet libovolných znaků


#hint - (výraz)

Hledejte slova v alternativním textu ilustrací


(Bush | Gore)



#url = " URL-adresa"

Najděte web nebo webovou stránku


# uri. = "www.anysite.ru"


Obvykle se používá k lokalizaci vyhledávání. Například omezit rozsah vyhledávání na jeden web, nebo jej naopak z rozsahu vyhledávání vyloučit


#odkaz - adresa"

Běžně používané " URL- k identifikaci webových stránek, které mají hypertextové odkazy na vlastní stránku


Závěr

Byl jsem schopen plně odhalit položené otázky a přišel jsem na toto téma (jak provádět efektivní vyhledávání na internetu?). Z vlastní zkušenosti jsem se přesvědčil, že v naší době špičkových technologií není efektivní vyhledávání informací řešitelné a zůstává jedním z nejdůležitějších problémů. Mohu to vysvětlit následovně.

Za prvé to není dokonalost samotných vyhledávačů, která zpochybňuje jakékoli vyhledávání.

Vyhledávačům chybí řád, struktura, struktura, strukturování, stejně jako systém, systematizace, systematizace, roboti většiny vyhledávačů přinášejí obrovské množství zbytečných hypertextových odkazů,

Za druhé, nezkušenost uživatelů. hledat a najít to, co potřebujete v hromadě textů na internetu, je dovednost nejen vyhledávače, ale i uživatele, který se ptá.

Za třetí, chamtivost programátorů a reklamních agentur, které si je najímají, chtějí, aby jejich stránky byly požadovány co nejčastěji. Tito "chamtiví" programátoři oklamou roboty a rozdají na internetu stránku, která údajně obsahuje informace, které uživatel potřebuje, a existují reklamní brožury nebo automatický hypertextový odkaz požadující reklamní stránku nebo ještě hůře placenou stránku. Přestože se specialisté obsluhující vyhledávače s tímto fenoménem potýkají, stále každým dnem nabývá velkých rozměrů.

Internet dnes používá jako referenci 23 % uživatelů, výzkumný nástroj 15 %, zábavu 14 % a pouze jako zdroj zpráv 12 %.

Není optimistický názor, že 10 % uživatelů vždy a 73 % často dokáže najít potřebné informace.

Na otázku, který vyhledávač je nejlepší a který raději používám, odpovím takto: musíte použít stroj, který je pohodlnější, a pro mě je pohodlnější používat Yandex.

Internet usnadnil vyhledávání a vyžadoval specifické znalosti o vyhledávání, dnes není vždy efektivní, jsme teprve na úsvitu jeho rozvoje. A proto nezapomínejte na staré neméně efektivní vyhledávání informací – knihy a knihovny, tento zdroj informací se ospravedlňuje již od dob „Alexandrijské knihovny“ a internet bude v blízké budoucnosti jen efektivnější a se stanou téměř nenahraditelnými.

Seznam použité literatury


1.Andrey Alikberov "Pár slov o tom, jak fungují roboti vyhledávačů".

# "#"> Používá se jazyk vyhledávače Yandex

Hledejte podle fráze

Předpony

Iterativní vyhledávání (ve výsledcích)

Po přihlášení klikněte na Více...

nahrazení části slova

* (ne vždy správně)


Tabulka 2

Kontingenční tabulka nejlepších vyhledávačů


JSEMndex

Aport!

AltaVista

Oblast hledání, velikost databáze

Ruská část internetu. Prohledávejte stránky stránek ze sekce katalogu podle regionu. Speciální vyhledávání zpráv, zboží, obrázků.

Ruská část internetu.

Ruská část internetu. Specializované vyhledávání zpráv, produktů, obrázků, MP3

Specializované vyhledávání zpráv, produktů, zábavy, zvuku (MP3) a videa.

Specializované vyhledávání univerzit USA, Apple, Linux, BSD

Základní objem na začátku roku 2001

Více než 31 milionů dokumentů

Více než 12 milionů dokumentů

Více než 14 milionů dokumentů

Více než 250 milionů dokumentů

1,25 miliardy stránek

Typ indexování

fulltextové indexování

fulltextové indexování

fulltextové indexování

fulltextové indexování a indexování pomocí odkazů

Dostupnost doplňkových služeb

Systém integruje vyhledávač a katalog a také řadu doplňkových projektů (Bookmarks.Ru, Narod.Ru, systém inteligentního výběru zboží, CY atd.).

Systém integruje vyhledávač, katalog a doplňkové služby (online nákupy atd.)

Systém integruje vyhledávač, katalog a řadu doplňkových služeb (hosting, registrace doménových jmen, překlady atd.)

Systém kombinuje vyhledávač a adresář obsahující 15 sekcí a 1,5 milionu webových stránek.

Syntaxe vyhledávacího jazyka

logické AND

mezera nebo & (uvnitř věty) && (v dokumentu)

AND, &, mezera mezi slovy ve výchozím nastavení

A AND, &, +, výchozí mezera mezi slovy

AND, & (pouze komplexní vyhledávání)

výchozí pro všechna hledaná slova

logické NEBO

OR (výchozí pro jednoduché vyhledávání), | (pouze pro komplexní vyhledávání)

binární operátor AND NOT

~ (v rámci věty)

~ ~ (v dokumentu)

nepoužívá

nahrazen operátorem předpony "-" (AND je výchozí mezera)

A NE,! (pouze pro komplexní vyhledávání)

nahrazen operátorem předpony "-"

předpony požadovaných (+) a zakázaných (-) slov

nepoužívá

+, - (pouze jednoduché vyhledávání)

seskupování slov

nepoužívá

vzdálenost mezi klíčovými slovy ve vyhledávání

/ (n m) - slovy, && / (n m) - ve větách (- zpět, + vpřed)

s pokročilým vyhledáváním - vydávání dokumentů pouze s minimální vzdáleností mezi slovy

sl2 (...), c2 (...), w2 (...), (- zpět, + vpřed)

BLÍZKO (do 10 slov, pouze pro komplexní vyhledávání)

nepoužívá

hledání frází

náhradní znaky části slova

*,? (nahraďte libovolný znak)

* (pouze na konci slova)

jazykové omezení dokumentu

výběr: libovolná, azbuka, latinka

výběr: libovolný, ruština, angličtina

výběr: ruština, angličtina

výběr z 25 jazyků

výběr z 25 jazyků

morfologie

všechny deklinace a konjugace standardně,! (hledejte přesný tvar slova)

# (všechny tvary slov), @ (slova stejného kořene)

! (označující normální formu)

vyhledávání data

omezit vyhledávání podle polí

Vyhledávání v názvech, adresách, názvech dokumentů (pouze s rozšířeným vyhledáváním). Hledejte podobné dokumenty.

Rozšířené možnosti formy, kvalita péče

nastavení rozšířeného formuláře

nastavení filtru slovníku, nastavení podle data, podle webu, odkazu, obrázku, speciálního objektu

podle dokumentu, data, AND, OR režimů, mezer mezi slovy, zkrácení slov

podle dokumentu, názvu, data obrázku, 5 sekcí (stránky, MP3, obrázky, produkty, novinky)

podle booleovského dotazníku, data, webu, odkazu, obrázku, textu atd.

přizpůsobení výstupu výsledků

nastavení počtu výsledků na stránku, výstupní formulář

nastavení formy vydání

nastavení počtu výsledků na stránce, všech prvků výstupního formuláře

nastavení počtu výsledků na stránce, všech prvků výstupního formuláře

hodnocení výsledků vyhledávání

seřadit podle relevance nebo data

podle oblíbenosti stránek

podle podmínek specifikovaných v SORT

podle citace (odkazy na stránku z jiných stránek)

iterativní vyhledávání (ve výsledcích vyhledávání)

Ano. Provedete zaškrtnutím políčka

Ano. Hotovo s přepínačem rozsahu vyhledávání

Provedete zaškrtnutím políčka

Hotovo

kvalita sekce nápovědy

je zde podrobný popis dotazovacího jazyka, syntaktická tabulka a část o vyhledávání v kategoriích

krátká sekce HELP

podrobný odkaz na dotazovací jazyk, existuje mnoho ruských synonym pro hlavní operátory

největší online výukový program pro dotazovací jazyk, o kterém se hovoří v této tabulce

velmi omezená sekce HELP

rodinný filtr