vyhledávání v rozsáhlých dokumentech

Prakticky všechny vyhledávací stroje webových serverů trpí jednou podstatnou chybou: Když například na Google zadám vyhledávací dotaz, vidím u něj kontext, ale po prokliknutí na danou stránku musím ten kontext ve kterém se klíčové slovo vyskytuje pracně hledat pomocí CTRL+F, zejména tehdy, pokud je dokument rozsáhlý. Vyhledávací stroj Midnight Publisheru je (zatím) mnohem hloupější než Google, ale má jednu podstatnou přednost, přistanete přímo v kontextu hledaného výskytu klíčového slova a nikoli na začátku 20 obrazovek dlouhé stránky.

Funguje to tak, že Midnight Publisher čísluje odstavce a opatřuje je kotvou, takže kliknutím na odkaz z vyhledávací stránky je uživatel přenesen přímo na začátek odstavce, který obsahuje hledaný výraz.

Vyhledávání probíhá ve dvou průchodech, v prvním jsou hledána slova názvech článků a nadpisech (a řadí se na začátek výpisu výsledků vyhledávání, ve druhém průchodu jsou hledaná slova v textu, což zvyšuje relevanci výsledků vyhledávání.



odkazy na tuto stránku: reference:weby:purehtml home midnight publisher