UPOL Search engine is search engine for upol.cz domain, topic of Master thesis on Department of Computer Science UPOL
Contact me before you do that please.
- Tomáš Mikula
- mail@tomasmikula.cz
Goal of the UPOL-Crawler is crawl http://upol.cz domain for gathering all avalible links on this domain. UPOL Crawler respect robots.txt
so you can use it if you need to limit my crawler.
User-Agent: UPOL-Crawler
Disallow: *
Full user-agent string
Mozilla/5.0 (compatible; UPOL-Crawler/[version]; +https://github.com/UPOLSearch/UPOL-Search-Engine)
UPOL Search engine je search engine pro upol.cz doménu. Projekt je součástí diplomové práce na Katedře Informatiky UPOL.
Pokud je to možné kontaktujte mě.
- Tomáš Mikula
- mail@tomasmikula.cz
Cílem crawleru je procházet doménu http://upol.cz za účelem získání všech dstupných odkazů na této doméně. UPOL Crawler respektuje soubor robots.txt
, tudiž je možné využít tento soubor pro zablokování crawleru.
User-Agent: UPOL-Crawler
Disallow: *
Celkový user-agent
Mozilla/5.0 (compatible; UPOL-Crawler/[version]; +https://github.com/UPOLSearch/UPOL-Search-Engine)