Detektory zasobów informacji w crawlingu polskiego Internetu na przykładzie przemysłu tłoczniczego
Wariant tytułu
Information detection in polish Web resources crawling based on stamping industry example
Autor
Opaliński, Andrzej
Turek, Wojciech
Głowacki, Mirosław
Hojny, Marcin
Opublikowane w
Czasopismo Techniczne. Mechanika
Numeracja
R. 108, Z. 7, 4-M2
Data wydania
2011
Miejsce wydania
Kraków
Wydawca
Wydawnictwo PK
Język
polski
Abstrakt
W artykule zaprezentowano koncepcję stworzenia narzędzia wspomagającego wyszukiwanie informacji zgromadzonych w zasobach polskiego Internetu. Działa ono opierając się na systemie zbierającym i indeksującym dane oraz dedykowane gramatyki wyszukiwania, pozwalając efektywniej odnajdywać wartościowe informacje w sieci. Zaprezentowano przewagę prezentowanej koncepcji w porównaniu z rezultatami otrzymanymi przy użyciu wyszukiwarki Google dla przykładu z przemysłu tłoczniczego. Zaprezentowano także możliwości adaptacji systemu do innych gałęzi przemysłu oraz ewolucję jego wersji podstawowej.
The paper presents the idea of an information extraction and search support system based on polish Web resources. System consist web crawling, data indexing and dedicated grammar syntax modules, which results with results quality improvement. As an usage example, it is presented stamp industry use case, compared to Google search results. Possible usage domains, improvement and evolution directions are shown in conclusion.
Wydział
Zbiory cyfrowe BPK
Licencja
Licencja PK. Brak możliwości edycji i druku.
Prawa dostępu
Zasób dostępny dla wszystkich
Na stronie wykorzystywane są pliki cookie, bądź podobne rozwiązania. Aby poznać szczegóły zapoznaj się z polityką prywatności.