Detektory zasobów informacji w crawlingu polskiego Internetu na przykładzie przemysłu tłoczniczego

Typ: Artykuł

Liczba pobrań: 1519

Pobierz zasób

PDF

Cytuj

BibTeX EndNote

Tytuł: Detektory zasobów informacji w crawlingu polskiego Internetu na przykładzie przemysłu tłoczniczego
Wariant tytułu: Information detection in polish Web resources crawling based on stamping industry example
Autor: Opaliński, Andrzej

Turek, Wojciech

Głowacki, Mirosław

Hojny, Marcin
Opublikowane w: Czasopismo Techniczne. Mechanika
Numeracja: R. 108, Z. 7, 4-M2
Data wydania: 2011
Miejsce wydania: Kraków
Wydawca: Wydawnictwo PK
Język: polski
Abstrakt: W artykule zaprezentowano koncepcję stworzenia narzędzia wspomagającego wyszukiwanie informacji zgromadzonych w zasobach polskiego Internetu. Działa ono opierając się na systemie zbierającym i indeksującym dane oraz dedykowane gramatyki wyszukiwania, pozwalając efektywniej odnajdywać wartościowe informacje w sieci. Zaprezentowano przewagę prezentowanej koncepcji w porównaniu z rezultatami otrzymanymi przy użyciu wyszukiwarki Google dla przykładu z przemysłu tłoczniczego. Zaprezentowano także możliwości adaptacji systemu do innych gałęzi przemysłu oraz ewolucję jego wersji podstawowej.

The paper presents the idea of an information extraction and search support system based on polish Web resources. System consist web crawling, data indexing and dedicated grammar syntax modules, which results with results quality improvement. As an usage example, it is presented stamp industry use case, compared to Google search results. Possible usage domains, improvement and evolution directions are shown in conclusion.
Wydział: Zbiory cyfrowe BPK
Licencja: Licencja PK. Brak możliwości edycji i druku.
Prawa dostępu: Zasób dostępny dla wszystkich