Optymalizacja schematu ważenia terminów dla modelu wektorowego
Wariant tytułu
Term frequency optimization for the vector space model
Autor
Niewiarowski, Artur
Opublikowane w
Czasopismo Techniczne. Mechanika
Numeracja
R. 109, Z. 26, 9-M
Data wydania
2012
Miejsce wydania
Kraków
Wydawca
Wydawnictwo PK
Język
polski
Słowa kluczowe
data mining, text mining, obliczenia równoległe, grupowanie dokumentów
data mining, text mining, parallel computing, aggregate documents
Abstrakt
Artykuł opisuje wybrane metody ważenia terminów dla modelu wektorowego dokumentów tekstowych oraz wybrane metody wyznaczania podobieństw. Dodatkowo, dla zwiększenia dokładności analizy danych, zaimplementowano w procesie ważenia algorytm miary podobieństwa ciągów oparty na odległości Levenshteina. W celu przyspieszenia komparacji danych użyto technologii obliczeń równoległych.
Article describes selected terms weighted methods for the vector space model of text documents and selected methods of determine similarities. To improve accuracy of data analysis was implemented algorithm which calculates similarity measure between two strings, based on Levenshtein distance. For accelerate data comparison was used parallel computing technology.
Wydział
Wydział Fizyki, Matematyki i Informatyki
Licencja
Licencja PK. Brak możliwości edycji i druku.
Prawa dostępu
Zasób dostępny dla wszystkich
Na stronie wykorzystywane są pliki cookie, bądź podobne rozwiązania. Aby poznać szczegóły zapoznaj się z polityką prywatności.