Rozprawa dotyczy opracowania metody syntezy informacji wizyjnej 2D w celu stworzenia zaawansowanego systemu nadzoru przestrzeni publicznych, zdolnego do automatycznej detekcji i klasyfikacji zdarzeń alarmowych w rzeczywistym środowisku monitoringu wizyjnego. Opracowany system IVSS integruje różnorodne typy danych, takie jak: modele szkieletowe, ramki „bounding box”, tekst, jasność obrazu, ekstrakcja tła, detekcja krawędzi oraz rzutowanie 3D. System umożliwia detekcję 15 typów zdarzeń alarmowych, m.in. identyfikację pojazdów (ANPR), sabotaż kamery, nielegalne parkowanie, przemoc czy pożar. System wykorzystuje narzędzia, takie jak: OpenCV, YOLO v4, OpenPose i Tesseract OCR. Opracowano autorskie rozwiązania, np. algorytmy automatycznej korekty jasności obrazu i kalibracji sceny oraz rozwinięto istniejące algorytmy realizujące np. detekcję przewrócenia się osoby. Rezultaty przeprowadzonych badań empirycznych wskazują na osiągnięcie zadowalających wartości wskaźników oceny jakości pracy systemu: dokładność 87%, precyzja 96%, czułość 85% i F1 90%. System działa w czasie rzeczywistym, jest modułowy i możliwy do dalszej rozbudowy. Wyniki przeprowadzonych badań potwierdzają realizację założonych celów oraz weryfikują postawione tezy badawcze.
The dissertation focuses on developing a method for synthesizing 2D visual information to create an advanced public space surveillance system capable of automatic detection and classification of alarm events in real-world video monitoring environments. The developed IVSS system integrates various data types, including skeletal models, bounding boxes, text, image brightness, background extraction, edge detection, and 3D projection. It enables the detection of 15 types of events, such as vehicle identification (ANPR), camera sabotage, illegal parking, violence, and fire. The system employs tools such as OpenCV, YOLO v4, OpenPose, and Tesseract OCR. Proprietary solutions were developed, including algorithms for automatic image brightness correction and scene calibration, and existing algorithms were extended, such as fall detection of a person. The results of empirical research indicate satisfactory system performance metrics: 87% accuracy, 96% precision, 85% sensitivity, and 90% F1 score. The system operates in real-time, is modular, and can be further expanded. The research outcomes confirm the achievement of the set objectives and validate the proposed research hypotheses.