В статье представлен Filatron — интеллектуальная программная система, предназначенная для автоматической кластеризации, классификации и анализа разнородных цифровых файлов. Сочетая передовые методы нейронных сетей с классическими статистическими методами, приложение использует алгоритмы машинного обучения, такие как KMeans, Random Forest, Isolation Forest и ARIMA, для организации файлов на основе их расширений, энтропии и метаданных. Она интегрирует инструменты обработки естественного языка, такие как TF-IDF, для анализа текстового контента и извлечения ключевых слов, повышая интерпретируемость коллекций файлов. Система имеет кроссплатформенный графический интерфейс и включает в себя такие возможности, как обнаружение аномалий, прогнозирование тенденций роста, анализ дубликатов и автоматическое планирование. Благодаря модульной архитектуре и высокой эффективности обработки, Filatron оказывается особенно полезным в средах, требующих обработки больших объемов неструктурированных данных, таких как научно-исследовательские учреждения, корпоративные ИТ-инфраструктуры и системы цифрового архивирования.
Инноватика-2025 : сборник материалов XXI Международной школы-конференции студентов, аспирантов и молодых ученых, 28-30 апреля 2025 г., г. Томск, Россия. Томск, 2025. С. 441-446
Language
rus
Created: 18-12-202575 Visitors59 Hits25 Downloads
Факультет инновационных технологий
Разработка программного средства на основе нейросетевых алгоритмов для автоматической кластеризации файлов по расширениям