Технологии машинного обучения
Технологии машинного обучения и глубокого обучения уже применяются в оборудовании видеонаблюдения. Развитие компьютерных систем достигло такого уровня, что в ряде случаев участие человека уже не требуется. Автоматизация систем видеонаблюдения предполагает, что компьютерная система сможет сама принимать сложные решения, выходящие за пределы узкоспециализированных алгоритмов, которые обладают весьма ограниченными возможностями и требуют участия человека. Возникает логичный вопрос: какую роль автоматизация играет в системах безопасности которые включают в себя и системы видеонаблюдения.
Прежде всего, стоит принять во внимание тот факт, что количество IP-видеокамер в мире (включая территорию России) быстро растет. По данным «IHS Markit», только в Китае к 2020 г. ожидается увеличение количества видеокамер до 626 млн. Для эффективной работы такого количества устройств необходима автоматизация. Она используется для обработки, поступающей от видеокамер информации и для ее хранения.
Кроме того, сегодня системы видеонаблюдения используются не только для классических задач, но и для специализированных. Например, применение видеонаблюдения в области торговли предъявляет дополнительные требования к функциональным возможностям видеокамер: в этой сфере актуальны подсчет количества посетителей и генерация «тепловой карты».
Требования к интеллектуальным функциям постоянно повышаются. Распознавание лиц становится все более точным, системы уже сейчас определяют пол, возраст и настроение людей. В сфере транспортной безопасности наряду с определением номера транспортного средства всё большую актуальность приобретает сбор дополнительной информации об автомобиле (цвет, марка и модель), определение факта использования ремня безопасности и разговора по телефону во время вождения.
Применение автоматизации в системах машинного зрения требует использования машинного обучения (Machine Learning), в частности, «глубокого обучения» (Deep Learning).
Машинное обучение
Machine Learning основано на алгоритмах анализа данных, характерной чертой которых является возможность обучения в процессе решения множества сходных задач. Использование машинного обучения в сфере видеонаблюдения накладывает ряд серьезных ограничений на применение данной технологии. Например, для обнаружения разницы между объектами и фоном необходимо использовать множество классификаторов, таких как фильтры детекции градиентов, фильтры определения формы. Как результат долгое время при высоких требованиях к аппаратной части точность работы системы в ряде сценариев была низкой. Ситуация изменилась в середине 2000-х годов: с появлением высокопроизводительных видеопроцессоров компании «Nvidia» стало возможно использовать системы «глубокого обучения» в видеонаблюдении.
Глубокое обучение
Deep Learning – это совокупность методов машинного обучения, основанных на обучении представлениям, а не на узкоспециализированных алгоритмах. В Deep Learning используется математическая модель нейронной сети. В основе лежит идея о том, что любой предмет состоит из других небольших объектов и более простых элементов. Таким образом, структура нейронной сети представляет собой определенное количество слоев.
Благодаря быстрому увеличению производительности современных процессоров в плане соотношения «производительность на ватт» использование «глубокого обучения» в системах машинного зрения из возможности превратилось в реальность.
За последние десять лет производители процессоров и видеопроцессоров выпустили ряд решений, оптимизированных для работы с нейросетями, например, серию видеокарт «Nvidia Tesla». Появились решения, предназначенные для применения в сфере машинного зрения, например, серия VPU «Intel Movidius» и «Nvidia Jetson».
«Глубокое обучение» расширяет возможности систем машинного зрения. «Классический» интеллектуальный алгоритм анализа видео-контента основан на извлечении требуемых данных для их обработки с последующим сравнением и распознаванием. При этом на точность результата могут влиять различные факторы: изменение условий освещения, различные погодные условия.
«Глубокое обучение» заменяет функции извлечения эффективными алгоритмами, которые способны работать в полуавтоматическом или автоматическом режимах, тем самым увеличивая точность обработки данных и уменьшая воздействие сторонних факторов.
Таким образом, можно выделить следующие преимущества применения систем Deep Learning:
- Новые функциональные возможности оборудования для видеонаблюдения.
- Повышение производительности.
- Увеличение точности отработки существующих интеллектуальных функций.
Оборудование на базе технологии Deep Learning уже представлено на рынке. Среди них видеокамеры с функциями определения примет человека, которые способны определить пол, примерный возраст, настроение, наличие очков, маски. Кроме того, устройства распознают цвет одежды, наличие багажа и головного убора. Существуют видеокамеры с возможностью хранения базы лиц непосредственно внутри самого устройства. Со временем количество функций в таких решениях будет увеличиваться, а точность распознавания расти.
Также уже сейчас доступны видеокамеры, определяющие не только номер транспортного средства, но и его детали: цвет, тип, марку и модель автомобиля.
Новое поколение видеорегистраторов способно реализовать вышеперечисленные функции своими силами. Это означает, что заказчик может получить все преимущества интеллектуальных функций без необходимости замены существующих видеокамер – достаточно обновить видеорегистраторы.
Существует и программное обеспечение, предназначенное для применения в проектах уровня «Безопасный город». Оно фиксирует скопления людей с последующей идентификацией участников.
Перспективы
Эксперты в области систем машинного зрения признают преимущества технологии «глубокого обучения» и ясно осознают перспективы ее применения и возможности, которые получит индустрия распознавания образов. Например, для индустрии розничной торговли будет актуальным контроль выкладки и наличия товара на полках, распознавание лояльных покупателей, контроль очередей. Технология будет актуальна для медицины и управления автономными транспортными средствами, а также для контроля качества, выявления брака и сортировки материалов на производственных линиях.
Новые технологии будут востребованы в крупных проектах уровня «Безопасный город», где необходимо обнаруживать и контролировать массовые скопления людей в режиме реального времени. Своевременное обнаружение большой группы лиц и передача всей оперативной информации о подозрительных лицах в ситуационный центр значительно увеличат уровень безопасности городов.
Стоит отметить, что облачные системы значительно расширят свою функциональность. Видеонаблюдение превратится в услугу. Вместо регулярного использования интеллектуальной системы будет расти популярность разового обращения для получения анализа в связи с какими-либо событиями. По просьбе заказчика провайдер загрузит видеоархив на облачный сервер, где и будет осуществлен поиск и анализ произошедшего с последующим формированием отчета.