Штучний розум?

12

Час звичайних систем охоронного телебачення залишилося в далекому минулому. Сьогодні нікого не здивуєш відеозапис з камери спостереження, це вже повсякденність. Прийшла пора інновацій, освоєння нових обчислювальних ресурсів, IP-камер з детекторами руху на борту та інших тямущих «гаджетів» для систем безпеки. І в століття високих технологій в науці про відеоспостереження з’явилося нове віяння з привабливою назвою «видеоаналитика». Що ж, ринок досить швидко зацікавився новим трендом, а спритні маркетологи звели це досягнення науки і техніки в ранг всемогутнього, всезнаючого і всевидющого штучного розуму. Але чи так це насправді? Спробуємо розібратися і визначити, що ж є міфом, а реальністю, коли мова йде про видеоаналитике.
Розповіді про штучному інтелекті
Коли в природі з’явиться штучний інтелект, ви не зможете про це не почути. Це буде така ж інформаційна бомба, як і атомна. І до того ж не менш небезпечна. Сьогодні всі розповіді про нього нічим не відрізняються від розмов про феншуй – начебто він і є, і навіть модно.
Видеоаналитика дозволяє розрізняти й ідентифікувати об’єкти
Часто на виставках нам показують гарні відеоролики з бігаючими людьми в квадратах з номерами, а менеджери переконливо розповідає, що система захопила об’єкт і зараз повністю контролює його поведінку. Але в реальних умовах так красиво це працювати не буде. Звернувшись до теорії, можна виділити два основних види відеоаналітікі за типом: відеоаналіз на основі детектора об’єктів OA (Object Analysis) і статистичний відеоаналіз SA (Statistic Analysis). Перший – найбільш просто реалізується – відноситься до групи так званих жорстких алгоритмів і заснований на вже зібраної математичної бібліотеці – детекторі об’єктів, який здатний ідентифікувати окремо рухомі цілі. Object Analytics дає широкий простір для фантазії точно поставлених завдань. З його допомогою можна змоделювати або розпізнати абсолютно конкретну ситуацію. Проте в реальності він може працювати лише в чистих лабораторних умовах. Будь відеоспостереження, пов’язане з природними перешкодами, з обивательським поведінкою або з непідготовленим сценарієм, буде видавати більше неправдивих вихідних даних, ніж корисних. Недоліки криються, звичайно, в недосконалості самого детектора об’єктів і в першу чергу в невмінні розділяти накладання або поруч рухомі цілі. У польових умовах такий детектор насилу відрізняє машину від групи рухомих людей. Природно, розробники комп’ютерних систем продовжують удосконалювати і розвивати методи визначення об’єктів, але всі рекламовані можливості більше є прототипами майбутніх звершень. Безумовно, на основі детектора об’єктів можна реалізувати різні аналітичні алгоритми, наприклад, детектор перетину лінії, детектор входу або виходу об’єкта з заданого периметра, але це буде тільки тривожне подія без ідентифікації об’єкта. Єдиним ідентифікує об’єкт ознакою, що хоч якось дозволяє прив’язатися до його дій, є номерний знак або буквено-цифрова комбінація. У всіх інших випадках, коли об’єкт намагаються ідентифікувати за кольором, розміром, швидкості переміщення, ймовірність помилкового визначення у природних непідготовлених умовах залишається домінуючою.
Видеоаналитика дозволяє достовірно класифікувати події
Кришталева мрія всіх правоохоронних органів, щоб відеокамера сама призначала статтю адміністративного або Кримінального кодексу об’єкту відеоспостереження, яка вчинила правопорушення. Але, на жаль, в силу недоліків детектора об’єктів це неможливо. Красиво звучні «детектор людини, що стрибає через кущі», «детектор саботажу», «детектор масової бійки», «детектор людини, що повзе по стіні», «детектор невірної дружини», «детектор крадіжки мобільного телефону», «детектор лежачого людини» і т. д. є не що інше, як красиві рекламні слогани, вторящие закликів вождів до інноваційних звершень. Звичайно, в окремо взятих випадках, створивши певні умови, яких результатів можна домогтися, але на практиці в кращому випадку розумно говорити про зміну окремих параметрів: розміру області детекції, сукупної площі зон детекції в кадрі, напрямку переміщення детектованого об’єкта, появи нового об’єкта або зникнення існуючого об’єкта детектування. Але зв’язати ці зміни з визначенням якого-небудь події, що характеризує поведінку об’єкта, достовірно не вийде.
Видеоаналитика дозволяє визначати особи, номерні знаки
Дійсно, рівень програмування і можливості обробки зображення досягли того рівня, коли комп’ютерна програма дозволяє не тільки розпізнавати обличчя людини в кадрі, але і провести ідентифікаційне порівняння цієї особи з базою зображень і виявити відповідність. Природно, розраховувати, що достатньо встановити камеру на стовпі для огляду площі біля фонтану і система почне ловити злочинців, які знаходяться у розшуку, не варто. Для коректної роботи комплексу необхідні спеціальні умови – освітленість, напрям і кут огляду камери, розмір обличчя в кадрі, свіжа фотографія в базі бажано від сьогоднішнього числа. Тільки при виконанні цих нездійсненних вимог можна розраховувати на достовірний результат роботи. По суті, дані технології дають можливість лише варифицировать особи, видаючи набір схожих з бази, а чоловік повинен вибирати правильне. На відміну від осіб, номери мають значно більше відмінностей, тому їх легше ідентифікувати. Але їх набагато рідше миють. Якщо символи неможливо розпізнати людським оком, ніякий комп’ютер не зробить чудо. Це твердження справедливо і до обладнання відеофіксації порушень ПРАВИЛ дорожнього руху та швидкісного режиму. Для отримання коректних результатів вимірювань і обчислень повинні виконуватися вимоги щодо дотримання геометричних параметрів розміщення обладнання і обов’язкове узгодження людиною.
Видеоаналитика здатна замінити оператора відеонагляду
В більшості представлених на ринку систем відеоспостереження існує можливість запрограмувати логічну послідовність дій «подія – реакція». Але давайте згадаємо, що комп’ютер – це в першу чергу обчислювальна машина, яка працює з логічними операндами «і» – «або». Заздалегідь закладена користувачем логіка буде відпрацьована на всі 100%, але чекати від залізного друга об’єктивної оцінки ситуації не варто. Якщо говорити про побудову системи охорони, коли спрацьовування детектора руху в порожньому приміщенні або видеоаналитического алгоритму, який визначив перетин рухомим об’єктом периметра території, прирівнюється до спрацьовування охоронного сповіщувача, то в даному випадку оператор не потрібно. Але якщо міркувати про систему спостереження і контролю в місцях масового перебування людей, то без оператора, що виконує поточний та наступний аналіз, не обійтися. Навіть у законі про автоматичної відеофіксації порушень ПДР присутній чоловік, який вручну вписує в постанову про порушення ПДР цифри автомобільного номера, який обчислювач не зміг розпізнати і видав ХХХ.
Видеоаналитика полегшує роботу оператора спостереження
У століття надлишку інформації, коли кількість камер спостереження на одного оператора скоро перевищить кількість транзисторів на інтегральній мікросхемі комп’ютерного процесора, однією з найважливіших завдань є попередня обробка даних. На відміну від детектора об’єктів, статистична видеоаналитика (Statistic Analytics) більш стійка до перешкод і легко переносить непогодные умови. Сам принцип порівняння подальшої статистики з попередньою передбачає просту арифметичну операцію віднімання. Різниця є критерієм змін, що відбулися перед відеокамерою. Величезний плюс такого підходу в тому, що при цьому також віднімаються і перешкоди. Вони не мають впливу на прийняття рішення по одній простій причині – вони віднімаються самі з себе, утворюючи в результаті нуль перешкод. Природно, таке визначення дещо перебільшено, але повною мірою відображає сам принцип перешкодозахищеності SA. Недолік її в тому, що вона не може видати точну міркування про характер поведінки об’єктів, номер статті Кримінального кодексу. Вона лише знаходить відмінності наявних дій і станів від попередніх. Але в цьому контексті можна побудувати так звану м’яку видеоаналитику, яка попереджає про певні зміни самої поведінки: змінив темп ходьби, змінив напрям, почав махати руками, присів, встав, побіг, підстрибнув, поклав, взяв і т. д. Звичайно, кожне з перерахованих дій не може однозначно означуватися як кримінал, м’яка аналітика лише попереджає про зміни, вірніше, фільтрує величезний потік відеоінформації, залишаючи тільки ключові кадри. Така структура скорочує час, необхідне на перегляд архіву, з допомогою SA спрощується сама відеоспостереження, так як увага оператора концентрується лише на конкретних подіях замість безперервного багатогодинного контролю моніторів.
Саме на цьому принципі комп’ютерна програма може «стискати» відеоряд і показувати оператору тільки фрагменти, що дозволяють зрозуміти весь сюжет. Такий метод можна порівняти з одним із способів швидкочитання, коли людина читає сторінку тексту по діагоналі, знаходячи ключові слова, що дають розуміння всього написаного на сторінці тексту. Тільки суть, нічого зайвого, при цьому без втрати смислової складової.
Видеоаналитика дозволяє прискорити пошук інформації в архіві записів
Сьогодні в системах охоронного телебачення доводиться працювати з величезними масивами відеоданих від тисяч камер, і час пошуку потрібної інформації в архіві має велике значення. Якщо раніше для пошуку потрібного фрагмента запису потрібно переглянути практично весь архів камери за якийсь період, а можливо, і записи з декількох камер, на що йшли години і навіть дні, то із застосуванням відеоаналітікі цей час значно скоротилося, а сам процес пошуку інформації став більш зручним і зрозумілим. Це стало можливим завдяки метаданим – текстової інформації, що описує результат роботи детекторів в кадрі. У просунутих комп’ютерних системах, по суті, ведеться дві бази: база записів і база метаданих. Багато IP-камери передають у систему відеокадр і метадані, що описують, що цікавого і в якому кутку було виявлено. Тому, ніж ворочати терабайти відеоінформації, система пошуку спочатку звертається в базу текстової інформації, з якою набагато простіше і швидше працювати, знаходить там потрібні за критеріями пошуку дані, а потім вже отримує кадр їх архіву записів. Цей процес можна порівняти з пошуком книги в бібліотеці. Замість того щоб лазити по стелажах, знімати одну книгу з полиці і дивитися обкладинки в пошуках потрібного видання, аналітичний пошук спочатку скористається алфавітним або бібліографічним покажчиком, вибере, що треба, а потім йде до потрібного стелажу і дістає потрібну книгу. Більш того, такий підхід до пошуку інформації дозволяє вести довільну вибірку – досить виділити на відеопотоці інтересуемий область і задати пошук саме в ній. Але щоб створити цей алфавіт пошуку, потрібно якось класифікувати відеоінформацію. Природно, комп’ютерний відеоаналіз дає тільки можливі варіанти того, що ви шукаєте, а не точний факт крадіжки валізи.
Навколо відеоаналітікі і її можливостей, як і завжди навколо чогось нового, буде ще багато і спорів, і околоинтеллектуальных маркетингових продуктів. Вибрати серед них дійсно корисний поки складно через інформаційної війни. На нас звалюється рекламний град фантастичних можливостей. Ефект ошуканих очікувань гальмує розвиток дійсно робочих систем. Ми робимо спроби купувати фантастизм, обжигаемся і перестаємо вірити в прогрес. Тим не менш він є, важливо лише знайти його. У будь-якому випадку результат використання методу відеоаналізу в охоронному телебаченні буде лише потужним інструментарієм оператора, але ніяк не заміщає його елементом.