Как компьютерное зрение помогает решать задачи бизнеса
Искусственный интеллект сегодня используют в самых разных сферах для решения многих задач.
Рассказываем подробно, что это такое, как работает и как помогает бизнесу решать задачи на примере нашего сервиса.
Что такое компьютерное зрение
Компьютерное зрение — это технология на основе искусственного интеллекта для анализа изображений и видео. Это целый набор методик, с помощью которых компьютер «видит» то, что показано в видео или на картинке.
Технология анализирует изображения или видеокадры, извлекает из них нужную информацию (которую смог бы извлечь человек при просмотре). Например, компьютерное зрение может вычислить в видео предметы, узнать их местоположение и когда они появляются.
Разрабатывают подобные технологии с помощью машинного обучения и огромных наборов данных. На этих данных технологию «учат» выделять нужные признаки и их комбинации, чтобы определять объекты.
Как работает компьютерное зрение
Итак, главное, что делает технология компьютерного зрения — распознаёт части изображений или видео и извлекает нужную информацию. Разберёмся на примере нашего сервиса.
В основе компьютерного зрения от EdgeЦентр лежат 3 нейронные сети, которые обеспечивают 3 режима работы.
Распознавание наготы. Искусственный интеллект вычисляет контент 18+ на видео. Сервис может маркировать видео как безопасное/небезопасное и выделять на нём конкретные объекты (обнажённую грудь, открытый живот и т.п.). Всего в базе компьютерного зрения около 14.
Базовое распознавание объектов. По результатам анализа вы получите информацию, какие предметы в каких кадрах были обнаружены.
В базе 80 объектов. На видео можно вычислить людей, домашних животных, автомобили, еду, мебель и электронные устройства.
Расширенное определение объектов. Этот режим пока что проходит бета-тестирование, но его уже можно попробовать.
Принцип его работы похож на предыдущий, но есть несколько значительных улучшений:
- Нейронная сеть распознаёт 1 000+ предметов.
- Вместо квадратной области ИИ определяет конкретные контуры.
Как видите, режим имеет большие возможности. Но на обработку видео ему требуется больше времени. Поэтому если базовый режим содержит нужные вам объекты, мы рекомендуем выбирать его, т.к. он работает быстрее.
Вероятность определения объектов или score – это цифры, которые вы видите на скриншоте рядом с предметами. Технология никогда не определяет части с точностью 100%. Всегда есть небольшая вероятность ошибки. Поэтому, когда компьютерное зрение находит объект, оно указывает насколько уверено в правильности вывода.
Score можно настроить под ваши потребности. Например, вы не хотите тратить время на объекты с низкой вероятностью. Сервис можно настроить так, чтобы он сообщал только о предметах, в которых уверен почти на 100%. А если вы, наоборот, хотите вычислять любые намёки на нежелательные объекты, вы можете настроить меньший score: например, 50%.
Чтобы правильно настроить параметр, лучше сначала протестировать, с какой вероятностью компьютерное зрение вычисляет объекты на ваших видео. Точность выявления зависит от многих факторов, и для каждого контента подходящий score будет разным.
Кроме объектов, наше компьютерное зрение умеет вычислять действия на видео: танцы, приём пищи, фитнес и т.п.
Сервис работает с готовыми видео.
Какие задачи решает компьютерное зрение
Автоматическая модерация видео. Технология отлично распознаёт человеческую наготу и другой контент 18+. На ручную модерацию отправляется меньшая часть медиа. Например, только то видео, где компьютер обнаружил недопустимые объекты.
Автоматические аннотации. Технология умеет проставлять теги на видео на основе определения разных объектов и сцен. Эти теги могут быть базой для каталогизации видео или составления описаний.
Поиск нужных объектов на видео. Основная функция компьютерного зрения — находить объекты в видео или на картинках. Если вам нужно выяснить, есть ли в видео какие-то предметы или сцены, КЗ автоматизирует процесс поиска.
Какому бизнесу компьютерное зрение будет полезно
В первую очередь это видеоплатформы с пользовательским контентом. Оно будет идеальным решением для модерации.
На платформах, где пользователи сами могут размещать видео, важно проверять, чтобы контент не нарушал правила площадки и не противоречил законам. Но при этом видео должны проверяться быстро, за несколько минут. Долгая модерация вызывает у производителей контента раздражение и побуждает их уходить на другие площадки.
С компьютерным зрением процесс модерации легко автоматизировать, сократив его до пары минут.
Чем ещё компьютерное зрение может быть полезно видеоплатформам:
- Улучшит алгоритмы рекомендации контента. Анализ содержания видео может стать основой для персональных рекомендаций.
- Автоматизирует разметку таймлайнов по времени появления объектов или сцен в видео.
- Поможет добавлять в видео более подходящую рекламу. На основе анализа в ролики можно будет добавлять рекламу, подходящую к содержанию.
В качестве примера, в обсуждении темы, можно привести YouTube. Площадка использует продвинутые алгоритмы для автоматической модерации и рекомендации видео.
В 2022 году автомодерация появилась на Rutube. Долгая обработка видео была основной проблемой платформы, но технология помогла сократить время до пары минут.
Можно использовать для видеонаблюдения. Сервис может анализировать записи с камер и вычислять на них определённые действия.
Например, Росэнергоатом внедрил системы умной видеоаналитики, чтобы с помощью камер следить за использованием средств индивидуальной защиты на электростанциях. Система позволила выявлять до 98% нарушений там, где её внедрили. К 2024 году компания планирует использовать систему на 11-ти АЭС.
Ещё один пример — решение от компании Третье Мнение. С помощью их системы, видеоаналитики могут мониторить состояние пациентов в палатах. Например, сервис автоматически отправляет уведомление, если зафиксировал через камеру, что пациенту стало плохо.
В 2020 году на фоне коронавируса МЕДСИ внедрили систему в свои клиники. Решение использовали для мониторинга состояния пациентов и контроля за работой сотрудников. Опыт был достаточно успешным – позволил повысить безопасность в клиниках МЕДСИ и сократить контакты с заражёнными пациентами.
В автоматизации производства. Компьютерное зрение в промышленности уже активно используется в разных странах для выявления бракованных товаров и сломанного оборудования.
В России технология уже успешно работает в Челябинском металлургическом комбинате. Решение используется для определения брака стали. Компьютерное зрение «видит» царапины, маленькие трещины и ещё 20 видов дефектов. Благодаря этому комбинат смог увеличить обнаружение дефектов в 6 раз. Это значительно повышает качество производимой продукции.
Команда EdgeЦентр активно работает над «прокачкой» компьютерного зрения, чтобы мы могли в дальнейшем внедряться в процессы производства. Доработки ведутся, но наш сервис уже может быть полезен в других сферах и индустриях.
Особенности компьютерного зрения от EdgeЦентр
Анализирует видео и изображение по ключевым кадрам. За счёт того, что сервис не тратит время на обработку полного видео, процесс модерации ускоряется в десятки раз. Однако, если вам нужна более прицельная проверка контента, можно включить анализ каждого кадра в видео.
Реагирует на тригеры. Как только ИИ обнаружит неприемлемый контент, анализ остановится. Это значительно экономит время обработки и сокращает расходы на лишний анализ контента.
Есть возможность кастомизации. Компьютерное зрение от EdgeЦентр хорошо ещё тем, что его можно дорабатывать под бизнес-задачи. Мы всегда идём навстречу нашим клиентам. Если вам понадобится дополнительный функционал, вы всегда можете обратиться к нам и, возможно, мы сможем сделать нужные доработки.
Как подключить и использовать компьютерное зрение от EdgeЦентр
Если вы хотите использовать КЗ в бизнесе — напишите нам. Наши менеджеры ответят на все интересующие вас вопросы. Мы будем готовы помочь вам на всех этапах проекта, от подключения до работы с документацией.
Сейчас мы ведём внедрения функционала в личном кабинете, чтобы вы могли быстро и удобно применить нужные настройки. На данный момент работать с сервисом можно только через API, т.е. вы отправляете видео на анализ на наш сервер и затем получаете готовую информацию о контенте.
Команда EdgeЦентр продолжает дорабатывать функционал компьютерного зрения. В разработке мы всегда отталкиваемся от потребностей наших клиентов, чтобы повышать эффективность бизнес-процессов.
Подведём итоги
- Компьютерное зрение достаточно точно распознаёт объекты.
- Сервис значительно ускоряет процесс модерации контента.
- Применять КЗ можно в разных индустриях, даже для автоматизации производства.
- Инструмент можно настраивать под бизнес-задачи и обучать ИИ большему функционалу.
- Поможет разметить видео и добавлять в контент самую подходящую рекламу.
- Сервис сокращает траты на анализ контента. В случае обнаружения триггера, обработка видео сразу закончится.
Протестировать компьютерное зрение от EdgeЦентр можно уже сейчас. Оставьте заявку, наши менеджеры свяжутся с вами и ответят на все интересующие вас вопросы, помогут начать работать с сервисом или разработать нужный функционал.