Megogo разрабатывает нейронную сеть для распознавания запрещенного законом контента
Программа-робот будет запущена в течение месяца
Гендиректор Megogo Виктор Чеканов рассказал «Ведомостям», что видеосервис нашел способ для быстрого распознавания запрещенного законом контента. В течение месяца будет запущена программа-робот, в основе которой лежит нейронная сеть. Робот будет распознавать четыре группы нецензурных слов из списка Роскомнадзора и производные от них, а также сцены курения, употребления алкоголя и секс. В перспективе – определение сцен насилия.
Перед программой будет стоять задача анализа библиотеки Megogo, которая сегодня состоит из 35 000 тайтлов и более чем 700 000 единиц контента: «Запуск робота – превентивная мера, цель – выявить контент с матом и указанными сценами, чтобы устранить возможные нарушения: запикать или проставить маркировку 18+», – отметил Виктор Чеканов. По словам гендиректора, через год робот сможет самостоятельно идентифицировать запрещенный к распространению контент, но пока участие человека в процессе необходимо.
Многозадачная нейронная сеть создана на базе двух существующих решений: первое – Vosk, автономный инструмент для распознавания речи с открытым исходным кодом; второе – система визуального распознавания на основе нейросети. Как отмечает Чеканов, здесь одна из самых сложных задач – обучить робота распознавать сцены насилия.
11 ноября Роскомнадзор составил в отношении Megogo административный протокол за мат и демонстрацию секса в фильме НИКТО НЕ ЗНАЕТ ПРО СЕКС, который имел на видеосервисе маркировку 16+ вместо 18+. При этом в прокатном удоствоверении проекту была присвоена возрастная маркировка 16+. Позднее ведомство разъяснило, что с 1 сентября 2012 г. вступил в силу федеральный закон «О защите детей от информации, причиняющей вред их здоровью и развитию», согласно которому классификация информационной продукции должна осуществляться ее производителями и распространителями самостоятельно.