Специалисты по искусственному интеллекту в социальной сети представили систему Rosetta, которая позволит компании лучше понимать мемы.
Как сообщает издание TechCrunch, новая технология может не просто распознавать мемы, но и понимать их смысл. А это, в свою очередь, позволит вычленять из всего потока информации спам, а также оскорбительный или запрещенный контент. Помимо картинок и текста, Rosetta способна понимать и видео контент, разбивая ролики покадрово и анализируя каждый полученный фрагмент целого ролика.
«Идентификация спама и нежелательного контента довольно проста, когда мы говорим об обычном тексте. Но видео и фотографии, в которых используется наложение слоев, гораздо более сложны для понимания нейросетью. Мы создали свой алгоритм, чтобы упростить этот момент. Сейчас сортировкой контента занимаются операторы и это требует большого количества времени. Но теперь все будет происходить гораздо быстрее и мы сможем сделать виртуальное пространство более комфортным для пребывания в нем пользователей», — заявили в пресс-службе Facebook.
Rosetta работает на основе технологии оптического распознавания текста (OCR), которой Facebook пользуется с 2015 года. В компании отмечают, что сейчас система работает с единой моделью для различных языков, а основная часть данных для обучения доступна для алфавитов на латинской основе. Разработчики Rosetta заявляют, что они знакомы со стратегиями, которые могут расширить количество поддерживаемых языков за счет изменения профиля существующих баз данных.
Rosetta распознаёт текст на более чем миллиарде изображений в Facebook и Instagram, а также на кадрах видео каждый день в реальном времени. ИИ сначала определяет «зону» с текстом, а затем распознаёт, что там написано с помощью специальной модели, обученной понимать контекст.
В Facebook надеются, что Rosetta позволит соцсети бороться со спамом или агрессивными высказываниями, которые могут быть размещены на видео или картинке.