Публикуем подробности про проект "Чистый интернет". Это система для оперативного поиска и блокировки запрещенного контента на русскоязычных страницах.
К маю ее собираются использовать, чтобы автоматически выявлять:
🔺 призывы к массовым акциям;
🔺 оскорбления президента;
🔺 "фейки" про политику РФ;
🔺 пропаганду нетрадиционных сексуальных отношений и пр.
Рассказываем, какие соцсети и поисковики уже проверяют и собираются проверять. Как происходит мониторинг и с какой точностью.
С начала войны в Украине у главного государственного цензора России — Роскомнадзора — прибавилось работы. Ранее его подведомство — Главный радиочастотный центр — занималось в основном выявлением детской порнографии, пропаганды суицида и наркотиков. Но с 2022 года организация переключилась преимущественно на политику. Именно ее сотрудники собирают любую критику в отношении действий руководства Кремля и лично Владимира Путина, формируют доносы в МВД и Генпрокуратуру, а также заставляют медиаресурсы удалять неугодную информацию, угрожая блокировкой и судами.
Причем планы у Роскомнадзора по меньшей мере наполеоновские.
Как стало известно после взлома Киберпартизанами внутренней сети Главного радиочастотного центра, РКН стремится контролировать 100% российского интернета.
Для этого разработано несколько автоматизированных систем, которые позволяют быстро выявлять и блокировать материалы, неугодные политике Кремля. На данный момент активно разрабатывается и внедряется система под названием «Чистый интернет». С ее помощью осуществляется мониторинг в соцсетях и поисковом сервисе Яндекс.
Что такое система "Чистый интернет"?
Система «Чистый интернет» предназначена для мониторинга так называемой запрещенной информации. Ее разработка началась в июле 2020 года, и первоначально систему собирались использовать для выявления в текстах пропаганды наркотиков, суицида и детской порнографии. Но 25 февраля 2022 года, спустя всего сутки после начала войны в Украине, «Чистый интернет» подключили к поиску статей и комментариев с призывами к акциям протеста и критикой в адрес военных России.
В настоящее время работы по совершенствованию системы еще ведутся. К маю 2023 года с ее помощью планируют успешно выявлять контент по темам:
массовые мероприятия;
вовлечение несовершеннолетних;
оскорбления президента;
фейки про государство и страну в целом;
пропаганда нетрадиционных сексуальных отношений.
Причем делать это планируют не только в текстах, но и в аудио-, фото-, видеоматериалах.
За доработку системы «Чистый интернет» ответственны:
Волкова Анастасия Александровна – начальник управления внутренних проектов Департамента цифровой трансформации.
Шарапов Игорь Родионович — бывший руководитель Департамента организации мониторинга средств массовых коммуникаций.
Как работает "Чистый интернет"
Основная цель проекта — находить запрещенную информацию максимум через сутки после публикации.
Для этого роботы системы «Чистый интернет» анализируют текстовые материалы в социальных сетях и результатах поисковой выдачи Яндекса, используя лингвистические словари и нейронные сети.
По результатам анализа система создает карточки, в которых зафиксированы подозрения на нарушения. В них отображается материал с нарушениями и тип запрещенной информации.
Ниже вы видите пример карточки в системе «Чистый интернет» в том виде, каком она попадает специалисту, занимающемуся цензурой. В его обязанности входит просмотреть информацию в карточке, а затем принять или отклонить нарушение.
Скрин из документа "АС ЧИ_ Мосенз". Пример карточки оператора в системе "Чистый интернет"
Какие соцсети и поисковики проверяют?
В настоящий момент роботы АС «Чистый интернет» умеют сканировать соцсети "ВКонтакте", "Одноклассники", "Ответы Mail.ru", "Мой мир", "Живой журнал" и YouTube. В 2023 году по задумке разработчиков система также научится работать со многими другими социальными сетями.
Среди поисковых систем АС «Чистый интернет» на данный момент работает только с Яндексом. По согласованию с руководством Роскомнадзора был выбран именно этот поисковик, поскольку в нем можно ежедневно бесплатно делать до 10 тысяч поисковых запросов. Более того, компания "Яндекс" со временем специально для цензоров Роскомнадзора увеличила этот лимит до 300 тысяч запросов в сутки, чтобы облегчить разработку и эксплуатацию системы «Чистый интернет».
Скрин из документа "Справка_Яндекс_картинки_api".
В 2023 году систему также планируют обучить обработке поисковых запросов через сервис Mail.ru. А в 2024 году амбициозные планы распространяются на Google.
Насколько точно это работает?
Точность работы системы «Чистый интернет» пока оставляет желать лучшего. По статистике за 2022 год этот показатель составил 35%. То есть только чуть больше трети отобранных материалов на самом деле содержат какие-либо нарушения с точки зрения Роскомнадзора.
Возможно, во многом именно поэтому для обработки статей и комментариев по войне в Украине «Чистый интернет» используют совместно с другой автоматизированной системой — Brand Analytics. О ней мы уже писали ранее, а также рекомендовали, как обходить эту слежку.
Эти системы облегчают, но все же полностью не заменяют работу людей. Все отобранные материалы в любом случае анализируют операторы Главного радиочастотного центра, а также отправляют для финального контроля цензорам Роскомнадзора.
В будущем мы расскажем о том, как именно происходит мониторинг статей и комментариев по военной тематике, а также чем оборачивается жесткая цензура для СМИ и простых граждан.
🤝 Поддержать работу КиберПартизан и новые расследования вы можете
через Патреон (доступны донаты картой 💳);
банковскую карту: 5354 5670 1711 0254 Partizan Wave
Следите за обновлениями на каналах КиберПартизан в Телеграм!