19.03.2024

В День народного единства «ВКонтакте» проведет эксперименты по борьбе с оскорблениями при помощи нейросетей

 

Социальная сеть «ВКонтакте» объявила о проведении в День народного единства эксперимента «для борьбы с оскорблениями и травлей в комментариях». В рамках этого эксперимента компания протестирует новый функционал, позволяющий бороться с враждебными высказываниями.

«4 ноября ровно на сутки в настройках сообществ появится возможность включить фильтр враждебных высказываний. Нейросеть удаляет комментарии, в которых содержатся угрозы, — например, пожелания смерти или обещания причинить вред здоровью. При этом администратор сможет увидеть все комментарии, которые отсеял фильтр, и восстановить их или отправить автора в чёрный список. Как и другие фильтры в сообществах, фильтр враждебных высказываний можно включить или выключить в любой момент», — сообщили в компании, уточнив, что результаты эксперимента будут использованы для доработки нейросети.

Кроме того, соцсеть решила масштабировать прошлогодний эксперимент: когда пользователь пишет комментарий, алгоритмы определяют, есть ли в тексте признаки оскорблений. Если да, то автор получает совет не тратить время на агрессию и отказаться от обидной реплики. Год назад благодаря такому предупреждению за сутки удалось сократить количество оскорблений в комментариях на 36%.

«В этот раз функция будет определять более широкий спектр оскорблений и угроз. Среди них — проявления нетерпимости по национальному признаку, а также враждебные высказывания на почве религиозной принадлежности, возраста, пола и других характеристик. 4 ноября предупреждение смогут увидеть все пользователи, а позже начнётся долгосрочный тест, рассчитанный на часть аудитории», — добавили в соцсети.

О том, что «ВКонтакте» работает над алгоритмом для автоматического распознавания материалов с враждебными высказываниями, стало известно в августе. В компании тогда сообщили, что новая нейросеть поможет быстрее находить материалы с враждебными высказываниями, а также публикации, которые провоцируют аудиторию проявлять агрессию.

В январе-июне этого года из «ВКонтакте» было удалено 520 тыс. единиц контента, разжигающего вражду. Кроме того, было заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.

Отметим, что другие соцсети также активно внедряют инструменты для отслеживания запрещенного контента. На внедрении таких инструментов и ускорении процесса удаления противоправного контента настаивают власти Евросоюза.

Источник: www.newsru.com

Добавить комментарий