Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проскандированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник

Admin08.08.2023

0 0 Время чтения: 1 минута

Добавить комментарий Отменить ответ

Выявлена крупномасштабная атака «коммерческого» вируса White Snake на российский бизнес

Galax представила модули памяти HOF OC Phantom S DDR5 с частотой до 8000 МГц и Boomstar X4 DDR5 на белом текстолите

NVIDIA представила профессиональные видеокарты RTX 5000 Ada, RTX 4500 Ada и RTX 4000 Ada стоимостью $1250–4000

Тим Кук: Apple годами ведёт разработки в сфере искусственного интеллекта и вкладывает в этом миллиарды

С начала года импорт микросхем в Китай сжался на 16,8 %

NVIDIA поручит Samsung упаковку чипов для ИИ-ускорителей и будет покупать у неё память HBM3

У чипов Intel обнаружена уязвимость Downfall — она позволяет воровать пароли через инструкции AVX2 и AVX-512

У чипов Intel обнаружена уязвимость Downfall — она позволяет воровать пароли через инструкции AVX2 и AVX-512

Слухи: ролевая игра The Elder Scrolls IV: Oblivion получит официальный ремейк или ремастер на Unreal Engine 5, но не от Bethesda

Объёмы поставок памяти типа HBM в следующем году удвоятся, как считают аналитики TrendForce

Зонд NASA «Юнона» прислал свежий снимок спутника Юпитера Ио — самого вулканически активного тела в Солнечной системе

Fisker второй раз за год вынуждена снизить прогноз по объёму производства электромобилей

Blizzard заблокировала российским и белорусским пользователям предзагрузку Overwatch 2 в Steam — как обойти ограничение

Пиковый онлайн релизной версии Baldur’s Gate 3 в Steam почти достиг полмиллиона игроков, и это только начало

Полупроводниковая промышленность Индии выйдет на мировой уровень только с развитием внутреннего потребления

Embracer Group начала закрывать студии после срыва сделки на $2 млрд

В июле китайские BYD и NIO поставили рекордное количество гибридов и электромобилей

Китайским детям запретили пользоваться мобильным интернетом по ночам и сидеть в смартфоне больше 2 часов в день

Байден подпишет в августе указ об ограничении инвестиций в технологический сектор Китая

Coinbase и SEC опровергли сообщение о требовании регулятора исключить некоторые криптовалюты c биржи

Статьи по теме

Добавить комментарий Отменить ответ