Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проскандированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник

Admin08.08.2023

0 0 Время чтения: 1 минута

Добавить комментарий Отменить ответ

Авторы Baldur’s Gate 3 пообещали выпустить Divinity: Original Sin 3, но только после «творческой перезагрузки»

Сегодня днём Samsung представит складные смартфоны Galaxy Z Fold 5 и Flip 5, а также новые часы и планшеты

Путин подписал закон о запрете регистрации на российских сайтах с иностранной электронной почтой

Boeing впервые публично показала, как летает аэротакси Wisk Aero

Защищённый смартфон HOTWAV Cyber 13 Pro поступит в продажу 21 августа — первые покупатели получат скидку выше 50 %

10K-гейминг: цена предзаказа Marvel’s Spider-Man 2 в «М.Видео» и «Эльдорадо» составила 9999 рублей, но у ретейлера есть объяснение

Sapphire представила видеокарту Radeon RX 7900 GRE Nitro+, а PowerColor — RX 7900 GRE Red Devil

Foxconn запустит сборку трёхместных электромобилей дешевле $20 000 в Индии или Таиланде

Remnant 2 достигла 1 млн проданных копий в 10 раз быстрее, чем Remnant: From the Ashes

Tele2 вытеснил из первой тройки российских операторов связи «Билайн» по итогам полугодия

Журналисты показали сражение с необычным боссом в новой Lords of the Fallen — фанаты первой игры довольны, а ценители Elden Ring не впечатлены

S.T.A.L.K.E.R. 2, Cyberpunk 2077: Phantom Liberty, Armored Core VI и не только: Microsoft рассказала, в какие игры даст поиграть на gamescom 2023

YouTube будет показывать пустую главную страницу тем, кто отключил историю просмотров

Выручка Intel упала на 15 %, но компания смогла вернуться к прибыльности

Британский регулятор возобновил рассмотрение сделки по покупке Microsoft компании Activision Blizzard

На QuakeCon 2023 анонсировали ремастер Quake II и объявили о его выходе — трейлер, детали и бесплатный апгрейд для владельцев оригинала

Тим Кук: Apple годами ведёт разработки в сфере искусственного интеллекта и вкладывает в этом миллиарды

Марсоход Curiosity вскарабкался на марсианскую дюну — это был самый сложный подъём за 11 лет миссии

Tesla завышала реальный запас хода электромобилей по указанию Маска, показало журналистское расследование

AMD представила Ryzen 9 7945HX3D — первый мобильный процессор с дополнительной кеш-памятью 3D V-Cache

Статьи по теме

Добавить комментарий Отменить ответ