Законный судный день для генеративного ИИ ChatGPT, если его поймают на плагиате или нарушении авторских прав, предупреждает об этике ИИ и законах об ИИ

Использует ли генеративный ИИ, такой как ChatGPT, наши веб-сайты и созданный людьми контент? Знай, будь ... [+] расстроен, будь готов.

Гетти

Отдайте должное, если причитается.

Это мудрая мудрость, в которую вы, возможно, были воспитаны, чтобы твердо верить. Действительно, можно предположить или вообразить, что мы все могли бы в какой-то степени согласиться с тем, что это справедливое и разумное эмпирическое правило в жизни. Когда кто-то делает что-то, что заслуживает признания, позаботьтесь о том, чтобы он получил заслуженное признание.

Противоположная точка зрения казалась бы гораздо менее убедительной.

Если бы кто-то ходил вокруг, настаивая на том, что кредит должен не быть признанным, когда должно быть признано, что ж, вы можете утверждать, что такое убеждение является невежливым и, возможно, закулисным. Мы часто обнаруживаем, что громко встревожены, когда обманывают кого-то, кто добился чего-то выдающегося. Осмелюсь сказать, что мы особенно не одобряем, когда другие ложно приписывают себе работу других. Это тревожный двойной удар. Человек, который должен был получить признание, лишен своего момента на солнце. Кроме того, обманщику нравится быть в центре внимания, хотя он ошибочно обманывает нас, заставляя присваивать наши благосклонные чувства.

К чему все эти рассуждения о получении кредита самыми правильными способами и предотвращении неправильных и презренных способов?

Потому что мы, кажется, сталкиваемся с аналогичным затруднительным положением, когда речь идет о последних достижениях в области искусственного интеллекта (ИИ).

Да, утверждается, что это явно происходит с помощью типа ИИ, известного как Генеративный ИИ. Существует много слухов о том, что Генеративный ИИ, самый популярный ИИ в новостях в наши дни, уже присвоил себе то, за что не заслуживает признания. И это, вероятно, ухудшится по мере того, как генеративный ИИ будет все больше расширяться и использоваться. Генеративному ИИ уделяется все больше и больше внимания, в то время как, к сожалению, те, кто полностью заслуживает истинного признания, остаются в пыли.

Я предлагаю способ четко обозначить это предполагаемое явление с помощью двух броских фраз:

1) Плагиат в масштабе
2) Нарушение авторских прав в масштабе

Я предполагаю, что вы, возможно, знаете о генеративном ИИ из-за широко популярного приложения ИИ, известного как ChatGPT, которое было выпущено в ноябре компанией OpenAI. Скоро я расскажу больше о генеративном ИИ и ChatGPT. Повесить там.

Давайте сразу перейдем к сути того, что, так сказать, заводит людей.

Некоторые горячо жалуются, что генеративный ИИ потенциально обкрадывает людей, создавших контент. Видите ли, большинство приложений для генеративного ИИ основаны на обучении данных путем изучения данных, найденных в Интернете. Основываясь на этих данных, алгоритмы могут оттачивать обширную внутреннюю сеть сопоставления шаблонов в приложении ИИ, которое впоследствии может создавать новый контент, который удивительно выглядит так, как будто он был разработан человеческой рукой, а не частью автоматизации.

Этот замечательный подвиг в значительной степени связан с использованием отсканированного из Интернета контента. Без объема и разнообразия интернет-контента в качестве источника для обучения данных генеративный ИИ был бы в значительной степени пустым и не представлял бы особого интереса для использования. Благодаря тому, что ИИ проверяет миллионы и миллионы онлайн-документов и текстов, а также всевозможный связанный контент, сопоставление с образцом постепенно выводится, чтобы попытаться имитировать контент, созданный людьми.

Чем больше контента будет изучено, тем выше шансы, что сопоставление с образцом будет более отточенным и станет еще лучше в мимикрии, при прочих равных условиях.

Вот тогда вопрос на миллион долларов:

Большой вопрос: Если у вас или у других есть контент в Интернете, на котором обучалось какое-то генеративное приложение ИИ, делая это, предположительно, без вашего прямого разрешения и, возможно, вообще без вашего ведома, должны ли вы иметь право на кусок пирога в отношении любой ценности, возникающей из это генеративное обучение данных ИИ?

Некоторые яростно утверждают, что единственный правильный ответ Да, особенно то, что эти создатели человеческого контента действительно заслужили свою долю действия. Дело в том, что вам будет трудно найти кого-то, кто получил свою справедливую долю, и, что еще хуже, почти никто не получил никакой доли вообще. Создателям интернет-контента, которые невольно и неосознанно вносили свой вклад, фактически отказывают в их законном признании.

Это можно охарактеризовать как жестокое и возмутительное. Мы только что изложили мудрую мудрость о том, что следует отдавать должное там, где оно должно быть. В случае с генеративным ИИ, видимо, не так. Давнее и добродетельное эмпирическое правило о кредите, кажется, грубо нарушается.

Вау, ответ идет, вы полностью преувеличиваете и искажаете ситуацию. Конечно, генеративный ИИ исследовал контент в Интернете. Конечно, это было очень полезно как часть обучения данных генеративного ИИ. По общему признанию, впечатляющие приложения для генеративного ИИ сегодня не были бы такими впечатляющими без этого продуманного подхода. Но вы зашли слишком далеко, когда сказали, что создатели контента должны иметь какое-то особое подобие кредита.

Логика следующая. Люди выходят в Интернет и узнают что-то из Интернета, делая это регулярно и без суеты как таковой. Человек, который читает блоги о сантехнике, а затем запоем просматривает бесплатные видеоролики о ремонте сантехники, может на следующий день выйти и устроиться на работу сантехником. Должны ли они отдавать часть своего денежного перевода, связанного с сантехникой, блогеру, который написал о том, как установить раковину? Должны ли они платить влогеру, который сделал видео, демонстрирующее шаги по ремонту протекающей ванны?

Почти наверняка нет.

Обучение данных генеративного ИИ — это просто средство разработки шаблонов. Пока результаты генеративного ИИ не являются простым повторением того, что было изучено, вы можете убедительно утверждать, что они «узнали» и, следовательно, не подлежат приписыванию какого-либо конкретного источника. Если вы не можете уловить генеративный ИИ в выполнении точной регургитации, это указывает на то, что ИИ обобщился за пределы какого-либо конкретного источника.

Ни один кредит не должен никому. Или, можно предположить, можно сказать, что кредит достается каждому. Коллективный текст и другой контент человечества, найденный в Интернете, получает признание. Мы все получаем кредит. Пытаться привязать кредит к конкретному источнику бессмысленно. Радуйтесь тому, что ИИ совершенствуется и что все человечество от этого выиграет. Эти публикации в Интернете должны считаться честью за то, что они внесли свой вклад в будущее достижений в области ИИ и в то, как это поможет человечеству в вечности.

Я еще кое-что скажу об этих противоположных взглядах.

В то же время, склоняетесь ли вы к лагерю, утверждающему, что заслуга должна быть и просрочена для тех, у кого есть веб-сайты в Интернете, или вы считаете, что противоположная сторона, утверждающая, что создатели интернет-контента решительно не быть сорванным - более убедительная поза?

Загадка и загадка, смешанные воедино.

Распаковываем это.

В сегодняшней колонке я расскажу об этих выраженных опасениях по поводу того, что генеративный ИИ, по сути, занимается плагиатом или, возможно, нарушает авторские права на контент, размещенный в Интернете (что считается правом интеллектуальной собственности или проблемой интеллектуальной собственности). Мы рассмотрим основания для этих сомнений. Я буду время от времени упоминать ChatGPT во время этого обсуждения, так как это 600-килограммовая горилла генеративного ИИ, хотя имейте в виду, что существует множество других приложений генеративного ИИ, и они, как правило, основаны на тех же общих принципах.

Между тем, вам может быть интересно, что же такое на самом деле генеративный ИИ.

Давайте сначала рассмотрим основы генеративного ИИ, а затем мы сможем внимательно рассмотреть насущные вопросы.

Ко всему этому относится множество соображений по этике и закону об ИИ.

Имейте в виду, что предпринимаются постоянные усилия по внедрению этических принципов ИИ в разработку и внедрение приложений ИИ. Растущий контингент заинтересованных и бывших специалистов по этике ИИ пытается обеспечить, чтобы усилия по разработке и внедрению ИИ учитывали точку зрения AI для хорошего и предотвращение AI для плохих. Точно так же предлагаются новые законы об ИИ, которые распространяются как потенциальные решения, чтобы удержать усилия ИИ от нарушения прав человека и тому подобного. Мой постоянный и обширный обзор этики ИИ и закона об ИИ см. ссылка здесь и ссылка здесь, Просто назвать несколько.

Разработка и обнародование этических предписаний ИИ преследуются, чтобы, как мы надеемся, предотвратить попадание общества в множество ловушек, связанных с ИИ. Мое освещение принципов этики ИИ ООН, разработанных и поддерживаемых почти 200 странами благодаря усилиям ЮНЕСКО, см. ссылка здесь. В том же духе изучаются новые законы ИИ, чтобы попытаться удержать ИИ в равновесии. Один из последних дублей состоит из набора предложенных ИИ Билль о правах которые Белый дом США недавно выпустил для определения прав человека в эпоху ИИ, см. ссылка здесь. Требуется целая деревня, чтобы удерживать ИИ и разработчиков ИИ на правильном пути и сдерживать целенаправленные или случайные закулисные усилия, которые могут подорвать общество.

Я включу в это обсуждение соображения, связанные с этикой ИИ и законом об ИИ.

Основы генеративного ИИ

Наиболее широко известный пример генеративного ИИ представлен приложением ИИ под названием ChatGPT. ChatGPT появился в общественном сознании еще в ноябре, когда он был выпущен исследовательской фирмой OpenAI в области искусственного интеллекта. С тех пор, как ChatGPT привлек огромные заголовки и удивительно превзошел отведенные ему пятнадцать минут славы.

Я предполагаю, что вы, вероятно, слышали о ChatGPT или, может быть, даже знаете кого-то, кто его использовал.

ChatGPT считается генеративным ИИ-приложением, потому что оно принимает в качестве входных данных некоторый текст от пользователя, а затем генерирует или производит вывод, который состоит из эссе. ИИ — это генератор преобразования текста в текст, хотя я описываю ИИ как генератор преобразования текста в эссе, поскольку это более ясно объясняет, для чего он обычно используется. Вы можете использовать генеративный ИИ для составления длинных композиций или заставить его предлагать довольно короткие содержательные комментарии. Это все по вашему желанию.

Все, что вам нужно сделать, это ввести приглашение, и приложение AI создаст для вас эссе, которое попытается ответить на ваше приглашение. Сочиненный текст будет казаться, будто сочинение написано рукой и умом человека. Если вы введете запрос «Расскажите мне об Аврааме Линкольне», генеративный ИИ предоставит вам эссе о Линкольне. Существуют и другие режимы генеративного ИИ, такие как преобразование текста в искусство и преобразование текста в видео. Здесь я сосредоточусь на варианте преобразования текста в текст.

Ваша первая мысль может заключаться в том, что эта генеративная способность не кажется такой уж большой проблемой с точки зрения написания эссе. Вы можете легко выполнить онлайн-поиск в Интернете и без труда найти тонны и тонны эссе о президенте Линкольне. Преимущество генеративного ИИ в том, что сгенерированное эссе относительно уникально и представляет собой оригинальную композицию, а не подражание. Если бы вы попытались найти эссе, созданное искусственным интеллектом, где-нибудь в Интернете, вы бы вряд ли его обнаружили.

Генеративный ИИ предварительно обучен и использует сложную математическую и вычислительную формулировку, которая была создана путем изучения шаблонов в написанных словах и историях в Интернете. В результате изучения тысяч и миллионов письменных отрывков ИИ может извергать новые эссе и рассказы, представляющие собой мешанину из того, что было найдено. Благодаря добавлению различных вероятностных функций полученный текст в значительной степени уникален по сравнению с тем, что было использовано в обучающем наборе.

Существует множество опасений по поводу генеративного ИИ.

Одним из существенных недостатков является то, что эссе, созданные генеративным ИИ-приложением, могут содержать различную ложь, в том числе явно ложные факты, факты, которые вводят в заблуждение, и очевидные факты, которые полностью сфабрикованы. Эти сфабрикованные аспекты часто называют формой Галлюцинации ИИ, крылатая фраза, которую я не одобряю, но, к сожалению, кажется, в любом случае набирает популярность (моё подробное объяснение того, почему это паршивая и неподходящая терминология, см. ссылка здесь).

Еще одна проблема заключается в том, что люди могут легко присвоить себе авторство генеративного эссе, созданного ИИ, несмотря на то, что они не написали эссе сами. Возможно, вы слышали, что учителя и школы очень обеспокоены появлением приложений для генеративного ИИ. Студенты потенциально могут использовать генеративный ИИ для написания назначенных им эссе. Если студент утверждает, что эссе было написано его собственной рукой, у учителя мало шансов определить, было ли оно подделано генеративным ИИ. Мой анализ этого аспекта смешения учеников и учителей см. ссылка здесь и ссылка здесь.

В соцсетях появилось несколько абсурдных громких заявлений о Генеративный ИИ утверждая, что эта последняя версия ИИ на самом деле разумный ИИ (нет, они ошибаются!). Специалисты по этике ИИ и закону об ИИ особенно обеспокоены этой растущей тенденцией к растянутым претензиям. Вы можете вежливо сказать, что некоторые люди преувеличивают возможности современного ИИ. Они предполагают, что у ИИ есть возможности, которых мы еще не смогли достичь. Это прискорбно. Что еще хуже, они могут позволить себе и другим попасть в ужасные ситуации из-за предположения, что ИИ будет разумным или похожим на человека и сможет действовать.

Не очеловечивайте ИИ.

Это приведет к тому, что вы попадете в липкую и суровую ловушку уверенности, ожидая, что ИИ будет делать то, что он не в состоянии выполнить. При этом последние разработки в области генеративного ИИ относительно впечатляют своими возможностями. Имейте в виду, однако, что существуют существенные ограничения, о которых вы должны постоянно помнить при использовании любого приложения для генеративного ИИ.

Последнее предупреждение на данный момент.

Все, что вы видите или читаете в генеративном ответе ИИ, кажется быть переданы как чисто фактические (даты, места, люди и т. д.), обязательно сохраняйте скептицизм и будьте готовы перепроверить то, что вы видите.

Да, даты можно придумать, места можно придумать, а элементы, которые мы обычно считаем безупречными, Найти подвержен подозрениям. Не верьте тому, что вы читаете, и скептически смотрите на любые эссе или результаты генеративного ИИ. Если генеративное приложение ИИ скажет вам, что Авраам Линкольн летал по стране на своем частном самолете, вы, несомненно, поймете, что это чушь. К сожалению, некоторые люди могут не осознавать, что в его дни реактивных самолетов не было, или они могут знать, но не замечать, что в эссе делается это наглое и возмутительно ложное утверждение.

Сильная доза здорового скептицизма и стойкое недоверие станут вашим лучшим преимуществом при использовании генеративного ИИ.

Мы готовы перейти к следующему этапу этого разъяснения.

Интернет и генеративный ИИ в этом вместе

Теперь, когда у вас есть некоторое представление о том, что такое генеративный ИИ, мы можем исследовать неприятный вопрос о том, является ли генеративный ИИ справедливым или несправедливым «усилием», или некоторые сказали бы: вопиюще эксплуатации Интернет-контент.

Вот мои четыре жизненно важные темы, относящиеся к этому вопросу:

1) Двойная проблема: плагиат и нарушение авторских прав
2) Попытка доказать плагиат или нарушение авторских прав будет попыткой
3) Обвинение в плагиате или нарушении авторских прав
4) Легальные наземные мины ждут

Я раскрою каждую из этих важных тем и предложу проницательные соображения, над которыми нам всем следует внимательно подумать. Каждая из этих тем — неотъемлемая часть большой головоломки. Вы не можете смотреть только на одну часть. Вы также не можете смотреть на любую часть в отрыве от других частей.

Это сложная мозаика, и вся головоломка должна быть тщательно продумана.

Двойная проблема: плагиат и нарушение авторских прав

Двойная проблема, с которой сталкиваются те, кто создает и внедряет генеративный ИИ, заключается в том, что их товары могут делать две плохие вещи:

1) Плагиат. Генеративный ИИ можно рассматривать как плагиате контент, который существует в Интернете, согласно сканированию Интернета, которое имело место во время обучения данных ИИ.
2) Нарушение авторских прав. Генеративный ИИ можно назвать начинанием нарушение авторского права связанные с интернет-контентом, который был просканирован во время обучения данных.

Чтобы уточнить, в Интернете намного больше контента, чем обычно сканируется для обучения данных генеративного ИИ. Обычно используется лишь небольшая часть Интернета. Таким образом, мы можем предположительно предположить, что любой контент, который не был отсканирован во время обучения данных, не имеет особых претензий к генеративному ИИ.

Однако это несколько спорно, поскольку вы потенциально можете провести линию, соединяющую другое содержимое, которое было отсканировано, с содержимым, которое не было отсканировано. Кроме того, еще одна важная оговорка заключается в том, что даже если есть контент, который не был отсканирован, его все равно можно считать плагиатом и/или нарушением авторских прав, если результаты генеративного ИИ случайно попадут в одну и ту же формулировку. Я хочу сказать, что во всем этом есть много мягкости.

Итог: Генеративный ИИ изобилует потенциальными юридическими головоломками AI Ethical и AI Law, когда речь идет о плагиате и нарушении авторских прав. лежащие в основе преобладающих практик обучения данным.

До сих пор создатели ИИ и исследователи ИИ справлялись с этим практически безнаказанно, несмотря на нависший над ними опасный меч. На сегодняшний день было возбуждено лишь несколько судебных исков против этой практики. Возможно, вы слышали или видели новостные статьи о таких судебных исках. Один, например, связан с фирмами Midjourney и Stability AI, занимающимися преобразованием текста в изображение, за нарушение авторских прав на художественный контент, размещенный в Интернете. Еще один влечет за собой нарушение прав GitHub, Microsoft и OpenAI на преобразование текста в код из-за того, что программное обеспечение Copilot создает приложения AI. Getty Images также стремилась преследовать Стабильность ИИ за нарушение прав на преобразование текста в изображение.

Можно ожидать, что таких исков будет подано больше.

Прямо сейчас немного рискованно возбуждать эти судебные процессы, поскольку результат относительно неизвестен. Встанет ли суд на сторону создателей ИИ или победителями станут те, кто считает, что их контент был использован несправедливо? Дорогостоящая судебная тяжба – это всегда серьезное дело. Расходы на крупномасштабные судебные издержки необходимо сопоставлять с шансами на выигрыш или проигрыш.

Казалось бы, у создателей ИИ почти нет другого выбора, кроме как устроить драку. Если бы они уступили, хотя бы немного, велика вероятность, что это приведет к потоку дополнительных судебных исков (по сути, открывая дверь для повышенных шансов на победу других). Как только в воде появится юридическая кровь, оставшиеся юридические акулы ринутся к предполагаемому «легкому результату», и наверняка произойдет кровавая бойня в деньгах.

Некоторые считают, что мы должны принять новые законы об ИИ, которые защитят создателей ИИ. Защита может иметь даже обратную силу. Основанием для этого является то, что если мы хотим увидеть прогресс в области генеративного ИИ, мы должны предоставить создателям ИИ некоторую взлетно-посадочную полосу в безопасной зоне. Как только судебные иски начнут выигрывать против производителей ИИ, если это произойдет (мы пока не знаем), беспокойство состоит в том, что генеративный ИИ испарится, поскольку никто не захочет оказывать поддержку фирмам, занимающимся ИИ.

Как удачно отмечено в недавней статье Bloomberg Law под названием «ChatGPT: IP, кибербезопасность и другие юридические риски генеративного ИИ» доктора Ильи Колоченко и Гордона Платта, Bloomberg Law, февраль 2023 г., вот два важных отрывка, отражающих эти точки зрения:

«Сейчас среди американских ученых-правоведов и профессоров права ИС бушуют жаркие споры о том, является ли несанкционированный сбор и последующее использование данных, защищенных авторским правом, нарушением авторских прав. Если возобладает мнение практикующих юристов, которые видят нарушения авторских прав в такой практике, пользователи таких систем ИИ также могут быть привлечены к ответственности за вторичное нарушение и потенциально столкнуться с юридическими последствиями».
«Чтобы всесторонне решить эту проблему, законодателям следует подумать не только о модернизации существующего законодательства об авторском праве, но и о введении ряда законов и правил, касающихся ИИ».

Напомним, что как общество мы ввели правовую защиту для расширение Интернета, о чем сейчас свидетельствует Верховный суд, рассматривающий знаменитую или печально известную статью 230. Таким образом, кажется разумным и прецедентным, что мы могли бы захотеть сделать некоторые аналогичные меры защиты для продвижения генеративного ИИ. Возможно, защиту можно было бы установить временно, и срок ее действия истечет после того, как генеративный ИИ достигнет заранее определенного уровня мастерства. Могут быть разработаны и другие защитные положения.

Вскоре я опубликую свой анализ того, как оценка Верховного суда и окончательное решение по статье 230 могут повлиять на появление генеративного ИИ. Следите за этой предстоящей публикацией!

Вернемся к резко озвученному мнению о том, что мы должны дать волю внушающим благоговейный трепет технологическим инновациям, известным как генеративный ИИ. Кто-то скажет, что даже если заявленное нарушение авторских прав имеет место или происходит, общество в целом должно быть готово допустить это для конкретных целей продвижения генеративного ИИ.

Есть надежда, что новые законы ИИ будут тщательно разработаны и адаптированы к особенностям, связанным с обучением данных для генеративного ИИ.

Есть много контраргументов против идеи разработки новых законов ИИ для этой цели. Одна из проблем заключается в том, что любой такой новый закон об ИИ откроет шлюзы для всех видов нарушений авторских прав. Мы будем сожалеть о том дне, когда позволили таким новым законам об искусственном интеллекте попасть в книги. Неважно, как сильно вы пытаетесь ограничить это только обучением данных ИИ, другие украдкой или ловко найдут лазейки, которые будут равносильны неограниченному и безудержному нарушению авторских прав.

Вокруг идут аргументы.

Один аргумент, который не выдерживает особой критики, связан с попыткой подать в суд на сам ИИ. Обратите внимание, что виновными заинтересованными сторонами я называл создателя ИИ или исследователей ИИ. Это люди и компании. Некоторые предполагают, что мы должны нацелиться на ИИ как на сторону, на которую будет подан иск. Я подробно обсуждал в своей колонке, что мы еще не приписываем ИИ правосубъектность, см. ссылка здесь например, и поэтому такие иски, направленные против ИИ как такового, сейчас считались бы бессмысленными.

В дополнение к вопросу о том, на кого или на что следует подать в суд, возникает еще одна пикантная тема.

Предположим, что конкретное приложение для генеративного ИИ разработано каким-то производителем ИИ, которого мы назовем Widget Company. Widget Company относительно невелика по размеру и не имеет большого дохода или больших активов. Подача иска к ним вряд ли принесет огромные богатства, которые можно было бы искать. В лучшем случае вы просто получите удовлетворение от исправления того, что считаете неправильным.

Вы хотите пойти за большой рыбой.

Вот как это будет происходить. Производитель ИИ решает предоставить свой генеративный ИИ для Big Time Company, крупного конгломерата с кучей денег и кучей активов. Судебный процесс с названием Widget Company теперь будет иметь лучшую цель, а именно также с указанием названия Big Time Company. Это битва Давида и Голиафа, которая понравится юристам. Конечно, Big Time Company, несомненно, попытается увернуться от рыболовного крючка. Смогут ли они это сделать, снова является юридическим вопросом, который неясен, и они могут безнадежно увязнуть в грязи.

Прежде чем мы углубимся в это, я хотел бы получить кое-что важное о предполагаемых посягательствах на генеративный ИИ из-за обучения данных. Я уверен, что вы интуитивно понимаете, что плагиат и нарушение авторских прав — это два несколько разных зверя. У них много общего, хотя и существенно различаются.

Вот удобное краткое описание из Университета Дьюка, объясняющее эти два явления:

«Плагиат лучше всего определить как непризнанное использование работы другого человека. Это этический вопрос, связанный с заявлением о признании работы, которую заявитель не создавал. Можно заниматься плагиатом чужой работы независимо от статуса авторского права на эту работу. Например, копирование из книги или статьи, которые слишком стары, чтобы по-прежнему охраняться авторским правом, является плагиатом. Плагиатом также является использование данных, взятых из непризнанного источника, даже если фактический материал, такой как данные, может не охраняться авторским правом. А вот плагиат легко лечится – правильной ссылкой на первоисточник материала».
«Нарушение авторских прав, с другой стороны, — это несанкционированное использование чужой работы. Это юридический вопрос, который зависит от того, защищено ли произведение авторским правом в первую очередь, а также от таких особенностей, как объем использования и цель использования. Если кто-то копирует слишком много защищенной работы или копирует с несанкционированной целью, простое указание на первоисточник не решит проблему. Только получив предварительное разрешение от правообладателя, можно избежать риска обвинения в нарушении авторских прав».

Я указываю на важность этих двух проблем, чтобы вы поняли, что лекарства могут соответственно различаться. Кроме того, они оба связаны с соображениями, пронизывающими этику ИИ и закон об ИИ, что делает их в равной степени заслуживающими изучения.

Давайте рассмотрим заявленное средство или решение. Вы увидите, что это может помочь решить одну из проблем двойной проблемы, но не помочь другой.

Некоторые настаивают на том, что все, что нужно сделать создателям ИИ, — это указать свои источники. Когда генеративный ИИ создает эссе, просто включите конкретные цитаты для всего, что указано в эссе. Укажите различные URL-адреса и другие указания на то, какой интернет-контент использовался. Казалось бы, это избавит их от сомнений по поводу плагиата. Полученное эссе, по-видимому, четко укажет, какие источники использовались для создаваемой формулировки.

В этом заявленном решении есть некоторые придирки, но на уровне 30,000 XNUMX футов, скажем, это действительно служит полуудовлетворительным лекарством от дилеммы плагиата. Как указано выше в объяснении нарушения авторских прав, цитирование исходного материала не обязательно избавит вас от дурной хватки. Предполагая, что контент был защищен авторским правом, и в зависимости от других факторов, таких как количество использованного материала, ожидающий меч нарушения авторских прав может резко и окончательно опуститься.

Двойная беда - вот лозунг.

Попытка доказать плагиат или нарушение авторских прав будет попыткой

Докажите это!

Это заезженный рефрен, который мы все слышали в разное время в нашей жизни.

Вы знаете, как это происходит. Вы можете утверждать, что что-то происходит или уже произошло. Возможно, в глубине души вы знаете, что это произошло. Но когда дело доходит до толчка против толчка, у вас должны быть доказательства.

Говоря сегодняшним языком, вам нужно показать поступления, так как они сказали.

Мой вопрос к вам таков: Как мы собираемся наглядно доказать, что генеративный ИИ ненадлежащим образом использовал интернет-контент?

Предполагается, что ответ должен быть легким. Вы просите или говорите генеративному ИИ подготовить эссе. Затем вы берете эссе и сравниваете его с тем, что можно найти в Интернете. Если вы найдете эссе, бац, вы получите генеративный ИИ, прибитый к пресловутой стене.

Кажется, жизнь никогда не бывает такой легкой.

Представьте, что мы получаем генеративный ИИ для создания эссе, содержащего около 100 слов. Мы ходим и пытаемся добраться до всех закоулков и уголков Интернета, ища эти 100 слов. Если мы найдем 100 слов, показанных в одном и том же порядке и одинаковым образом, мы, кажется, поймали себя на горячем слове.

Предположим, однако, что мы находим в Интернете вроде бы «сопоставимое» эссе, хотя оно соответствует только 80 из 100 слов. Пожалуй, этого еще достаточно. Но представьте, что мы находим только 10 слов из 100 совпадающих. Достаточно ли этого, чтобы заявить, что имел место либо плагиат, либо нарушение авторских прав?

Серость существует.

Текст смешной такой.

Сравните это с обстоятельствами преобразования текста в изображение или текста в искусство. Когда генеративный ИИ предоставляет возможность преобразования текста в изображение или текста в рисунок, вы вводите текстовое приглашение, и приложение ИИ создает изображение на основе предоставленного вами приглашения. Изображение может отличаться от любого изображения, которое когда-либо видели на этой или любой другой планете.

С другой стороны, изображение может напоминать другие изображения, которые существуют. Мы можем посмотреть на генеративное изображение, созданное ИИ, и интуитивно сказать, что оно действительно похоже на какое-то другое изображение, которое мы видели раньше. Как правило, визуальный аспекты сравнения и противопоставления выполняются немного легче. При этом, пожалуйста, знайте, что огромные юридические дебаты гарантируют, что представляет собой наложение или копирование одного изображения из другого.

Похожая ситуация и с музыкой. Существуют генеративные приложения ИИ, которые позволяют вам вводить текстовое приглашение, а вывод, производимый ИИ, — это звуковая музыка. Эти возможности ИИ для преобразования текста в аудио или текст в музыку только сейчас начинают появляться. Одна вещь, на которую вы можете поставить свой главный доллар, заключается в том, что музыка, созданная с помощью генеративного ИИ, будет подвергаться тщательной проверке на предмет нарушений. Кажется, мы понимаем, когда слышим нарушение прав на музыку, хотя опять же, это сложный юридический вопрос, который основан не только на том, как мы относимся к воспринимаемому воспроизведению.

Позвольте мне еще один пример.

Генеративный ИИ, преобразующий текст в код, дает вам возможность ввести текстовое приглашение, и ИИ создаст для вас программный код. Затем вы можете использовать этот код для подготовки компьютерной программы. Вы можете использовать код в том виде, в котором он был сгенерирован, или вы можете отредактировать и настроить код в соответствии со своими потребностями. Также необходимо убедиться, что код является подходящим и работоспособным, поскольку в сгенерированном коде могут возникать ошибки и ложные сведения.

Ваше первое предположение может заключаться в том, что программный код ничем не отличается от текста. Это просто текст. Конечно, это текст, который обеспечивает определенную цель, но это все же текст.

Ну, не совсем так. Большинство языков программирования имеют строгий формат и структуру, соответствующие характеру операторов кодирования этого языка. Это в некотором смысле намного уже, чем свободный естественный язык. Вы несколько запутались в том, как сформулированы операторы кодирования. Точно так же последовательность и способ использования и построения операторов несколько ограничены.

В общем, возможность продемонстрировать, что программный код был плагиатом или нарушением прав, почти проще, чем естественный язык. Таким образом, когда генеративный ИИ сканирует программный код в Интернете, а затем генерирует программный код, шансы утверждать, что код был явно воспроизведен, становятся относительно более убедительными. Не слэм-данк, так что ожидайте ожесточенных сражений.

Моя общая точка зрения заключается в том, что у нас будут одни и те же вопросы этики и закона об ИИ, с которыми будут сталкиваться все виды генеративного ИИ.

Плагиат и нарушение авторских прав будут проблемой для:

Текст в текст или текст в эссе
Текст в изображение или текст в рисунок
Текст в аудио или текст в музыку
Преобразование текста в видео
Текст в код
И т.д.

Все они подвержены одним и тем же опасениям. Некоторые могут быть немного легче «доказать», чем другие. Все они будут иметь свои собственные ночные кошмары, связанные с этикой ИИ и законами об ИИ.

Обвинение в плагиате или нарушении авторских прав

В целях обсуждения давайте сосредоточимся на ИИ, генерирующем текст в текст или текст в эссе. Я делаю это отчасти из-за огромной популярности ChatGPT, который представляет собой тип генеративного ИИ для преобразования текста в текст. Есть много людей, использующих ChatGPT, наряду со многими другими, использующими различные подобные приложения для генерирования текста в текст.

Знают ли те люди, которые используют приложения для генеративного ИИ, что они потенциально полагаются на плагиат или нарушение авторских прав?

Кажется сомнительным, что они делают.

Осмелюсь сказать, что преобладает предположение, что если приложение для генеративного ИИ доступно для использования, производитель ИИ или компания, разместившая ИИ, должны знать или быть уверенными в том, что в продуктах, которые они предлагают для использования, нет ничего неблагоприятного. Если вы можете использовать его, он должен быть честным.

Давайте вернемся к моему предыдущему комментарию о том, как мы собираемся попытаться доказать, что конкретный генеративный ИИ работает на неправомерной основе в отношении обучения данных.

Я мог бы также добавить, что если мы сможем поймать один генеративный ИИ, то шансы поймать другие, вероятно, увеличатся. Я не говорю, что все приложения для генеративного ИИ будут в одной лодке. Но они окажутся в довольно суровых водах, как только один из них будет прижат к стене.

Вот почему также будет очень полезно следить за существующими судебными процессами. Первый, кто выиграет в отношении заявленного нарушения, если это произойдет, возможно, обернется гибелью и мраком для других приложений генеративного ИИ, если только какая-то узость не ускользнет от более широких проблем. Те, кто проигрывает в связи с заявленным нарушением, не обязательно означают, что приложения для генеративного ИИ могут звонить в колокола и праздновать. Возможно, потеря связана с другими факторами, которые не так важны для других приложений генеративного ИИ, и так далее.

Я упомянул, что если мы возьмем эссе из 100 слов и попытаемся найти те же самые слова в точно такой же последовательности в Интернете, у нас могут быть относительно веские доводы в пользу плагиата или нарушения авторских прав, при прочих равных условиях. Но если количество совпадающих слов невелико, мы, похоже, находимся на тонком льду.

Я хотел бы копнуть глубже в этом.

Очевидный аспект сравнения состоит в том, что одни и те же слова находятся в одной и той же последовательности. Это может происходить для целых пассажей. Это было бы удобно заметить, как будто нам преподносят на блюдечке с голубой каемочкой.

Мы также могли бы быть подозрительны, если бы совпадал только фрагмент слов. Идея заключалась бы в том, чтобы увидеть, являются ли они ключевыми словами или, возможно, словами-заполнителями, которые мы можем легко удалить или проигнорировать. Мы также не хотим быть обманутыми использованием слов в их прошедшем или будущем времени или другим дурачеством. Эти варианты слов также следует учитывать.

Другой уровень сравнения будет, когда слова в значительной степени не являются одними и теми же словами, но слова, даже в различном состоянии, по-прежнему кажутся одними и теми же. Например, в резюме часто используются очень похожие слова в качестве первоисточника, но мы можем различить, что резюме, похоже, основано на первоисточнике.

Самый сложный уровень сравнения будет основан на концепциях или идеях. Предположим, мы видим эссе, в котором нет одинаковых или похожих слов в качестве базы для сравнения, но суть или идеи те же. Мы, по общему признанию, приближаемся к трудной территории. Если бы мы с готовностью сказали, что идеи тщательно охраняются, мы бы закрыли почти все формы знания и расширения знаний.

Мы можем еще раз сослаться на удобное объяснение из Университета Дьюка:

«Авторское право не защищает идеи, а только конкретное выражение идеи. Например, суд решил, что Дэн Браун не нарушал авторских прав на более раннюю книгу, когда писал The Da Vinci Code потому что все, что он заимствовал из более ранней работы, было основными идеями, а не особенностями сюжета или диалога. Поскольку авторское право предназначено для поощрения творческого производства, использование чужих идей для создания новой и оригинальной работы поддерживает цель авторского права, а не нарушает ее. Только если кто-то копирует выражение другого без разрешения, потенциально нарушается авторское право».
«С другой стороны, чтобы избежать плагиата, нужно признавать источник даже идей, которые заимствованы у кого-то другого, независимо от того, заимствовано ли выражение этих идей вместе с ними. Таким образом, парафраз требует цитирования, даже если он редко вызывает какие-либо проблемы с авторским правом».

Обратите внимание, как было указано ранее, на различия между аспектами двойной проблемы.

Итак, применение подходов сравнения на практике происходит уже много лет. Подумайте об этом так. У учащихся, которые пишут эссе для своих школьных занятий, может возникнуть соблазн взять контент из Интернета и притвориться, что они являются авторами слов, получивших Пулитцеровскую премию с оценкой A.

Учителя уже давно используют программы проверки на плагиат, чтобы справиться с этим. Преподаватель берет сочинение ученика и отправляет его в программу проверки на плагиат. В некоторых случаях вся школа будет лицензировать использование программы проверки на плагиат. Всякий раз, когда студенты сдают эссе, они должны сначала отправить эссе в программу проверки на плагиат. Учитель информируется о том, что сообщает программа.

К сожалению, вы должны быть крайне осторожны с тем, что говорят эти программы проверки на плагиат. Важно внимательно оценить, являются ли заявленные показания действительными. Как уже упоминалось, возможность установить, было ли произведение скопировано, может быть туманной. Если вы бездумно примете результаты программы проверки, вы можете ложно обвинить студента в копировании, когда он этого не делал. Это может быть душераздирающе.

Двигаясь дальше, мы можем попробовать использовать программы проверки на плагиат в области тестирования генеративных результатов ИИ. Относитесь к сочинениям, выводящимся из приложения для генеративного ИИ, так, как если бы они были написаны студентом. Затем мы оцениваем, что говорит программа проверки на плагиат. Это делается с недоверием.

Недавно было проведено исследование, в котором была предпринята попытка операционализировать эти типы сравнений в контексте генеративного ИИ именно таким образом. Я хотел бы обсудить с вами несколько интересных находок.

Во-первых, требуется дополнительный фон. Генеративный ИИ иногда называют LLM (большие языковые модели) или просто LM (языковые модели). Во-вторых, ChatGPT основан на версии другого пакета генеративного искусственного интеллекта OpenAI под названием GPT-3.5. До GPT-3.5 была GPT-3, а до этого была GPT-2. В настоящее время GPT-2 считается довольно примитивным по сравнению с более поздними сериями, и мы все с нетерпением ждем предстоящей презентации GPT-4, см. мое обсуждение на ссылка здесь.

Исследование, которое я хочу кратко рассмотреть, состояло в изучении GPT-2. Это важно понимать, поскольку мы сейчас далеко за пределами возможностей GPT-2. Не делайте поспешных выводов по результатам этого анализа ГПТ-2. Тем не менее, мы можем многое узнать из оценки GPT-2. Исследование называется «Являются ли языковые модели плагиатом?» Джуён Ли, Тай Ле, Цзинхуи Чен и Донгвон Ли, появившиеся в ACM WWW '23, 1–5 мая 2023 г., Остин, Техас, США.

Это их главный исследовательский вопрос:

«В какой степени (не ограничиваясь запоминанием) LM используют фразы или предложения из своих обучающих образцов?»

Они использовали эти три уровня или категории потенциального плагиата:

«Дословный плагиат: точные копии слов или фраз без преобразования».
«Перефразирующий плагиат: замена синонимов, изменение порядка слов и/или обратный перевод».
«Плагиат идеи: представление основного содержания в удлиненной форме».

GPT-2 действительно был обучен на данных из Интернета и, следовательно, является подходящим кандидатом для такого типа анализа:

«GPT-2 предварительно обучен на WebText и содержит более 8 миллионов документов, извлеченных из 45 миллионов ссылок Reddit. Поскольку OpenAI публично не выпускал WebText, мы используем OpenWebText, который является воссозданием корпуса WebText с открытым исходным кодом. Он надежно использовался в предшествующей литературе».

Выборочные ключевые результаты, выдержки из исследования, включают:

«Мы обнаружили, что предварительно обученные семейства GPT-2 действительно занимаются плагиатом из OpenWebText».
«Наши результаты показывают, что точная настройка значительно снижает количество случаев дословного плагиата из OpenWebText».
«В соответствии с Carlini et al. и Carlini et al., мы обнаружили, что более крупные модели GPT-2 (большие и xl) обычно генерируют плагиатные последовательности чаще, чем более мелкие».
«Однако разные LM могут демонстрировать разные модели плагиата, и поэтому наши результаты могут не распространяться напрямую на другие LM, включая более поздние LM, такие как GPT-3 или BLOOM».
«Кроме того, известно, что автоматические детекторы плагиата имеют множество режимов отказа (как ложноотрицательных, так и ложноположительных).
«Учитывая, что большинство обучающих данных LM извлекается из Интернета без уведомления владельцев контента, повторение ими слов, фраз и даже основных идей из обучающих наборов в сгенерированных текстах имеет этические последствия».

Нам определенно нужно гораздо больше исследований такого рода.

Если вам интересно, как GPT-2 сравнивается с GPT-3 в отношении обучения данных, существует довольно заметный контраст.

Согласно сообщениям, подготовка данных для GPT-3 была гораздо более обширной:

«Модель обучалась с использованием текстовых баз данных из Интернета. Это включало колоссальные 570 ГБ данных, полученных из книг, веб-текстов, Википедии, статей и других материалов в Интернете. Точнее, в систему было введено 300 миллиардов слов» (Научный фокус Би-би-си журнала «ChatGPT: все, что вам нужно знать об инструменте OpenAI GPT-3» Алекса Хьюза, февраль 2023 г.).

Для тех из вас, кто заинтересован в более подробных описаниях обучения данных для GPT-3, вот выдержка из официальной карты модели GPT-3, размещенной на GitHub (дата последнего обновления указана как сентябрь 2020 г.):

«Обучающий набор данных GPT-3 состоит из текста, размещенного в Интернете, или из текста, загруженного в Интернет (например, книги). Интернет-данные, на которых он обучался и оценивался на сегодняшний день, включают: (1) версию набора данных CommonCrawl, отфильтрованную на основе сходства с высококачественными эталонными корпусами, (2) расширенную версию набора данных Webtext, (3 ) два книжных корпуса в Интернете и (4) англоязычная Википедия».
«Учитывая обучающие данные, результаты и производительность GPT-3 более характерны для людей, подключенных к Интернету, чем для тех, кто погружен в вербальную, нецифровую культуру. Население, подключенное к Интернету, в большей степени представляет развитые страны, богатые, молодые и мужские взгляды, и в основном ориентировано на США. Более богатые страны и население в развитых странах демонстрируют более высокий уровень проникновения Интернета. Цифровой гендерный разрыв также показывает, что во всем мире меньше женщин представлено в Интернете. Кроме того, поскольку в разных частях мира уровень проникновения и доступа к Интернету разный, в наборе данных недостаточно представлены менее связанные сообщества».

Один вывод из приведенного выше указания о GPT-3 заключается в том, что эмпирическое правило среди тех, кто создает генеративный ИИ, заключается в том, что чем больше интернет-данных вы можете отсканировать, тем выше шансы на улучшение или продвижение генеративного ИИ.

Вы можете посмотреть на это одним из двух способов.

1) Улучшенный искусственный интеллект. У нас будет генеративный ИИ, который будет сканировать как можно большую часть Интернета. Захватывающий результат заключается в том, что генеративный ИИ будет лучше, чем он уже есть. Это то, чего нужно с нетерпением ждать.
2) Копирование потенциального изобилия. Это расширение сканирования Интернета неприятно и увлекательно делает проблему плагиата и нарушения авторских прав потенциально все более и более серьезной. В то время как раньше не было затронуто так много создателей контента, размер будет расти. Если вы юрист на стороне создателей контента, это вызывает у вас слезы (может быть, слезы разочарования или слезы радости от того, какие перспективы это дает в плане судебных исков).

Стакан наполовину полон или наполовину пуст?

Вам решать.

Легальные наземные мины ждут

Вопрос, который вы, возможно, обдумываете, заключается в том, считается ли ваш размещенный в Интернете контент справедливой игрой для сканирования. Если ваш контент находится за платным доступом, вероятно, он не является объектом сканирования, поскольку к нему трудно получить доступ, в зависимости от силы платного доступа.

Я предполагаю, что большинство обычных людей не прячут свой контент за платным доступом. Они хотят, чтобы их контент был общедоступным. Они предполагают, что люди посмотрят на это.

Означает ли общедоступность вашего контента также аксиоматически, что вы разрешаете его сканирование для использования генеративным ИИ, который обучается данным?

Может быть да, может быть нет.

Это один из тех юридических вопросов, которые закатывают глаза.

Возвращаясь к ранее приведенному Закон Блумберга В статье авторы отмечают важность Положений и условий (УиУ), связанных со многими веб-сайтами:

«Юридическая наземная мина, в значительной степени игнорируемая невольными ИИ-компаниями, которые используют онлайн-ботов для извлечения данных, скрыта в положениях и условиях, обычно доступных на общедоступных веб-сайтах всех типов. В отличие от неурегулированного в настоящее время закона об интеллектуальной собственности и дилеммы о нарушении авторских прав, Положения и условия веб-сайта поддерживаются хорошо зарекомендовавшим себя договорным правом и, как правило, могут быть приведены в исполнение в суде, опираясь на достаточное количество прецедентов».

Они указывают, что если на вашем веб-сайте есть страница, связанная с лицензированием, есть вероятность, что если вы использовали стандартизированный современный шаблон, он может содержать важный пункт:

«Следовательно, большинство стандартных положений и условий для веб-сайтов, которые в изобилии доступны в свободном доступе, содержат пункт, запрещающий автоматический сбор данных. По иронии судьбы, такие свободно доступные шаблоны, возможно, использовались для обучения ChatGPT. Поэтому владельцы контента могут пересмотреть свои Условия и положения и включить отдельный пункт, категорически запрещающий любое использование любого контента с веб-сайтов для обучения ИИ или любых связанных с этим целей, независимо от того, собирается ли он вручную или автоматически, без предварительного письменного разрешения владельца веб-сайта. ».

В их анализ потенциальных действий, которые создатели контента могут предпринять в отношении своих веб-сайтов, включен дополнительный кикер:

«Поэтому включение подлежащего исполнению положения о заранее оцененных убытках для каждого нарушения пункта о запрете очистки, дополненного положением о запрете без залога, может быть разумным решением для тех авторов творческого контента, которые не стремятся предоставлять плоды своего труда. интеллектуальный труд для целей обучения ИИ без оплаты или, по крайней мере, должного признания их работы».

Возможно, вы захотите проконсультироваться по этому поводу со своим адвокатом.

Некоторые говорят, что это жизненно важный способ попытаться сказать создателям ИИ, что создатели контента очень серьезно относятся к защите своего контента. Убедившись, что ваше лицензирование имеет правильную формулировку, вы, кажется, обращаете внимание на производителей ИИ.

Хотя другие настроены несколько мрачно. Они уныло говорят, что вы можете продолжать размещать на своем веб-сайте самый суровый и смертоносный юридический язык, но в конце концов создатели ИИ собираются его отсканировать. Вы не будете знать, что они сделали это. У вас будет чертовски много времени, чтобы доказать, что они это сделали. Вы вряд ли обнаружите, что их результаты отражают ваш контент. Это тяжелая битва, в которой вы не выиграете.

Контраргумент состоит в том, что вы отказываетесь от битвы еще до того, как она началась. Если у вас, по крайней мере, нет достаточного юридического языка, и если вы когда-нибудь поймаете их, они будут извиваться и ластиться, чтобы избежать любой ответственности. Все потому, что вы не опубликовали правильный юридический жаргон.

Между тем, другой подход, который стремится набрать обороты, будет состоять из маркировка ваш веб-сайт с чем-то, что говорит, что сайт не должен сканироваться генеративным ИИ. Идея состоит в том, что будет разработан стандартизированный маркер. Предположительно, веб-сайты могут добавить маркер на свой сайт. Создателям ИИ сказали бы, что они должны изменить сканирование данных, чтобы пропустить отмеченные веб-сайты.

Может ли маркерный подход быть успешным? Проблемы включают затраты на получение и размещение маркеров. Наряду с тем, будут ли производители ИИ соблюдать маркеры и следить за тем, чтобы они не сканировали отмеченные сайты. Другая точка зрения заключается в том, что даже если производители ИИ не соглашаются с маркировкой, это дает еще одну контрольную подсказку для обращения в суд и утверждения, что создатель контента прошел последнюю милю, чтобы попытаться предупредить о сканировании ИИ.

Угу, от всего этого кружится голова.

Заключение

Несколько заключительных замечаний по этой щекотливой теме.

Готовы ли вы к ошеломляющему взгляду на весь этот ИИ как на дилемму плагиатора и нарушителя авторских прав?

Большая часть предположений о «ловле» генеративного ИИ на плагиате или нарушении авторских прав зависит от обнаружения выходных данных, которые сильно напоминают предыдущие работы, такие как контент в Интернете, который потенциально был просканирован во время обучения данных.

Предположим, однако, что здесь задействована уловка «разделяй и властвуй».

Вот что я имею в виду.

Если генеративный ИИ заимствует немного отсюда и совсем немного оттуда, в конечном итоге смешивая их вместе для получения какого-либо конкретного результата, шансы на удачный момент значительно уменьшаются. Любой вывод, по-видимому, не поднимется до достаточного порога, чтобы вы могли с уверенностью сказать, что он был скопирован из одного конкретного исходного элемента. Результирующее эссе или другие способы вывода будут совпадать лишь частично. И при обычном подходе, пытающемся доказать, что имело место плагиат или нарушение авторских прав, вам, как правило, приходится демонстрировать больше, чем какой-то крошечный фрагмент, особенно если этот кусочек не является выдающимся и его можно найти в Интернете (подрезая любое адекватное бремя доказывания незаконного присвоения).

Можете ли вы по-прежнему убедительно заявлять, что обучение данных с помощью генеративного ИИ обкрадывало веб-сайты и создателей контента, даже если предлагаемое доказательство является якобы несущественной пропорцией?

Подумай об этом.

Если мы сталкиваемся с потенциально масштабным плагиатом и масштабным нарушением авторских прав, нам может потребоваться изменить наш подход к определению того, что представляет собой плагиат и/или нарушение авторских прав. Возможно, есть дело о плагиате или нарушении авторских прав в основном или в целом. Мозаика, состоящая из тысяч или миллионов крошечных фрагментов, может быть истолкована как совершение таких нарушений. Очевидная проблема заключается в том, что это может привести к тому, что любой контент может внезапно попасть под зонтик взломов. Это может быть скользкий путь.

Тяжелые мысли.

Говоря о здравых мыслях, легендарный писатель Лев Толстой сказал: «Единственный смысл жизни — служить человечеству».

Если ваш веб-сайт и веб-сайты других сканируются для улучшения ИИ, и хотя вы не получаете за это ни копейки, можете ли вы найти серьезное утешение в твердой вере в то, что вы вносите свой вклад в будущее человечества? Кажется, это небольшая цена.

Ну, если только ИИ не окажется страшным экзистенциальным риском, который стирает с лица земли всех людей. Вы не должны приписывать себе это. Я предполагаю, что вы не стали бы способствовать такому ужасному исходу. Отложив в сторону это злополучное предсказание, вы можете подумать, что если создатели ИИ зарабатывают деньги на своем генеративном ИИ и, кажется, наслаждаются спекуляцией, вы тоже должны получить свой кусок пирога. Делитесь и делитесь одинаково. Создатели ИИ должны запрашивать разрешение на сканирование любого веб-сайта, а затем также договариваться о цене за разрешение на сканирование.

Отдайте должное, если причитается.

Предоставим пока последнее слово сэру Вальтеру Скотту: «О, какую запутанную паутину мы плетем. Сначала мы практикуемся обманывать».

Это может быть применимо, если вы считаете, что происходит обман, или, возможно, не применимо, если вы думаете, что все в порядке, совершенно честно и законно. Пожалуйста, отдайте себе должное за то, что обдумали это. Ты заслуживаешь это.

Источник: https://www.forbes.com/sites/lanceeliot/2023/02/26/legal-doomsday-for-generative-ai-chatgpt-if-caught-plagiarizing-or-infringing-warns-ai-ethics- и-ай-право/