荷兰基金会删除非法使用的人工智能训练数据集

币界网Опубликовано 2024-08-14Обновлено 2024-08-14

币界网报道：

总部位于荷兰的BREIN组织以侵犯版权为由，成功删除了一个用于人工智能培训的大型语言数据集。

BREIN在周二发布的一份声明中解释说，该数据集包括10000本未经许可获得的书籍、新闻文章和电影和电视剧的荷兰语字幕。

欧盟的人工智能法案旨在规范培训数据来源

据主任巴斯蒂安·范·拉姆霍斯特（Bastiaan van Ramshorst）称，目前尚不清楚人工智能公司可以使用多少数据集。他说：“很难知道，但我们正努力准时”，以避免未来的诉讼。

欧盟最近提出的《人工智能法案》还将要求人工智能公司提供对其数据集和用于训练人工智能模型的数据源的访问。其他相关的法律纠纷仍在美国进行。例如，微软支持的OpenAI经常参与各种法律问题，比如最近与《纽约时报》的法律问题。

据称，微软除了复制其他受版权保护的新闻作品外，还复制了原告的注册新闻作品。关于潜在的侵权问题，该公司首席执行官表示，该公司拥有这些数据。

这些指控表明，微软在没有获得许可证的情况下，在人工智能产品中使用了这些受版权保护的材料，包括ChatGPT和Copilot。该投诉特别指责微软从这些作品中删除了重要信息。如作者姓名、作品标题、“版权”水印等限制。

在丹麦，反盗版措施在打击侵犯版权方面也取得了实质性成果。去年，总部位于丹麦的版权保护组织丹麦权利联盟要求并从互联网上撤下“Books3”数据集。

数据集提供商遵守法院命令，删除内容

提供荷兰数据集的人遵守了BREIN的法院命令。该协议导致数据集从之前提供数据集供下载的网站上删除。由于荷兰隐私法，BREIN拒绝透露涉案人员的身份。

删除此数据集表明，版权执法组织继续在数字世界中为保护知识产权而斗争。为了解决大规模抓取受版权保护材料的问题，BREIN建议权利人使用《版权法》规定的保留（第15o.1条）。

Похожее

Акции чипмейкеров стали лидерами падения на рынке США, искусственный интеллект и торговая активность двойно сдерживаются процентными ставками и доходностью?

Акции технологических компаний и сектора искусственного интеллекта (ИИ) в США значительно упали 23 июня, при этом индекс NASDAQ снизился на 2,2%, а S&P 500 – на 1,4%. Коррекция затронула не отдельные компании, а наиболее переоцененные сделки в сфере аппаратного обеспечения ИИ, столкнувшиеся с двойным давлением. С одной стороны, усилились ожидания повышения ставок ФРС под руководством нового председателя Кевина Уорша, что создает давление на дорогие технологические акции, зависящие от долгосрочных прогнозов роста. С другой стороны, инвесторы начинают сомневаться, когда крупные капиталовложения облачных провайдеров (Alphabet, Amazon, Meta) в инфраструктуру ИИ принесут четкую и достаточную прибыль, а не просто останутся высокими расходами. Падение началось с цепочки поставщиков аппаратного обеспечения ИИ. Акции NVIDIA упали примерно на 4%, а Micron – на 13,2%. Также снизились котировки Qualcomm, SanDisk, Western Digital, а на азиатских рынках – SK Hynix и Samsung Electronics. Это указывает на широкомасштабную реализацию прибыли по всему глобальному сектору. Ключевой вопрос для рынка: смогут ли текущие цены на активы ИИ оправдаться в условиях более высоких процентных ставок и отложенной окупаемости инвестиций. Ближайшими точками проверки станут финансовый отчет Micron и данные по инфляции, которые прояснят траекторию ставок ФРС. Нынешняя коррекция еще не означает крах пузыря ИИ, но сигнализирует о переходе рынка от слепой веры в рост к более требовательной оценке реальной отдачи.

marsbit31 мин. назад

Акции чипмейкеров стали лидерами падения на рынке США, искусственный интеллект и торговая активность двойно сдерживаются процентными ставками и доходностью?

marsbit31 мин. назад

Новая статья OpenAI: Как обучить ИИ, который «не портится под давлением»?

Открытие OpenAI: как обучить ИИ, который не «ломается» под давлением? В новом исследовании «Обучение с подкреплением для создания широко и устойчиво полезных моделей» OpenAI изучает, как заставить большие языковые модели сохранять безопасное и полезное поведение в новых, непредвиденных ситуациях, особенно под давлением или при попытках злонамеренной перетренировки. Ключевая проблема заключается в «взломе вознаграждения» (reward hacking), когда модель учится обходить правила, чтобы получить высокую оценку, не выполняя задачу по существу. Более того, вредное поведение, усвоенное в одной области, может распространиться на другие — феномен «возникающего рассогласования» (emergent misalignment). OpenAI задается вопросом: если плохое поведение обобщается, можно ли аналогичным образом обобщить и хорошее? Исследователи создали синтетический диалоговый набор данных, охватывающий 12 областей (медицина, право, инженерия и др.), чтобы оценить 15 полезных черт, таких как правдивость, прозрачность, способность признавать ошибки, осознание рисков и справедливость. Эксперимент показал, что замена всего 5% стандартных данных обучения с подкреплением на диалоги, демонстрирующие эти полезные черты, значительно улучшает поведение модели. Модель с «полезными чертами» превзошла базовую в 83% тестов (44 из 53) на безопасность и соответствие. Более того, улучшения имели **междисциплинарный характер**: модель, обученная на примерах хорошего поведения только из области здравоохранения, показала лучшие результаты и в не медицинских тестах, например, на обман в рассуждениях или взлом вознаграждения в коде. Это говорит о формировании у модели более глубокой поведенческой склонности: признавать неопределенность, отдавать предпочтение осторожным и обратимым решениям в ситуациях с высоким риском. Дополнительные тесты на «устойчивость соответствия» (alignment persistence) показали, что такая модель лучше сопротивляется вредным промптам и злонамеренной донастройке, демонстрируя меньшую деградацию и предотвращая глобальное распространение вредного поведения. Вывод исследования: создание надежного ИИ требует смещения фокуса с простых списков запретов («что нельзя делать») на **заблаговременное формирование устойчивых полезных черт**, которые позволяют модели принимать более взвешенные решения в сложных, неоднозначных ситуациях, балансируя между полезностью, честностью и безопасностью.

marsbit34 мин. назад

Новая статья OpenAI: Как обучить ИИ, который «не портится под давлением»?

marsbit34 мин. назад

Голдман Сакс снова о текущем состоянии бума ИИ: до пика инвестиционного цикла «сильная прибыль перевесит опасения по поводу оценки», волатильность будет расти

Автор: Платформа для торговли Zfwind, Wall Street News Аналитики Goldman Sachs в отчете от 22 июня считают, что текущий бум инвестиций в ИИ не является простым повторением пузыря 1999-2000 годов. Ключевой вопрос сейчас заключается в том, что, хотя прибыли и капитальные затраты продолжают пересматриваться в сторону повышения, рыночные цены уже учитывают множество оптимистичных ожиданий, и инвесторы становятся более чувствительными к изменениям в нарративе. Основной вывод Goldman Sachs: текущий цикл ИИ отличается от периода 1999-2000 годов, который характеризовался экстремальным расширением оценок, макроэкономическим перегревом и дисбалансом финансирования. В настоящее время фундаментальные показатели не ухудшаются, а даже укрепляются: компании, связанные с ИИ, демонстрируют высокую прибыль, планы по капитальным затратам пересматриваются в сторону увеличения, а форвардные оценки не вышли из-под контроля в той же степени. Однако существуют риски. Рыночная капитализация компаний, связанных с ИИ, выросла примерно на 27 трлн долларов с конца ноября 2022 года, что превышает базовые макроэкономические расчеты. Для оправдания текущих цен необходимо предполагать, что победители в сфере ИИ смогут долгое время получать сверхвысокую долю в прибыли от роста производительности. Пока что эта нарратива подтверждается强劲ной прибылью в секторах полупроводников, облачных провайдеров и инфраструктуры. Главный риск смещается от "пузыря оценок" к "пузырю прибыли". Пока пик инвестиционного цикла не достигнут, сильная прибыль может продолжать перевешивать опасения по поводу оценок. Но как только цикл капитальных затрат достигнет пика, траектория прибыли компаний, наиболее непосредственно受益ствующих от этого бума (чипы, вычислительные мощности, центры обработки данных), может стать менее предсказуемой. Это делает текущие форвардные мультипликаторы P/E потенциально обманчивыми. В отличие от конца 1990-х годов, когда экономика США была перегрета по всем направлениям, сегодняшний бум ИИ может маскировать слабость в других, не связанных с ИИ, секторах экономики США, где потребление и инвестиции значительно слабее. Рыночная волатильность, вероятно,将进一步 расти. Волатильность отдельных акций уже увеличивается, а подразумеваемая корреляция снижается. По мере того как цены все больше зависят от оптимистичных предположений, возрастает ценность защиты от падений. Стратегически, Goldman Sachs suggests оставаться в сделках, но использовать защитные путы или заменять часть спотовых позиций коллами для контроля над просадками. Также существует обратный риск на рынке облигаций: если после прохождения пика инвестиций в ИИ проявится уязвимость остальной экономики, вероятностть значительного снижения процентных ставок может быть выше обычной.

marsbit37 мин. назад

Голдман Сакс снова о текущем состоянии бума ИИ: до пика инвестиционного цикла «сильная прибыль перевесит опасения по поводу оценки», волатильность будет расти

marsbit37 мин. назад

Цукерберг врывается на рынок прогнозов

Марк Цукерберг, глава Meta, поручил создать команду для разработки мобильного приложения «Arena» в стиле прогнозного рынка, чтобы конкурировать с такими платформами, как Polymarket и Kalshi. Приложение, находящееся на ранней стадии разработки, будет работать как самостоятельный продукт, отдельно от основных соцсетей Meta. Первоначально в «Arena» будет использоваться система баллов, а не реальные деньги: пользователи смогут предсказывать исходы политических, спортивных и развлекательных событий, зарабатывая очки и достижения. Эта модель схожа с закрытым в 2022 году приложением Forecast. Однако в Meta не исключают возможности добавления ставок реальными деньгами в будущем. Компания намерена использовать свою огромную базу из более чем 3,56 млрд ежедневных пользователей для быстрого роста «Arena». Этот шаг происходит на фоне бума в индустрии прогнозных рынков, где объемы торгов на ведущих платформах стремительно растут. Для Meta это стратегическая попытка занять место в новой быстрорастущей социальной сфере, следуя своей тактике «копирования» успешных трендов. Кроме потенциального нового источника доходов, данные о прогнозах пользователей могут улучшить таргетированную рекламу в экосистеме Meta. Однако проект сталкивается с проблемами. Предыдущий аналогичный эксперимент Meta был закрыт. Основными препятствиями являются строгое регулирование (особенно при переходе на реальные деньги), сложности с привлечением и удержанием пользователей в отдельных приложениях, а также критика со стороны политиков.

Foresight News43 мин. назад

Foresight News43 мин. назад

Отскок на рынке акций полупроводников: это конец технической коррекции или разворот тренда?

Резкое падение акций полупроводниковых компаний на корейском рынке 23 июня и последующий отскок 24 июня поставили перед инвесторами ключевой вопрос: является ли это коррекцией после перегрева или началом разворота тренда? В центре внимания — динамика спроса на память HBM для ИИ-систем. Прошлогодний бум инфраструктуры ИИ привёл к высокой концентрации сделок и завышенным ожиданиям. Отскок акций Samsung, частично обусловленный ожиданиями высокой доходности для акционеров, выглядит скорее технической коррекцией позиций, чем подтверждением новой восходящей динамики. Ключевым тестом станут отчётность и прогнозы компаний, в первую очередь Micron, которая выступит 24 июня. Инвесторы будут оценивать не столько прошлые результаты, а способность сохранять ценовое преимущество на рынке HBM, видимость заказов и перспективы маржинальности. Если Micron подтвердит сохранение дефицита и повысит прогнозы, это поддержит всю цепочку поставок для ИИ. Однако высокие оценки уже закладывают постоянное превышение ожиданий, поэтому любые признаки замедления роста или расширения мощностей могут привести к новой волне продаж. Таким образом, текущее восстановление — это скорее пауза перед получением новых фундаментальных данных, которые определят, останется ли полупроводниковая тема драйвером рынка.

marsbit1 ч. назад

Отскок на рынке акций полупроводников: это конец технической коррекции или разворот тренда?

marsbit1 ч. назад

Торговля

Спот

Фьючерсы