荷兰基金会删除非法使用的人工智能训练数据集

币界网Publié le 2024-08-14Dernière mise à jour le 2024-08-14

币界网报道:

总部位于荷兰的BREIN组织以侵犯版权为由,成功删除了一个用于人工智能培训的大型语言数据集。

BREIN在周二发布的一份声明中解释说,该数据集包括10000本未经许可获得的书籍、新闻文章和电影和电视剧的荷兰语字幕。

欧盟的人工智能法案旨在规范培训数据来源

据主任巴斯蒂安·范·拉姆霍斯特(Bastiaan van Ramshorst)称,目前尚不清楚人工智能公司可以使用多少数据集。他说:“很难知道,但我们正努力准时”,以避免未来的诉讼。

欧盟最近提出的《人工智能法案》还将要求人工智能公司提供对其数据集和用于训练人工智能模型的数据源的访问。其他相关的法律纠纷仍在美国进行。例如,微软支持的OpenAI经常参与各种法律问题,比如最近与《纽约时报》的法律问题。

据称,微软除了复制其他受版权保护的新闻作品外,还复制了原告的注册新闻作品。关于潜在的侵权问题,该公司首席执行官表示,该公司拥有这些数据。

这些指控表明,微软在没有获得许可证的情况下,在人工智能产品中使用了这些受版权保护的材料,包括ChatGPT和Copilot。该投诉特别指责微软从这些作品中删除了重要信息。如作者姓名、作品标题、“版权”水印等限制。

在丹麦,反盗版措施在打击侵犯版权方面也取得了实质性成果。去年,总部位于丹麦的版权保护组织丹麦权利联盟要求并从互联网上撤下“Books3”数据集。

数据集提供商遵守法院命令,删除内容

提供荷兰数据集的人遵守了BREIN的法院命令。该协议导致数据集从之前提供数据集供下载的网站上删除。由于荷兰隐私法,BREIN拒绝透露涉案人员的身份。

删除此数据集表明,版权执法组织继续在数字世界中为保护知识产权而斗争。为了解决大规模抓取受版权保护材料的问题,BREIN建议权利人使用《版权法》规定的保留(第15o.1条)。

Lectures associées

Nouvelle étude d'OpenAI : Comment entraîner une IA qui 'ne déraille pas sous pression' ?

Les modèles d'IA modernes peuvent se comporter de manière non fiable ou dangereuse lorsqu'ils sont poussés au-delà de leurs données d'entraînement ou soumis à des pressions. Dans un nouveau document de recherche intitulé "Reinforcement Learning Towards Broadly and Persistently Beneficial Models", OpenAI explore comment entraîner des modèles pour qu'ils conservent des comportements bénéfiques et sûrs dans de nouveaux scénarios complexes et sous contrainte. Plutôt que de se concentrer uniquement sur une liste d'interdictions, l'étude défend l'idée qu'un bon assistant d'IA doit, dans des situations inédites, rester honnête, prudent, capable d'être corrigé et orienté vers des jugements bénéfiques pour l'humain. Elle propose d'utiliser l'apprentissage par renforcement non pas pour maximiser une récompense étroite (ce qui peut conduire à des détournements ou "reward hacking"), mais pour inculquer des traits bénéfiques profonds. Les chercheurs ont créé un ensemble de données de dialogue synthétique couvrant 12 domaines (médical, juridique, scientifique, etc.) pour évaluer 15 traits bénéfiques comme la véracité, la transparence métacognitive, la perception des risques et l'équité. Dans des expériences, le remplacement de seulement 5% des données d'entraînement standard par des données axées sur ces traits a significativement amélioré les performances du modèle sur 44 des 53 évaluations de sécurité et d'alignement, avec une amélioration moyenne de 9,1 points de pourcentage. Fait marquant, un modèle entraîné avec des données de traits bénéfiques uniquement dans le domaine de la santé a également montré des améliorations dans des tâches non sanitaires, suggérant un transfert d'alignement inter-domaines. Le modèle a appris une inclination sous-jacente à reconnaître l'incertitude et à privilégier la prudence dans les situations à risque. De plus, ces modèles ont démontré une "persistance de l'alignement" plus forte, résistant mieux aux invites adverses et au réglage fin malveillant sans dégradation généralisée de leur comportement. OpenAI souligne que cette recherche ne résout pas l'alignement des IA, mais représente un pas vers un "façonnage préalable" des modèles. L'enjeu pour l'industrie est de développer des IA dont le comportement reste robuste et prévisible dans des tâches complexes à haut risque, au-delà du simple refus systématique.

marsbitIl y a 32 mins

Nouvelle étude d'OpenAI : Comment entraîner une IA qui 'ne déraille pas sous pression' ?

marsbitIl y a 32 mins

Goldman Sachs aborde à nouveau l'état actuel de la frénésie de l'IA : "Les bénéfices solides l'emporteront sur les inquiétudes liées à la valorisation" avant que le cycle d'investissement n'atteigne son sommet, la volatilité augmentera encore

L'engouement pour l'IA n'est pas une simple réplique de la bulle de 1999-2000, selon Goldman Sachs. Le rapport clé est que, si les bénéfices et les dépenses en capital continuent d'être révisés à la hausse, les marchés ont déjà intégré des attentes optimistes importantes, les rendant plus sensibles à tout changement de récit. Contrairement à la fin des années 1990, la valorisation prospective n'est pas excessivement étirée car les anticipations de profits ont augmenté en parallèle des cours. Le signal majeur actuel est l'accélération des investissements en IA, dont l'intensité dépasse déjà le pic des années 90. Cependant, d'autres signaux de bulle (baisse des marges macro, déséquilibres de financement des entreprises, déficit courant) ne sont pas présents. Le défi principal est désormais le risque de "bulle de profits". La valeur boursière ajoutée des sociétés liées à l'IA (environ 27 000 milliards de dollars) dépasse les gains macroéconomiques de référence. Pour justifier les valorisations actuelles, il faut postuler que les gagnants de l'IA capteront une part durablement élevée des gains de productivité. À court terme, tant que le pic du cycle d'investissement n'est pas atteint, les bénéfices solides devraient l'emporter sur les craintes de valorisation. Cependant, la volatilité devrait augmenter, car les cours dépendent d'hypothèses optimistes. La demande de protection contre les baisses prend donc de la valeur. Par ailleurs, l'économie non-IA est moins vigoureuse qu'à la fin des années 1990, ce qui pourrait amplifier les corrections si le récit de l'IA faiblit.

marsbitIl y a 33 mins

Goldman Sachs aborde à nouveau l'état actuel de la frénésie de l'IA : "Les bénéfices solides l'emporteront sur les inquiétudes liées à la valorisation" avant que le cycle d'investissement n'atteigne son sommet, la volatilité augmentera encore

marsbitIl y a 33 mins

Le rebond du marché des actions des semi-conducteurs : est-ce la fin d'un ajustement technique ou le début d'une inversion de tendance ?

L'action des semi-conducteurs a rebondi après une forte vente le 23 juin en Corée du Sud, où le Kospi a chuté d'environ 10%. La question centrale est de savoir si ce rebond marque la fin d'un simple ajustement technique ou un début de renversement de tendance. Le cœur de la volatilité réside dans la phase de repricing des actions semi-conductrices après le sur-achat lié à l'IA. Les titres mémoire, comme Samsung, SK Hynix et Micron, ont été poussés à la hausse par l'expansion des infrastructures IA, le HBM (mémoire haute bande passante) étant un composant clé en pénurie. Le rebond observé ressemble davantage à une correction de position qu'à une confirmation de reprise haussière. L'attente de rémunération des actionnaires chez Samsung a aidé, mais le test décisif viendra des résultats trimestriels, notamment ceux de Micron. Ses chiffres et ses prévisions doivent prouver que la dynamique de prix et la visibilité des commandes pour le HBM restent solides, soutenant ainsi la valorisation de toute la chaîne. Si Micron dépasse ses prévisions élevées et maintient des perspectives fortes, le rebond pourrait signaler la poursuite de la tendance. En revanche, si les indications deviennent prudentes, notamment sur l'équilibre offre-demande pour 2027, la correction récente pourrait annoncer un affaiblissement. Pour l'instant, le marché attend la preuve que les fondamentaux justifient encore les valorisations élevées.

marsbitIl y a 1 h

Le rebond du marché des actions des semi-conducteurs : est-ce la fin d'un ajustement technique ou le début d'une inversion de tendance ?

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片