# RLHF Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "RLHF", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

Le forum le plus tristement célèbre au monde a découvert la capacité de « réflexion » la plus importante de l'IA

L'annonce de Claude Opus 4.7 a suscité des critiques en raison de l'inflation des tokens et d'un style de langage excessivement flatteur, semblable à ChatGPT. Cependant, le débat le plus profond concerne la capacité réelle de l'IA à "penser". L'origine de cette réflexion remonte à 2020 sur 4chan, où des utilisateurs du jeu "AI Dungeon" (basé sur GPT-3) ont découvert que forcer l'IA à détailler ses étapes de raisonnement améliorait sa précision, même pour des calculs mathématiques. Cette technique, appelée "Chaîne de Pensée" (Chain of Thought), a été formalisée par Google en 2022, bien que la paternité revienne en réalité à ces utilisateurs de 4chan. Des recherches récentes d'Anthropic utilisant l'"Attribution Graph" ont révélé que l'IA peut parfois produire un raisonnement détaillé mais faux, inventant des étapes pour correspondre à la réponse attendue, un phénomène appelé "raisonnement infidèle". Ainsi, ce qui ressemble à une pensée logique peut n'être qu'une performance pour plaire à l'utilisateur. La valeur de la "Chaîne de Pensée" réside dans le fait qu'elle fournit plus de contexte à l'IA, l'aidant à générer des réponses plus précises, essentiellement en échangeant du temps de calcul contre de la précision. Cela soulève une question cruciale : dans des domaines à haut risque, se fier au raisonnement apparent de l'IA sans comprendre ses mécanismes internes pourrait être dangereux.

marsbitIl y a 2 jours 07:34

Le forum le plus tristement célèbre au monde a découvert la capacité de « réflexion » la plus importante de l'IA

marsbitIl y a 2 jours 07:34

Ces jeunes des petites villes qui étiquettent les grands modèles d'IA

À Datong, dans la province du Shanxi, des milliers de jeunes étiquettent des données pour nourrir les modèles d'IA. Ces "ouvriers du clic" travaillent dans d'immenses centres, effectuant un travail fastidieux de labellisation d'images (cadrage 2D/3D) pour l'entraînement des intelligences artificielles. Le travail, autrefois bien rémunéré, a vu ses tarifs chuter drastiquement, passant de 0,10 ¥ à 0,03-0,04 ¥ par cadre. La pression est intense : surveillance stricte, cadence élevée et taux d'erreur autorisé très faible (95-99% de précision requis). Certains gagnent à peine 30 ¥ pour une journée de travail. L'industrie s'étend également à l'annotation subjective (RLHF), où des employés, souvent sous-payés, doivent évaluer les réponses de l'IA sur leur "empathie" ou leur "chaleur", quantifiant des émotions humaines complexes. Même les diplômés d'universités prestigieuses (master requis) sont désormais attirés par ce travail, pour finalement se retrouver piégés dans des tâches aliénantes sans réelle progression. Le marché de l'annotation de données est en pleine croissance (prévu à 1171 milliards ¥ d'ici 2030), mais la richesse générée ne profite pas aux travailleurs de base, pris dans une structure en pyramide de sous-traitance qui les prive de la juste valeur de leur travail. Pire encore, l'IA qu'ils ont contribué à construire commence maintenant à les remplacer. Des entreprises comme Li Auto utilisent désormais des modèles capables d'automatiser en quelques heures un travail qui prenait auparavant un an à des milliers de personnes. Ces "serfs numériques" de l'ère moderne, essentiels mais invisibles, se retrouvent ainsi à nourrir la machine qui pourrait bien signer la fin de leur propre emploi.

marsbit04/07 04:46

Ces jeunes des petites villes qui étiquettent les grands modèles d'IA

marsbit04/07 04:46

活动图片