# Génération de Code Articles associés

Le Centre d'actualités HTX fournit les derniers articles et analyses approfondies sur "Génération de Code", couvrant les tendances du marché, les mises à jour des projets, les développements technologiques et les politiques réglementaires dans l'industrie crypto.

L'ingénieur en post-entraînement d'OpenAI, Weng Jiayi, propose une nouvelle hypothèse paradigmatique pour l'IA agentique

L’ingénieur post-entraînement d’OpenAI, Weng Jiayi, explore une nouvelle approche pour l’IA agentique appelée « Heuristic Learning » (HL). Contrairement aux méthodes d’apprentissage par renforcement profond qui améliorent les modèles via l’ajustement des paramètres du réseau neuronal, le HL utilise un agent de codage (comme Codex) pour écrire, exécuter, déboguer et modifier itérativement des stratégies sous forme de code logiciel explicite (règles, contrôleurs, etc.). Dans des expériences sur Atari Breakout, l’agent a développé une stratégie purement Python atteignant le score théorique maximal de 864 points. Testé sur 57 jeux Atari, le HL a montré une efficacité d’échantillonnage initiale élevée, rivalisant avec des algorithmes comme le PPO dans certains jeux, mais révélant des limites dans des tâches complexes nécessitant une planification à long terme (ex: Montezuma’s Revenge). Les avantages potentiels du HL incluent une meilleure interprétabilité, une auditabilité pour les systèmes critiques (robotique, autonome), et une intégration aux flux d’ingénierie logicielle existants pour l’apprentissage continu. Weng Jiayi envisage une synergie future où les réseaux neuronaux gèrent la perception et l’estimation d’état, le HL gère les règles, la sécurité et la mémoire, et un agent LLM supervise les retours et les améliorations. Cette approche suggère qu’avec des agents de codage suffisamment puissants, l’expérience pourrait être encapsulée dans du code maintenable plutôt que dans des poids de modèles opaques.

marsbitIl y a 10 h

L'ingénieur en post-entraînement d'OpenAI, Weng Jiayi, propose une nouvelle hypothèse paradigmatique pour l'IA agentique

marsbitIl y a 10 h

Notes de huit ans d'entrepreneuriat du partenaire IA d'a16z

En 2018, bien avant l'émergence du GPT, l'auteur a fondé Rosebud AI avec la vision de rendre la création aussi simple que de jouer à un jeu. Travaillant initialement avec des modèles comme CycleGAN et StyleGAN, il a exploré le potentiel des médias synthétiques et développé des outils créatifs alimentés par l'IA, tels que TokkingHeads, qui a atteint plus de 2 millions d'utilisateurs. Au cours de ces 8 ans, l'accent a été mis sur la conception d'expériences utilisateur qui masquent les limitations des modèles précoces, en misant sur des solutions "approximatives mais utilisables". La pandémie et les crises bancaires ont rappelé la fragilité de l'écosystème, mais aussi le privilège de pouvoir innover. Avec l'avènement du GPT-4 en 2023, la génération de code est devenue suffisamment mature pour permettre la création des jeux via prompt. L'auteur souligne que les jeux représentent un terrain idéal pour l'IA générative, car ils combinent intuition créative et technicalité, tout en restant en dehors des priorités immédiates des grands labos de recherche. Aujourd’hui, l'auteur rejoint a16z en tant que partenaire pour investir dans la pile de modèles frontière et les infrastructures d'IA. Il passe le flambeau de Rosebud AI à un nouveau CEO, tout en restant convaincu que la prochaine phase de l'IA générative ne dépendra pas seulement des avancées techniques, mais de leur intégration produit, distribution et monétisation dans le monde réel.

marsbit04/26 12:08

Notes de huit ans d'entrepreneuriat du partenaire IA d'a16z

marsbit04/26 12:08

活动图片