Aujourd'hui, l'économie des agents n'est plus un concept de science-fiction ; elle apporte non seulement un saut d'efficacité, mais aussi une restructuration et une redistribution des modes d'organisation économique. En particulier, le projet open source OpenClaw, qui a connu un succès mondial, a encore accéléré le passage des grands modèles du laboratoire à une application à grande échelle, et toutes les parties se précipitent pour rejoindre la bataille pour l'accès aux agents.
Alors, quel grand modèle choisir ? Les ressources en tokens seront-elles suffisantes pour un usage à long terme ? Serons-nous dépassés par l'époque si nous ne suivons pas la tendance OpenClaw (Homard) ? Dans cette transformation IA qui évolue à un rythme accéléré, comment les individus doivent-ils se positionner et percer ?
Avec ces questions en tête, le 3 avril, Xujiahui Tech, l'Association de Technologie de Consensus Distribué de Shanghai, PANews et Mankun Law Firm ont co-organisé un événement thématique intitulé "Ne soyez pas 'homard' anxieux".
Dans son discours principal sur "Embrasser la vague imprévisible de l'IA", Li Chenxing, architecte en chef de Conflux Tree-Graph, a déclaré qu'il est actuellement inévitable, à ce stade technologique, de donner plus d'autonomie à l'IA plutôt que de la limiter excessivement avec l'expérience humaine finie. Le problème de "manque de considération" manifesté par l'IA réside essentiellement dans sa difficulté à capturer de manière stable et à mémoriser continuellement les contraintes contextuelles clés dans des scénarios complexes. D'un point de vue structurel technique, l'IA dépend principalement de la mémoire paramétrique, de la mémoire contextuelle et de la mémoire externe, mais ces mécanismes souffrent encore de difficultés de mise à jour, de limitations de la fenêtre contextuelle et d'une efficacité d'appel insuffisante. Par conséquent, à l'avenir, il faudra renforcer la capacité d'appel de la mémoire externe, explorer des mécanismes d'apprentissage continu et de réutilisation de l'expérience, et progressivement accumuler une mémoire expérientielle grâce à des pratiques dans des domaines verticaux, afin d'améliorer l'intégrité et la fiabilité de la prise de décision de l'IA dans des scénarios réels complexes.
Il a également souligné que les progrès actuels de l'IA se manifestent principalement par un renforcement de sa capacité d'analyse autonome et de réflexion. À l'avenir, avec l'amélioration des capacités de mémoire, l'IA devrait franchir des goulots d'étranglement clés et avoir un impact profond sur divers secteurs. Par exemple, le potentiel des systèmes d'identité numérique et de paiement numérique est depuis longtemps entravé par les seuils de développement et d'utilisation, et l'IA pourrait libérer cette valeur en réduisant les coûts de développement et en remplaçant le processus d'apprentissage des utilisateurs par des agents. Globalement, l'IA ne devrait pas être perçue comme une menace pour l'emploi, mais comme un outil clé pour stimuler la productivité et faire naître de nouvelles opportunités. Les individus et les secteurs devraient garder un état d'esprit ouvert et explorer activement les voies d'intégration de l'IA.
Feng Heqing, architecte produit de Tencent Cloud Workbuddy, a indiqué qu'avec l'amélioration significative des capacités des grands modèles, l'IA est passée d'un simple support de développement de base comme la complétion de code à une capacité à accomplir des tâches complexes de manière indépendante. La capacité centrale d'un agent personnalisé se manifeste par le support de tâches en flux complet, la collaboration multi-rôles, un système de mémoire hiérarchique et la décomposition intelligente des tâches basée sur le contexte, tout en réalisant la circulation des données et le traitement parallèle des tâches grâce à la collaboration multi-agents, et en adoptant au niveau de la sécurité des mécanismes de stockage local des données et de confirmation manuelle des opérations critiques pour garantir la sécurité des données. Au niveau applicatif, WorkBuddy couvre déjà des scénarios de bureau typiques tels que la sélection de CV, la génération automatique de PPT, l'analyse de données et l'intégration de rapports hebdomadaires, et peut s'interfacer avec des systèmes comme WeCom (Enterprise WeChat) grâce à des capacités d'intégration de niveau entreprise, permettant une gestion unifiée des tâches. Son architecture technique met l'accent sur une pile entièrement autonome, l'isolement de l'environnement d'exécution et le contrôle des permissions de niveau entreprise, prenant en charge les déploiements locaux et cloud. Sur le plan commercial, il peut cibler les utilisateurs des services R&D d'entreprise et des postes de travail numériques à haute fréquence. Globalement, WorkBuddy vise à améliorer l'efficacité productive des entreprises grâce aux capacités d'agents personnalisés et de collaboration multi-tâches, et à renforcer davantage son adaptabilité et sa capacité de déploiement dans des scénarios d'entreprise complexes grâce à une optimisation continue des capacités de décomposition des tâches et à une extension de l'écosystème.
Teddy, fondateur de Biteye et XHunt, a principalement partagé sur la pratique des employés numériques, l'application des grands modèles et les problèmes de coût, la configuration technique et les risques de sécurité, ainsi que l'optimisation des modes de collaboration. Concernant les pratiques des employés numériques, pour réduire les hallucinations des modèles et le taux d'erreurs dans le code, il est nécessaire d'introduire un agent de révision de niveau supérieur pour réexaminer le code généré par les agents de niveau inférieur, formant ainsi un processus de revue de code obligatoire ; comme les agents produisent encore du code avec certains bogues, on peut réduire les erreurs en normalisant le processus de développement, en renforçant la conception des invites (prompts) et en ajoutant des mécanismes de validation multi-tours. De plus, dans les scénarios opérationnels, il est crucial de contrôler la fréquence des publications et de privilégier une planification unifiée via des API backend pour assurer la stabilité. Dans un environnement de collaboration d'équipe complexe, Discord est généralement plus adapté que Telegram pour la collaboration et la distribution des tâches entre agents, et une attention particulière doit être portée à la consommation de tokens dans la gestion des ressources. Par ailleurs, les systèmes d'agents nécessitent encore un investissement en temps humain pour leur formation, leur réglage et la correction comportementale.
Concernant l'installation et le déploiement d'OpenClaw, Teddy recommande de l'exécuter sur un ordinateur inutilisé ou un Mac Mini, ce qui offre un haut niveau de contrôle autonome. Le code étant open source, il met l'accent sur la protection de la vie privée et peut être intégré à des écosystèmes internationaux, bien que le seuil d'installation et de configuration soit relativement élevé. Pendant l'utilisation, une attention particulière doit être portée aux risques de modification de la configuration des modèles et des canaux pour éviter les anomalies système dues à une configuration incorrecte ; en cas de problème, des outils comme Grok et Gemini peuvent aider au diagnostic. Sur le plan de la sécurité, il faut se prémunir contre les attaques par injection d'invites (prompt injection) et l'injection de compétences (skills) malveillantes. En termes de ressources et de coûts, il est également nécessaire de surveiller le contrôle de la consommation de tokens pour éviter des coûts d'exécution trop élevés.
Dans son discours thématique, Zhao Xuan, avocat associé chez Mankun Law Firm, a partagé trois problèmes juridiques majeurs et leurs solutions pour les entrepreneurs à l'ère de l'IA. Le premier est la "coquille organisationnelle", c'est-à-dire l'"isolement factice" créé par les sociétés unipersonnelles (OPC - One Person Company), qui forment en surface une entité indépendante mais peinent en réalité à isoler véritablement la responsabilité et les risques. Il est nécessaire d'établir une réelle séparation physique et juridique, notamment en introduisant des associés dans la structure, en utilisant une carte de crédit d'entreprise dédiée et en insérant dans les contrats des clauses de non-responsabilité liée à l'IA et des plafonds d'indemnisation. Le deuxième est le problème de la propriété des actifs clés : l'effort n'équivaut pas au droit, il faut prouver sa souveraineté, documenter intégralement le processus de création et conserver des preuves. Le troisième est le risque systémique de "déconnexion" ("pull the plug") dû à l'hégémonie des plateformes, incluant des clauses abusives ("God clauses"), le verrouillage technologique, etc. Il faut séparer les données cœur des services tiers, planifier à l'avance des solutions de rechange et introduire des technologies décentralisées.
Lors de la table ronde "De l'enthousiasme à la lucidité : les vrais besoins et les fausses propositions de l'IA vus par les VC", plusieurs investisseurs ont partagé leurs points de vue sur le stade de développement de l'IA, ses limites d'application et la logique d'investissement.
Cancer, fondateur et associé de Waterdrip Capital, estime que l'IA en est encore à un stade précoce de développement et qu'il faudra encore beaucoup de temps pour qu'elle atteigne véritablement un stade de maturité en termes d'expérience utilisateur et soit largement perçue comme "significative". Il souligne que l'itération technologique de l'IA est extrêmement rapide et qu'il est difficile de construire un avantage concurrentiel durable en s'appuyant uniquement sur la supériorité technologique. Par conséquent, les investissements devraient se concentrer davantage sur les capacités de base irremplaçables, telles que la puissance de calcul (compute) et autres ressources clés. Au niveau applicatif, il donne l'exemple d'outils comme le "Homard" (OpenClaw) qui ne sont pas conviviaux pour les utilisateurs ordinaires de programmation, mais pourraient à l'avenir être mieux adaptés s'ils sont encapsulés dans des applications de scénarios verticaux comme des "médecins de famille", fournissant des conseils professionnels grâce à des données de santé en temps réel. Parallèlement, il pense que l'IA peut remplacer les outils de production d'informations comme les rapports de recherche côté entreprise, mais ne peut pas remplacer le rôle décisionnel final, servant uniquement d'outil d'aide à la décision.
Tang Yi, fondateur et associé d'Enlight Capital, a quant à lui déclaré qu'il est actuellement difficile de trouver des opportunités de non-consensus évidentes dans le domaine de l'investissement en IA, car l'itération rapide des grands modèles pourrait continuer à "aplanir" les avantages des entreprises de la couche application. Il est relativement optimiste quant à la combinaison du Web3 et de l'IA, les considérant comme représentant respectivement les forces productives avancées de leurs domaines. Concernant les outils open source comme OpenClaw, il estime qu'ils équivalent à donner des "mains" et des "pieds" aux grands modèles, renforçant leur capacité à se connecter avec des systèmes externes et des applications sociales, mais qu'ils entraînent également des risques élevés en matière de sécurité et de données, nécessitant donc une configuration complexe et ne convenant pas aux utilisateurs ordinaires. La voie idéale actuelle passe par l'encapsulation pour améliorer la convivialité et l'expérience globale.
Yinghao, investisseur chez First Rule Ventures, partant de l'angle utilisateur et produit, s'intéresse aux opportunités d'application dans les domaines des industries en eaux profondes (secteurs complexes), de la création IA, de l'intégration logicielle-matériel, etc., et évalue le potentiel des projets grâce aux données de comportement et d'interaction des utilisateurs. Il souligne que même sans essayer personnellement tous les nouveaux produits IA émergents, on ne risque pas nécessairement de manquer les tendances clés, car les capacités technologiques sont souvent modularisées rapidement et intégrées dans les systèmes de produits existants.
Plutôt que de se concentrer sur un produit unique, il s'intéresse davantage à trois changements structurels à long terme : premièrement, si l'interaction IA est en train de former un nouveau support de mémoire, permettant aux utilisateurs de déposer leur cognition et leur travail dans un certain système ; deuxièmement, si cette mémoire a la capacité de migrer entre les produits, ou si elle sera progressivement liée à un produit unique, créant ainsi des coûts de migration élevés et un verrouillage de l'expérience ; troisièmement, s'il apparaîtra un nouveau super point d'entrée, devenant le centre névralgique de l'interaction IA et de la distribution du trafic.
Zhao Xuan, avocat associé chez Mankun Law Firm, utilise davantage les outils IA pour le traitement, la recherche et l'analyse des données dans son utilisation des produits IA, et espère voir à l'avenir plus de produits intégrés regroupant ces capacités. Il souligne également que, dans l'entrepreneuriat IA, il est plus important d'éviter les échecs majeurs ponctuels. Il recommande aux entreprises de prêter une attention précoce à la conception juridique clé, telle que la conformité des données, les clauses d'arbitrage, les clauses de non-responsabilité, afin d'isoler au maximum les risques et de se prémunir en cas de risque incontrôlable, évitant ainsi qu'un risque ponctuel ne provoque l'effondrement de l'ensemble de l'entreprise. De plus, il envisage que, à l'avenir, les agents deviendront les principaux sujets économiques exécutifs, responsables de l'acquisition de données, de l'achat d'informations, de l'exécution de stratégies et même des transactions intersystèmes, formant ainsi une activité économique et un système de paiement de machine à machine.
Lors de la table ronde thématique "Les N façons d'ouvrir l'IA, parlons des opportunités pour les innovateurs", plusieurs invités ont exploré les changements apportés par l'IA sous différents angles. Zeno, PDG de Matrix Intelligence, a suggéré que les utilisateurs puissent modifier eux-mêmes des scripts ou des plugins pour interconnecter plusieurs appareils, réalisant une synchronisation de la mémoire et une cohérence d'état multi-appareils, permettant ainsi à l'information de ne pas se perdre et aux tâches de ne pas être interrompues, tout en pouvant ajouter un mécanisme de purification/bilan quotidien pour maintenir la stabilité du système. Comparé à l'utilisation d'outils prêts à l'emploi, une personnalisation approfondie basée sur les autorisations de niveau entreprise ou les capacités de plateforme est plus efficace, plus libre et permet de créer plus facilement des flux de travail conformes aux habitudes personnelles. Pour l'avenir, il pense que l'IA deviendra un point d'entrée unifié : les utilisateurs n'auront besoin d'interagir que par le biais d'un centre nerveux IA pour appeler divers outils et systèmes afin d'accomplir toutes leurs tâches. Avec l'augmentation de l'utilisation, l'IA accumulera continuellement la mémoire, les préférences et les flux de travail de l'utilisateur, créant un effet flywheel de données et de capacités, la rendant de plus en plus compréhensive et efficace. Dans cette tendance, un individu, en configurant un système IA et en payant un coût d'abonnement, pourrait obtenir une augmentation de productivité bien supérieure à celle de la main-d'œuvre traditionnelle, creusant ainsi significativement l'écart d'efficacité entre les personnes.
0xOlivia, co-fondatrice de ClawFirm.dev, a révélé que dans l'utilisation réelle de l'IA, il existe encore des problèmes d'instabilité du système, de fragmentation des capacités de mémoire et d'automatisation, obligeant les utilisateurs à assembler constamment divers outils et scripts comme des Lego. Pour les utilisateurs non experts, l'adoption directe de plateformes commerciales matures, combinée à des applications officielles et à des capacités d'itération continue, est souvent plus stable et plus efficace qu'un système auto-construit hautement fragmenté, tandis que l'introduction de composants open source peut encore renforcer les capacités de traitement des données et de génération de contenu. Elle souligne que la principale limitation actuelle de l'IA ne réside pas dans la capacité des modèles eux-mêmes, mais dans le fait que les modes d'utilisation ingénierique ne correspondent pas encore parfaitement aux capacités des modèles, laissant donc un énorme espace pour l'optimisation et la mise en œuvre. À l'avenir, avec les capacités des grands modèles qui augmentent rapidement, les scénarios d'application de l'IA couvriront progressivement tous les aspects du travail et de la vie, et continueront à fusionner avec différentes formes de produits.
Teddy, fondateur de Biteye/XHunt, en parlant des employés numériques IA, a indiqué qu'il est possible d'intégrer l'IA aux systèmes internes via des API ou des interfaces automatisées, lui faisant assumer des tâches d'exécution concrètes comme la génération de code, la réalisation de demandes, le traitement de contenu, tandis que les humains se concentrent sur la conception du produit et la définition des besoins, conservant ainsi le pouvoir décisionnel clé. Ce mode de collaboration, plus stable et évolutif, peut non seulement améliorer l'efficacité globale du développement, mais aussi réduire significativement le taux d'erreurs, faisant de l'IA une équipe externalisée pouvant être planifiée et gérée, plutôt qu'un simple outil. Il souligne également que tout travail procédural et répétitif a le potentiel d'être transformé ou remplacé par l'IA, et même si les effets initiaux sont instables, ils s'optimiseront continuellement à long terme et amélioreront progressivement la productivité. Dans le domaine des tâches complexes et de la prise de décision managériale, l'IA commence également à montrer des capacités d'assistance significatives et s'inflitre progressivement vers des scénarios métier de plus haut niveau.
Dou Ge, ingénieur senior en développement d'applications IA, a ajouté que la tendance à l'externalisation, l'automatisation et la collaboration outillée de l'IA est largement reconnue. Du point de vue de l'entreprise, il est encore plus nécessaire de considérer attentivement la sécurité, la gestion des autorisations, les mécanismes de collaboration des employés et la sédimentation des actifs. Actuellement, il existe sur le marché divers cadres de développement IA et écosystèmes d'outils, ayant chacun leurs spécificités en termes de légèreté, de faible code, de haute intégration et de contrôle de la sécurité. Les entreprises, lors du choix, doivent trouver un équilibre entre flexibilité et contrôlabilité, et concevoir l'architecture en fonction des scénarios métier réels. Comprendre et mettre en œuvre réellement ces systèmes IA ne peut pas se limiter à la théorie ; cela nécessite un investissement et un coût d'utilisation réels. Il souligne que l'IA remodelle accélère les flux de travail et les structures organisationnelles, et que tant les individus que les entreprises doivent s'adapter rapidement à ce changement, en améliorant leur efficacité par un apprentissage continu et une application outillée, sous peine d'être rapidement distancés par la vitesse d'itération technologique.












