Organisé par: Baoyu
Il s'agit d'un autre interview de 40 minutes avec Peter Steinberger, auteur de ClawdBot/OpenClaw, animée par Peter Yang.
Peter est le fondateur de PSPDFKit, avec près de 20 ans d'expérience en développement iOS. Après que sa société ait reçu un investissement stratégique de 100 millions d'euros de Insight Partners en 2021, il a choisi de prendre sa « retraite ». Aujourd'hui, son projet Clawdbot (maintenant rebaptisé OpenClaw) fait un tabac. Clawbot est un assistant IA qui peut discuter avec vous via WhatsApp, Telegram, iMessage, et qui est connecté en arrière-plan aux diverses applications de votre ordinateur.
Peter décrit Clawbot ainsi :
« C'est comme un ami qui vit dans votre ordinateur, un peu bizarre, mais terriblement intelligent.
Dans cet interview, il partage de nombreux points de vue intéressants : pourquoi les systèmes complexes d'orchestration d'agents (Agent) sont des « générateurs de bouillie (slop) », pourquoi « faire tourner l'IA 24 heures sur 24 » est une métrique de vanité, et pourquoi les langages de programmation n'ont plus d'importance.
Un prototype en une heure, 300 000 lignes de code
Peter Yang lui ce qu'est exactement Clawbot et pourquoi son logo est une langouste.
Peter Steinberger ne répond pas directement à la question de la langouste, mais raconte une histoire. De retour de sa « retraite », il s'est plongé à corps perdu dans la programmation à l'instinct (vibe coding) – c'est-à-dire faire écrire du code par des agents IA. Le problème, c'est que l'agent peut tourner pendant une demi-heure, ou s'arrêter au bout de deux minutes pour vous poser une question. Vous partez manger et à votre retour, vous constatez qu'il est bloqué depuis longtemps, c'est agaçant.
Il voulait quelque chose pour vérifier l'état de son ordinateur depuis son téléphone à tout moment. Mais il n'a rien fait, pensant que c'était une évidence et que les grandes entreprises s'en chargeraient.
« En novembre dernier, personne ne l'avait encore fait, alors je me suis dit 'tant pis, je m'en charge moi-même'. »
La version initiale était extrêmement simple : connecter WhatsApp à Claude Code. Envoyer un message, il appelle l'IA et renvoie le résultat. Cela a pris une heure à mettre en place.
Puis il a « pris vie ». Maintenant, Clawbot compte environ 300 000 lignes de code et supporte presque toutes les plateformes de messagerie principales.
« Je pense que c'est la direction de l'avenir. Chacun aura une IA super puissante qui le suivra tout au long de sa vie. »
Il dit : « Une fois que vous donnez à l'IA l'accès à votre ordinateur, elle peut faire à peu près tout ce que vous pouvez faire. »
Ce matin au Maroc
Peter Yang dit que maintenant, vous n'avez plus besoin de rester assis devant l'ordinateur à le surveiller, il suffit de lui donner des instructions.
Peter Steinberger hoche la tête, mais il veut parler d'autre chose.
Une fois, alors qu'il était au Maroc pour l'anniversaire d'un ami, il s'est rendu compte qu'il utilisait constamment Clawbot. Demander son chemin, des recommandations de restaurants, ce sont des petites choses. Ce qui l'a vraiment surpris, c'est ce matin-là : quelqu'un a tweeté sur Twitter qu'il y avait un bug dans l'une de ses bibliothèques open source.
« J'ai juste pris une photo du tweet et l'ai envoyée sur WhatsApp. »
L'IA a lu le contenu du tweet, a compris qu'il s'agissait d'un rapport de bug. Elle a checkouté le dépôt Git correspondant, a corrigé le problème, a soumis le code, puis a répondu à la personne sur Twitter pour dire que c'était réparé.
« Je me suis dit sur le moment, est-ce que c'est vraiment possible ? »
Une autre fois, encore plus incroyable. Il marchait dans la rue, paresseux pour taper, alors il a envoyé un message vocal. Le problème, c'est qu'il n'avait jamais programmé le support des messages vocaux pour Clawbot.
« J'ai vu qu'il affichait 'en train d'écrire', je me suis dit que c'était foutu. Mais il m'a répondu normalement. »
Il a demandé plus tard à l'IA comment elle avait fait. L'IA a dit : J'ai reçu un fichier sans extension, alors j'ai regardé l'en-tête du fichier et j'ai découvert que c'était du format Ogg Opus. Vous avez ffmpeg sur votre ordinateur, alors je l'ai utilisé pour le convertir en WAV. Ensuite, j'ai cherché whisper.cpp, mais vous ne l'aviez pas installé, mais j'ai trouvé votre clé API OpenAI, alors j'ai utilisé curl pour envoyer l'audio et faire la transcription.
Peter Yang, après avoir écouté, dit : Ces trucs sont vraiment débrouillards, même si c'est un peu effrayant.
« Bien plus puissant que ChatGPT version web, c'est comme ChatGPT libéré de ses entraves. Beaucoup de gens ne réalisent pas que des outils comme Claude Code ne sont pas seulement forts en programmation, ils sont très débrouillards pour n'importe quel problème. »
L'armée d'outils en ligne de commande (CLI)
Peter Yang lui demande comment ces outils d'automatisation ont été construits, s'il les a écrits lui-même ou s'il a fait écrire par l'IA.
Peter Steinberger sourit.
Ces derniers mois, il n'a cessé d'étendre son « armée de CLI ». Qu'est-ce que les agents font le mieux ? Appeler des outils en ligne de commande, car les données d'entraînement en sont pleines.
Il a créé un CLI pour accéder à tous les services Google, y compris l'API Places. Il en a créé un spécialement pour chercher des memes et des GIF, afin que l'IA puisse envoyer des memes en répondant aux messages. Il a même créé un outil pour visualiser le son, voulant faire « expérimenter » la musique à l'IA.
« J'ai aussi piraté l'API de la plateforme de livraison de repas locale, maintenant l'IA peut me dire combien de temps il reste avant que la nourriture n'arrive. Et un autre qui a reverse-engineered l'API de Eight Sleep, pour contrôler la température de mon lit. »
[Note : Eight Sleep est un matelas intelligent qui peut régler la température de la surface du lit, l'API n'est pas officiellement ouverte.]
Peter Yang insiste : Est-ce que ce sont tous des projets que vous avez fait construire par l'IA ?
« Le plus intéressant, c'est qu'avant, chez PSPDFKit, j'ai fait du développement Apple pendant 20 ans, Swift, Objective-C, très spécialisé. Mais à mon retour, j'ai décidé de changer de domaine, parce que j'en avais marre qu'Apple contrôle tout, et que développer des apps Mac avait une audience trop restreinte. »
Le problème, c'est que passer d'une stack technique maîtrisée à une autre est un processus douloureux. Vous comprenez tous les concepts, mais vous ne connaissez pas la syntaxe. Qu'est-ce qu'une prop ? Comment diviser un tableau ? Chaque petit problème nécessite une recherche, on se sent idiot.
« Et puis avec l'IA, tout cela a disparu. Votre pensée systémique, votre capacité d'architecture, votre goût, votre jugement sur les dépendances, ce sont ces choses qui ont une réelle valeur, et elles peuvent maintenant migrer facilement vers n'importe quel domaine. »
Il marque une pause :
« Soudainement, j'ai senti que je pouvais tout construire. Le langage n'a plus d'importance, ce qui compte c'est ma pensée ingénieriale. »
Contrôler le monde réel
Peter Steinberger commence à démontrer sa configuration. La liste des permissions qu'il donne à l'IA est stupéfiante :
Emails, calendrier, tous les fichiers, lumières Philips Hue, enceintes Sonos. Il peut demander à l'IA de le réveiller le matin, en augmentant progressivement le volume. L'IA peut aussi accéder à ses caméras de sécurité.
« Une fois, je lui ai demandé de surveiller s'il y avait des étrangers. Le lendemain matin, elle m'a dit : 'Peter, il y a quelqu'un.' J'ai regardé l'enregistrement, elle avait fait des captures d'écran de mon canapé toute la nuit parce que la qualité de la caméra était mauvaise et le canapé ressemblait à une personne assise. »
Dans son appartement à Vienne, l'IA peut aussi contrôler le système domotique KNX.
« Elle pourrait vraiment me lock out dehors. »
Peter Yang demande : Comment est-ce connecté ?
« Juste en lui parlant. Ces trucs sont très débrouillards, ils trouvent eux-mêmes les API, ils font des recherches Google, ils cherchent les clés dans votre système. »
Les utilisateurs font des choses encore plus folles :
- Quelqu'un lui a fait faire des courses en ligne sur Tesco
- Quelqu'un lui a fait passer des commandes sur Amazon
- Quelqu'un lui a fait répondre automatiquement à tous les messages
- Quelqu'un l'a ajoutée dans un chat de groupe familial comme « membre de la famille »
« Je lui ai demandé de m'aider à check-in sur le site de British Airways. C'est un vrai test de Turing, opérer un navigateur sur le site d'une compagnie aérienne, vous savez à quel point cette interface est anti-humaine. »
La première fois, cela a pris près de 20 minutes, car le système était encore rudimentaire. L'IA devait trouver son passeport dans son Dropbox, extraire les informations, remplir le formulaire, passer la vérification humaine.
« Maintenant, cela ne prend que quelques minutes. Elle peut cliquer sur le bouton de vérification 'Je suis humain' parce qu'elle contrôle un vrai navigateur, son comportement est indistinguable de celui d'un humain. »
80 % des applications vont disparaître
Peter Yang demande : Pour un utilisateur lambda qui vient de le télécharger, quelles sont les utilisations sécuritaires pour débuter ?
Peter Steinberger dit que le parcours est différent pour chacun. Certains, après l'installation, commencent immédiatement à l'utiliser pour écrire une app iOS, d'autres vont directement gérer Cloudflare. Un utilisateur s'est installé la première semaine, l'a installé pour sa famille la deuxième semaine, et a commencé à faire une version entreprise pour sa société la troisième semaine.
« Après avoir installé ça pour un ami non-technique, il a commencé à m'envoyer des pull requests. Il n'avait jamais fait de pull request de sa vie. »
Mais ce qu'il veut vraiment dire, c'est une vision plus large :
« Si vous y réfléchissez, cette chose pourrait remplacer 80 % des apps sur votre téléphone. »
Pourquoi utiliser encore MyFitnessPal pour enregistrer son régime ?
« J'ai un assistant aux ressources illimitées, il sait déjà que j'ai pris une mauvaise décision chez KFC. Je envoie une photo, il la stocke dans la base de données, calcule les calories, me rappelle que je devrais aller à la salle de sport. »
Pourquoi utiliser une app pour régler la température de Eight Sleep ? L'IA a les permissions API, elle règle directement pour vous. Pourquoi utiliser une app de liste de tâches ? L'IA s'en souvient pour vous. Pourquoi utiliser une app pour check-in pour un vol ? L'IA le fait pour vous. Pourquoi utiliser une app de shopping ? L'IA peut recommander, commander, suivre.
« Toute une couche d'applications va lentement disparaître, parce que si elles ont une API, ce ne sont que des services que votre IA appellera. »
Il prédit que 2026 sera l'année où beaucoup de gens commenceront à explorer les assistants IA personnels, et que les grandes entreprises entreront sur le marché.
« Clawbot ne sera pas nécessairement le gagnant final, mais la direction est la bonne. »
Just Talk to It (Parlez-lui simplement)
La conversation se tourne vers la méthodologie de programmation IA. Peter Yang dit avoir écrit un article très populaire intitulé « Just Talk to It » et veut l'entendre développer.
Le point central de Peter Steinberger est : Ne tombez pas dans le « piège des agents » (agentic trap).
« Je vois trop de gens sur Twitter découvrir que les agents sont puissants, puis vouloir les rendre plus puissants, et tomber dans le terrier du lapin. Ils construisent toutes sortes d'outils complexes pour accélérer les flux de travail, mais au final, ils ne font que construire des outils, pas des choses qui ont une réelle valeur. »
Lui-même y est tombé. Au début, il a passé deux mois à construire un tunnel VPN, juste pour accéder au terminal depuis son téléphone. C'était trop bien fait, une fois, alors qu'il était au restaurant avec des amis, il a passé tout son temps à faire du vibe coding sur son téléphone au lieu de participer à la conversation.
« J'ai dû m'arrêter, principalement pour ma santé mentale. »
Slop Town (La ville de la bouillie)
Récemment, ce qui l'a rendu fou, c'est un système d'orchestration appelé Gastown.
« Un orchestrateur super complexe, faisant tourner une dizaine ou une vingtaine d'agents simultanément, qui communiquent entre eux, se divisent le travail. Il y a des observateurs (watcher), des surveillants (overseer), un maire (mayor), des pcats (probablement 'civils' ou 'chats domestiques' ou d'autres rôles de remplissage), je ne sais même pas quoi d'autre. »
Peter Yang : Attends, il y a un maire ?
« Oui, le projet Gastown a un maire. J'appelle ce projet 'Slop Town' (la ville de la bouillie). »
Et le mode RALPH (un mode de boucle à tâche unique 'jetable', où on donne à l'IA une petite tâche, une fois terminée, on jette toute la mémoire contextuelle, tout est réinitialisé, et on boucle jusqu'à la mort)...
« C'est le brûleur de tokens ultime. Vous le faites tourner toute la nuit, et le lendemain matin vous obtenez la bouillie ultime (slop). »
Le cœur du problème est : ces agents n'ont pas encore de goût. Ils sont terriblement intelligents à certains égards, mais si vous ne les guidez pas, si vous ne leur dites pas ce que vous voulez, le résultat est de la bouillie.
« Je ne sais pas comment les autres travaillent, mais quand je commence un projet, je n'ai qu'une idée vague. En construisant, en jouant, en ressentant, ma vision devient progressivement plus claire. J'essaie des choses, certaines ne fonctionnent pas, puis mon idée évolue vers sa forme finale. Mon prochain prompt dépend de l'état actuel que je vois, ressens, pense. »
Si vous essayez de tout écrire dans un cahier des charges en amont, vous ratez cette boucle humaine-machine.
« Je ne sais pas comment on peut faire de bonnes choses sans que le ressenti, le goût n'y participent. »
Quelqu'un sur Twitter se vantait d'une app de notes « entièrement générée par RALPH ». Peter a répondu : Oui, on dirait que c'est généré par RALPH, aucune personne normale ne concevrait ça comme ça.
Peter Yang résume : Beaucoup de gens font tourner l'IA 24 heures sur 24 non pas pour faire une app, mais pour prouver qu'ils peuvent faire tourner l'IA 24 heures sur 24.
« C'est comme une compétition de comparaison sans point de référence. J'ai aussi fait tourner une boucle pendant 26 heures, j'étais très fier sur le moment. Mais c'est une métrique de vanité, sans signification. Pouvoir tout construire ne signifie pas que vous devriez tout construire, ni que ce sera bon. »
Le Plan Mode est un bricolage (Hack)
Peter Yang lui demande comment il gère le contexte. Les conversations longues embrouillent l'IA, faut-il compresser ou résumer manuellement ?
Peter Steinberger dit que c'est « le problème de l'ancien mode ».
« Claude Code a encore ce problème, mais Codex est bien meilleur. Sur le papier, ce n'est peut-être que 30 % de contexte en plus, mais la sensation est comme 2-3 fois plus. Je pense que c'est lié au mécanisme de pensée interne. Maintenant, la plupart de mes développements de fonctionnalités peuvent être faits dans une seule fenêtre de contexte, la discussion et la construction ont lieu simultanément. »
Il n'utilise pas les worktrees, car c'est une « complexité inutile ». Il checkout simplement plusieurs copies du dépôt : clawbot-1, clawbot-2, clawbot-3, clawbot-4, clawbot-5. Il utilise celui qui est libre, teste, pousse sur la branche principale (main), synchronise.
« C'est un peu comme une usine, s'ils sont tous occupés. Mais si vous n'en avez qu'un seul, le temps d'attente est trop long, on ne peut pas entrer dans un état de flux (flow state). »
Peter Yang dit que c'est comme un jeu de stratégie en temps réel, vous avez une équipe qui attaque, vous devez les gérer et les surveiller.
Concernant le plan mode, Peter Steinberger a un point de vue controversé :
« Le plan mode est un bricolage qu'Anthropic a dû ajouter parce que le modèle est trop impulsif, il se précipite pour écrire du code. Si vous utilisez les derniers modèles, comme GPT 5.2, vous dialoguez avec lui. 'Je veux construire cette fonctionnalité, ça devrait être comme ci comme ça, j'aime ce style de design, donnez-moi quelques options, discutons d'abord.' Ensuite, il propose, vous discutez, vous vous mettez d'accord puis vous passez à l'action. »
Il ne tape pas, il parle.
« La plupart du temps, je lui parle. »
Développement piloté par Discord
Peter Yang lui demande quel est son flux de développement pour les nouvelles fonctionnalités. Explorer d'abord le problème ? Faire un plan d'abord ?
Peter Steinberger dit qu'il a fait une chose « probablement la plus folle que j'aie jamais faite » : il a connecté son Clawbot privé à un serveur Discord public, permettant à tout le monde de discuter avec son IA privée, avec sa mémoire privée, en public.
« Ce projet est difficile à décrire avec des mots. Un mélange de Jarvis (l'assistant IA d'Iron Man) et du film Her. Chaque personne à qui je fais une démonstration en personne est super excitée, mais poster des images avec du texte sur Twitter ne marche pas. Alors j'ai pensé, laissez les gens en faire l'expérience eux-mêmes. »
Les utilisateurs posent des questions, rapportent des bugs, suggèrent des demandes sur Discord. Son flux de développement actuel est : faire une capture d'écran d'une conversation Discord, la glisser dans le terminal, dire à l'IA « parlons de ça ».
« Je suis paresseux pour taper. Quelqu'un demande 'est-ce que vous supportez ceci ou cela', je demande à l'IA de lire le code puis d'écrire une FAQ. »
Il a aussi écrit un crawler qui scanne au moins une fois par jour le canal d'aide de Discord, demande à l'IA de résumer les plus gros points de douleur, puis ils les corrigent.
Pas de MCP, pas d'orchestration complexe
Peter Yang demande : Utilisez-vous ces trucs fancy ? Multi-agents, compétences complexes, MCP (Model Context Protocol) etc. ?
« Mes compétences sont surtout des compétences de vie : enregistrer un régime, faire des courses, ce genre de choses. Très peu de programmation, car ce n'est pas nécessaire. Je n'utilise pas MCP, ni aucun de ces trucs. »
Il ne croit pas aux systèmes d'orchestration complexes.
« Je suis dans la boucle, je peux créer un produit qui a meilleure sensation. Peut-être qu'il y a des méthodes plus rapides, mais je suis déjà si rapide que le goulot d'étranglement n'est plus l'IA, je suis principalement limité par ma propre vitesse de pensée, occasionnellement par le temps d'attente de Codex. »
Son co-fondateur de PSPDFKit, un ancien avocat, lui envoie maintenant aussi des PR (pull request).
« L'IA permet à des personnes sans background technique de construire des choses, c'est magique. Je sais que certains sont contre, disent que ce code n'est pas parfait. Mais je considère les pull requests comme des prompt requests (demandes de prompt), elles communiquent une intention. La plupart des gens n'ont pas la même compréhension systémique, ne peuvent pas guider le modèle vers le résultat optimal. Donje préfère obtenir l'intention, et le faire moi-même, ou réécrire basé sur leur PR. »
Il les marque comme co-auteur, mais merge rarement directement le code des autres.
Trouvez votre propre chemin
Peter Yang résume : Donc le point central est, n'utilisez pas de générateur de bouillie, gardez l'humain dans la boucle, car le cerveau et le goût humains sont irremplaçables.
Peter Steinberger ajoute :
« Ou plutôt, trouvez votre propre chemin. Beaucoup de gens me demandent 'comment faites-vous', la réponse est : vous devez explorer par vous-même. Apprendre ces choses prend du temps, nécessite de faire vos propres erreurs. C'est comme apprendre n'importe quoi, sauf que ce domaine change particulièrement vite. »
Clawdbot peut être trouvé sur clawd.bot et GitHub. Clad avec un W, C-L-A-W-D-B-O-T, comme une pince de homard.
(Note : ClawdBot a été renommé OpenClaw)
Peter Yang dit qu'il doit essayer aussi. Il ne veut pas être assis devant l'ordinateur à discuter avec l'IA, il veut lui donner des instructions à tout moment quand il est dehors avec ses enfants.
« Je pense que vous aimerez. » dit Peter Steinberger.
Le point de vue central de Peter Steinberger peut être résumé en deux phrases :
- L'IA est déjà assez puissante pour remplacer 80 % des apps sur votre téléphone
- Mais sans le goût et le jugement humains dans la boucle, la sortie est de la bouillie
Ces deux phrases semblent contradictoires, mais pointent vers la même conclusion : L'IA est un levier, pas un substitut. Elle amplifie ce que vous avez déjà : la pensée systémique, la capacité d'architecture, l'intuition pour les bons produits. Si vous n'avez pas cela, faire tourner autant d'agents en parallèle 24 heures sur 24 ne fera que produire de la bouillie en masse.
Sa pratique elle-même en est la meilleure preuve : un vieux programmeur iOS de 20 ans, qui en quelques mois a construit un projet de 300 000 lignes de code en TypeScript, ne s'est pas appuyé sur l'apprentissage de la syntaxe d'un nouveau langage, mais sur ces choses indépendantes du langage.
« Les langages de programmation n'ont plus d'importance, ce qui compte c'est ma pensée ingénieriale. »


















