Par | Xiang Xianzhi
Avant-hier soir, Moon Dark Side a lancé Kimi K2.6 et a ajusté le prix d'entrée de l'API de 0,60 $ à 0,95 $ par million de tokens.
Une augmentation de 58 %. C'est la première hausse de prix depuis le lancement de la série K2.
Mais il semble que personne ne prête attention à cela.
Il y a quatre mois, dans une lettre interne du dernier jour de 2025, Yang Zhilin a écrit que Moon Dark Side « n'était pas pressée à court terme pour une IPO ». À cette époque, les prospectus de Zhipu et MiniMax avaient déjà été déposés à la bourse de Hong Kong, ce qui était clairement une distinction délibérée de position.
Il a également écrit dans cette lettre que les réserves de trésorerie de l'entreprise dépassaient 1,4 milliard de dollars, et que le tour de financement série C de 500 millions de dollars était sursouscrit – sous-entendant que le potentiel du marché primaire n'était pas encore pleinement exploité, et que le marché secondaire pouvait attendre.
Trois mois plus tard, Bloomberg a rapporté qu'il avait commencé à prendre contact avec China International Capital Corporation (CICC) et Goldman Sachs. Trois semaines plus tard, K2.6 était lancé.
Une personne qui n'aime pas « se presser » a fait en quatre mois ce qu'elle avait dit auparavant qu'elle ne ferait pas.
K2.6 ne sera certainement pas la dernière publication de produit de Moon Dark Side avant son introduction en bourse. Mais cette version est la première roadshow de Yang Zhilin après que Moon Dark Side a planifié son entrée en bourse.
Kimi n'a jamais publié une version de modèle de cette manière
Kimi avait une routine fixe pour publier des modèles par le passé.
Publication de rapports techniques, open source des poids, classement sur HuggingFace, puis attente de l'examen de la communauté technique. K1.5 établissait une méthodologie de raisonnement face à o1, avec plus de détails techniques que de chiffres de benchmark ; K2 Thinking jetait directement les poids sur HuggingFace, laissant les développeurs exécuter eux-mêmes les tests. Ces actions étaient destinées aux développeurs et chercheurs.
Le discours était également celui de la communauté technique : quel problème avons-nous résolu, pourquoi notre méthode est-elle meilleure, bienvenue pour la reproduction.
Les actions de K2.6 sont un peu différentes.
Parlons d'abord de la hausse des prix. En RMB, le prix d'entrée de K2.6 par million de tokens est de 6,5 yuans (cache non atteint), contre 4 yuans pour K2.5. Le prix de sortie est passé de 21 yuans à 27 yuans. Le prix en cas de succès du cache est de 1,1 yuan.
Il s'agit d'une augmentation de prix structurelle. En surface, tous les niveaux augmentent, mais la hausse est la plus faible pour le niveau de succès du cache – passant de 0,7 yuan à 1,1 yuan, soit 0,16 $ US par million de tokens en dollars.
Ce 0,16 $ est la clé pour comprendre cette hausse de prix.
Pour les utilisateurs enterprise qui utilisent le même prompt système longtemps : assistants de code, frameworks d'orchestration d'agents, service client intelligent, leur préfixe est hautement réutilisable, et le taux de succès du cache peut atteindre 75% à 83%. Moon Dark Side a réservé un prix presque stable pour ces clients.
Pour les clients occasionnels qui l'utilisent une fois, avec un prompt différent à chaque fois, cette hausse de prix leur est pleinement appliquée.
C'est une augmentation de prix amicale pour les « entreprises déjà liées à Kimi », et une augmentation de prix hostile pour les « clients occasionnels qui comparent encore les prix ». Les premiers sont les « clients enterprise verrouillés » dans l'histoire de l'introduction en bourse, les seconds sont les « utilisateurs de la longue traîne » qui n'apparaîtront pas sur le PPT de roadshow. Moon Dark Side sait très bien qui sont ses actifs de valorisation.
La structure de puissance de calcul de l'ère des Agents est différente de celle de l'ère de la conversation. Les modèles de conversation sont des allers-retours de quelques dizaines de tokens, les Agents sont des milliers d'appels d'outils et une consommation de centaines de milliers de tokens. Dans les cas d'usage officiels de K2.6 – déploiement local sur Mac du modèle Qwen3.5 appelant des outils plus de 4000 fois, pendant 12 heures, reconstruction du moteur de matching open source exchange-core en 13 heures et 1000 appels d'outils, plus extrême encore, 5 jours de fonctionnement autonome de surveillance d'alertes, réponse aux incidents – la consommation de tokens par tâche est des centaines voire des milliers de fois supérieure à celle des scénarios de conversation de l'ère K2.5.
Bien sûr, ces cas d'usage servent à illustrer les capacités de raisonnement long, mais ajoutés à ce cluster de 300 agents de K2.6, la consommation de tokens doit être stupéfiante.
Avec l'ancien prix de 0,60 $, cette tâche d'Agent pourrait être déficitaire par appel. À 0,95 $, cela couvre tout juste le coût de l'inférence.
Donc la hausse de prix n'est pas de la confiance, c'est une nécessité. Moon Dark Side a levé cumulativement 2,5 milliards de dollars, avec 1,4 milliard de dollars de réserve de trésorerie entre les tours C et C+, mais si la prochaine génération K3 est vraiment à l'échelle de 3-4 billions de paramètres, un seul cycle de pré-entraînement pourrait en consommer la moitié.
Sans augmentation des prix, les données de marge brute des derniers trimestres avant l'IPO seraient mauvaises. Le prospectus doit divulguer la marge brute.
Cette chose aurait pu être expliquée franchement – l'ère des Agents nécessite un nouveau modèle de tarification. Mais Moon Dark Side ne l'a pas fait. Parce que les utilisateurs grand public viennent juste de l'ère gratuite de K2 Thinking, et leur dire maintenant « j'ai augmenté mes prix » n'est pas une bonne histoire produit.
C'est une histoire pour un autre public – Kimi a déjà un portefeuille de clients enterprise qui ne peuvent plus s'en passer, et ils l'utiliseront même si c'est plus cher. (Comme moi-même)
La deuxième chose est le benchmarking. Les références officielles choisies par K2.6 sont GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro. Trois sont des flagships de la génération précédente.
La même semaine, Anthropic a sorti Claude Mythos, et Opus 4.7 venait juste de sortir – deux sont plus performants d'une génération qu'Opus 4.6. K2.6 ne les a pas pris comme référence.
C'est en fait un choix actif. Se comparer à Mythos place K2.6 en position de « suiveur » ; se comparer à Opus 4.6 place K2.6 en « première ligue ». Une valorisation de 18 milliards de dollars nécessite la seconde.
Kimi ne faisait pas vraiment ce genre de chose auparavant. Lors du lancement de K2 Thinking, les benchmarks complets étaient exécutés officiellement, avec de bons et de mauvais résultats, tous publiés pour que les développeurs jugent par eux-mêmes. C'était la façon de faire de la communauté technique – la communauté comprend où vous êtes fort, où vous êtes faible, et accepte un modèle avec des faiblesses évidentes mais une voie claire.
Un PPT de roadshow, non. Un PPT de roadshow a besoin d'une conclusion qu'un gestionnaire de fonds peut comprendre en 30 secondes : « égal ou supérieur aux modèles propriétaires internationaux de premier plan ». Cette phrase est tirée textuellement du blog officiel de K2.6.
La troisième chose est le cluster d'Agents et la double voie open source. K2.6 a amélioré une chose appelée Claw Groups – un écosystème hétérogène d'Agents, où différents appareils, différents modèles, différentes chaînes d'outils d'Agents fonctionnent dans un espace de collaboration, avec K2.6 comme ordonnanceur. 300 sous-agents en parallèle, 4000 étapes de collaboration, 5 jours de fonctionnement autonome.
Ces chiffres sont écrits pour les clients enterprise. Pas pour les développeurs. Pour un développeur, « 300 agents en parallèle » n'a pas de sens pratique – il n'exécutera pas 300 agents dans un projet local. Cette configuration n'a de sens que pour un type de client : les grandes entreprises qui ont besoin d'automatiser l'ensemble de leur processus opérationnel avec une matrice d'agents.
L'histoire ciblée est celle de Salesforce, pas celle de HuggingFace.
Simultanément, K2.6 est entièrement open source. Yang Zhilin a déclaré le 26 mars lors du forum Zhongguancun que l'open source serait une victoire absolue.
Open source + cluster d'agents enterprise, c'est une position entre DeepSeek et Anthropic, moitié-moitié des deux modèles. Cela semble être une bonne histoire. Mais occuper les deux extrémités signifie devoir prouver les deux.
Le marché des capitaux ne se soucie pas vraiment que ces questions aient une réponse. Il exige seulement que vous ayez une histoire pour chaque ligne.
La hausse des prix, le benchmarking, le cluster d'agents – ces trois choses réunies ont un point commun anormal. Aucune n'est pour la communauté technique.
La logique sous-jacente de la publication de modèles par Kimi par le passé était – si les développeurs m'aiment, les clients enterprise suivront tôt ou tard, et le marché des capitaux suivra encore plus tôt. Cette approche a un nom, la sincérité technique.
K2.6 n'attend plus. La hausse des prix est une déclaration directe du pouvoir de fixation des prix B2B, le benchmarking avec GPT-5.4 est un positionnement anticipé de la valorisation, le cluster d'agents et Claw Groups sont la vitrine de l'histoire des services enterprise.
Chaque chose correspond à une question sur le PPT de roadshow : quelle est votre capacité de commercialisation ? Quelle est votre position de référence ? Quelle est votre barrière B2B ?
La compression de Preview à GA en 8 jours suit également cette logique. Les versions précédentes de la série K2 passaient par une période d'aperçu de 2-3 mois, laissant à la communauté le temps de tester, de feedback, et d'itérer suffisamment. K2.6 ne s'est pas laissé cet espace. Ce n'est pas que la technologie a mûri plus vite, c'est que la fenêtre d'opportunité n'attend pas.
Une IPO au second semestre 2026, selon le processus de la bourse de Hong Kong, nécessite 4 à 6 mois pour le dépôt du dossier, les questions, l'audition, la roadshow, la fixation du prix, la période de réflexion. Lancer la roadshow en septembre signifie devoir préparer le produit en avril.
Ne pas publier la GA en avril, et il n'y aura plus de fenêtre ensuite.
K3 est le véritable clou du spectacle
Mais K2.6 n'est pas non plus la carte la plus forte que Moon Dark Side puisse sortir.
Il y a une phrase très sobre dans le blog officiel – K2.6 est la « piste d'atterrissage préparée pour K3 ».
Codage long de 12 heures, cluster de 300 agents, compresseur de contexte – ce n'est pas la forme finale de la série K2, ce sont les infrastructures d'exécution qu'un plus grand modèle de base peut supporter. Moon Dark Side ne dépensera pas d'énergie pour faire fonctionner ces choses, à moins d'être certain qu'un modèle plus grand va consommer ces capacités.
Reddit avait fait fuiter plus tôt des informations sur K3, visant une échelle de paramètres de 3-4 billions. Comparé à l'échelle du billion de la série K2, c'est un saut de base.
Si K3 peut sortir pendant la fenêtre de roadshow – ce sera la véritable copie à rendre. La piste préparée par K2.6, K3 décolle.
La question est de savoir s'il peut être prêt à temps. Combien de temps faut-il pour entraîner un modèle de 3-4 billions de paramètres ? GPT-5 et Claude Opus 4.6 ont tous deux un cycle de pré-entraînement d'environ 6-9 mois, plus quelques mois pour l'entraînement postérieur et l'évaluation de sécurité. La puissance de calcul existante de Moon Dark Side – selon la coopération avec Alibaba Cloud et les réserves de trésorerie actuelles – peut-elle comprimer ce cycle à 5-6 mois ?
Ce pari est placé sur K2.6.
Huit jours de Preview à GA, le cluster d'agents étendu d'un coup de 100 à 300, l'exécution longue étirée de quelques centaines d'étapes à 4000 – chaque action comprime le temps, fait de la place pour la possibilité de K3.
Si K3 peut sortir avant août, septembre – ce sera le morceau final de la roadshow.
S'il n'est pas prêt à temps – K3 deviendra un « modèle qui ne peut sortir qu'après l'introduction en bourse », et K2.6 devra porter seul tout le récit de valorisation.
Moon Dark Side parie que c'est possible.
Sur quoi est ancrée la valorisation de 18 milliards de dollars
Revenons à la valorisation.
Il y a trois mois, Moon Dark Side était valorisée à 4,3 milliards de dollars, il y a deux mois à 5,5 milliards de dollars, maintenant à 18 milliards de dollars.
Ce n'est pas que Moon Dark Side est devenue quatre fois plus forte en trois mois. C'est que Zhipu et MiniMax ont augmenté de 4 fois après leur introduction en bourse, poussant le plafond de toute la piste. La capitalisation boursière de Zhipu à Hong Kong est de 305 milliards de HKD, celle de MiniMax de 309,2 milliards de HKD – les deux dépassent le point culminant historique de SenseTime.
La logique de valorisation de ces deux sociétés n'est pas « ce que la prochaine génération de technologie peut faire », c'est « dans le bassin de la bourse de Hong Kong, à quel prix les actifs IA peuvent-ils être valorisés ».
La valorisation de 18 milliards de dollars de Moon Dark Side s'ancre sur la même chose. Elle ne prouve plus qu'elle est la société d'IA chinoise la plus forte, elle prouve qu'elle est une société d'IA chinoise qui peut être valorisée.
Toutes les actions de K2.6 – hausse des prix, benchmarking, cluster d'agents, double voie open source – répondent à cette proposition.
Mais il y a une chose que K2.6 n'a pas encore prouvée. Les utilisateurs grand public de Kimi sont-ils prêts à payer pour K2.6 après la hausse de prix ? Les abonnés payants vont-ils migrer vers DeepSeek ou MiniMax ? Parmi les clients enterprise, combien exécutent vraiment Claw Groups, combien ont juste signé un POC ?
Ces chiffres sont ceux que les investisseurs demanderont certainement pendant la roadshow. K2.6 ne peut que présenter le produit pour l'instant. Sa transformation en chiffres dépend des trois prochains mois.
Lors de son introduction en bourse, Zhipu a présenté un prospectus où la profitabilité n'était pas encore positive, MiniMax aussi. Les investisseurs ont accepté cette histoire parce qu'à cette époque le grand récit des « actifs IA chinois » venait juste de s'ouvrir. Moon Dark Side arrive avec six mois de retard. Pour la même question, Zhipu MiniMax peut dire « nous validons », Moon Dark Side doit dire « nous monétisons ».
Cette pression repose entièrement sur les trois mois entre K2.6 et K3.
Revenons donc à la question initiale – K2.6 est-elle la dernière roadshow de Moon Dark Side avant son introduction en bourse ?
Non.
Si K3 atteint la fenêtre de roadshow, K3 sera le véritable clou du spectacle. K2.6 n'est que la piste préparée pour lui. Si K3 rate la fenêtre de roadshow, K2.6 devra porter tout le récit de l'introduction en bourse. Alors ce sera la première que Yang Zhilin a été forcé de commencer en avance.
Aucun de ces résultats n'était ce que Yang Zhilin voulait il y a quatre mois.
Mais tout ce qui s'est passé durant ces quatre mois – l'introduction en bourse de Zhipu MiniMax, le plafond de valorisation poussé, la fenêtre d'opportunité comprimée – a forcé une personne qui n'aime pas « se presser » à devoir se presser.
Quand K3 sortira, ce sera la deuxième.








