Dépenser 200 dollars pour acheter des Stars, escroquer des dizaines de millions de dollars aux VC : Toute la chaîne industrielle des fausses Stars GitHub exposée

marsbitPublié le 2026-04-21Dernière mise à jour le 2026-04-21

Résumé

Selon une enquête de l'université Carnegie Mellon, GitHub compte environ 6 millions de "fausses stars" générées par un marché noir bien organisé. Des projets d'IA et de blockchain sont particulièrement touchés. Les étoiles s'achètent à partir de 0,03$ pièce, permettant à des startups d'atteindre le seuil médian des tours de financement (2 850 étoiles pour un seed) pour moins de 200$. Des VC utilisent ces métriques pour filtrer les projets, créant un cercle vicieux où la fraude paye. Bien qu'interdite par GitHub, cette pratique prospère car la plateforme supprime surtout les dépôts frauduleux, mais rarement les comptes responsables.

Auteur : Claude, Deep Tide TechFlow

Introduction de Deep Tide : Une étude par les pairs de l'Université Carnegie Mellon (CMU) a révélé l'existence d'environ 6 millions de fausses Stars sur GitHub, impliquant 18 600 dépôts et 301 000 comptes. Les projets d'IA/LLM constituent la plus grande catégorie non malveillante d'achat de Stars. Sur le marché, le prix d'une Star peut descendre jusqu'à 0,03 dollar, et les données de Redpoint montrent que le nombre médian de Stars pour un projet en phase seed est de 2 850 — il suffit de dépenser moins de 200 dollars pour « acheter » une popularité factice répondant aux critères d'un tour de financement seed.

Le Star GitHub (like) est en train de devenir une arnaque soigneusement emballée.

Selon un rapport d'enquête publié le 13 avril par Awesome Agents, une chaîne industrielle grise mature autour des Stars GitHub fonctionne déjà au grand jour : un article académique a quantifié l'ampleur du problème, une dizaine de sites web vendent ouvertement des Stars, et les sociétés de capital-risque intègrent directement le nombre de Stars dans leur processus de sélection des projets.

L'équipe d'enquête a procédé à une vérification indépendante sur 20 dépôts et a découvert que pour certains projets, 36 % à 76 % des Stars provenaient de comptes sans abonnés, et le ratio fork/star était inférieur à un dixième du niveau de base des projets organiques.

Le soutien académique central de ce rapport provient d'un article évalué par les pairs, co-écrit par la CMU, l'Université d'État de Caroline du Nord et Socket, et publié à l'ICSE 2026 (Conférence internationale sur l'ingénierie logicielle). L'outil de détection StarScout, développé par l'équipe de recherche, a analysé 20 To de métadonnées GitHub (6,7 milliards d'événements, 326 millions de Stars, couvrant la période de 2019 à 2024), marquant finalement environ 6 millions de Stars suspectes, 18 600 dépôts impliqués et environ 301 000 comptes participants.

6 millions de fausses Stars : Croissance explosive en 2024, les projets d'IA lourdement touchés

Les fausses Stars ne sont pas un phénomène nouveau, mais leur ampleur a connu une croissance explosive en 2024. Les données de l'article de la CMU montrent qu'avant 2022, moins de 10 dépôts par mois étaient impliqués dans des activités de fausses Stars. Au pic de juillet 2024, ce nombre est monté en flèche à 3 216 dépôts et 30 779 comptes participants. Jusqu'en juillet 2024, 16,66 % des dépôts ayant plus de 50 Stars avaient participé à des activités de fausses Stars.

La précision de détection de l'équipe de recherche a été indirectement validée par le comportement de GitHub lui-même : 90,42 % des dépôts marqués par StarScout avaient été supprimés, et 57,07 % des comptes marqués avaient été nettoyés.

Parmi les utilisations des fausses Stars, la majorité sert à promouvoir des dépôts de logiciels malveillants de phishing éphémères. Mais dans la catégorie non malveillante, les projets liés à l'IA et aux LLM arrivent en tête, avec un total de 177 000 fausses Stars, dépassant les projets de blockchain/crypto-monnaies. L'article note que « beaucoup de ces projets sont des dépôts d'articles académiques ou des produits de startups liées aux LLM ». Plus crucial encore, 78 dépôts détectés avec des activités de fausses Stars sont apparus sur la page GitHub Trending, prouvant que l'achat de Stars peut effectivement manipuler l'algorithme de recommandation de la plateforme.

Une Star à partir de 3 cents : Un marché d'achat de Stars opérant ouvertement

Il ne s'agit pas de transactions sur le dark web. L'enquête a confirmé qu'au moins une dizaine de sites web vendent ouvertement des GitHub Stars, notamment SocialPlug.io, Buy.fans, Boost-Like.store, etc. Sur Fiverr, on trouve 24 services actifs d'achat de Stars, allant de forfaits de base à 5 dollars à des packs de « promotion organique » à 25 dollars et plus.

La tarification comporte trois niveaux : économique (nouveaux comptes jetables) de 0,03 à 0,10 dollar par Star, moyen de 0,20 à 0,50 dollar, et premium (comptes vieux de plusieurs années) de 0,80 à 0,90 dollar. Les services premium promettent « pas de perte de Stars » et une garantie de recomplétion sous 30 jours. SocialPlug affirme avoir livré 3,1 millions de Stars cumulées, servi plus de 53 000 clients, et propose même une API pour un approvisionnement par lots programmatique.

Les plateformes d'échange de Stars comme GithubStarMate.com et SafeStarExchange.com utilisent quant à elles un système de points pour un échange mutuel, permettant aux utilisateurs d'obtenir des Stars sans dépenser d'argent. Sur GitHub, il existe également au moins 7 outils open source (comme fake-git-history, commit-bot, etc.) spécialement conçus pour falsifier l'historique des contributions. Des comptes GitHub préfabriqués avec 5 ans d'historique de commits et le badge de contributeur Arctic Code Vault se vendent environ 5 000 dollars sur Telegram.

Une étude de l'Université Tsinghua de 2020 a documenté le fonctionnement des groupes de promotion sur QQ et WeChat en Chine : des groupes de plus de 1 020 membres traitent environ 20 tâches de dépôts par jour pour l'achat de Stars, estimant un profit annuel de l'industrie entre 3,4 et 4,4 millions de dollars.

Les VC utilisent les Stars pour filtrer les projets, 200 dollars suffisent pour « atteindre » le seuil du seed

La relation entre les Stars et le financement n'est pas une spéculation, mais est publiquement reconnue par les sociétés de capital-risque elles-mêmes.

Jordan Segall, associé chez Redpoint Ventures, après avoir analysé 80 entreprises d'outils pour développeurs, a constaté que le nombre médian de GitHub Stars lors d'un tour de financement seed était de 2 850, et de 4 980 lors d'un tour Série A. Il a clairement indiqué : « Beaucoup de VC编写 (rédigent) des crawlers internes pour trouver des projets GitHub avec une croissance rapide des Stars, les Stars sont la métrique qu'ils surveillent le plus souvent. »

Ces chiffres donnent aux startups une liste de courses précise. En utilisant le calcul des Stars bon marché, il suffit de dépenser 85 à 285 dollars pour fabriquer 2 850 Stars et atteindre la médiane du seed ; dépenser 990 à 4 500 dollars permet d'atteindre le seuil de la Série A. Comparé à l'enveloppe typique d'un tour seed de 1 à 10 millions de dollars, le ratio rendement/investissement se situe entre 3 500 et 117 000.

L'indice ROSS (classement des startups open source) publié trimestriellement par Runa Capital amplifie encore cette incitation. Selon TechCrunch, 68 % des entreprises classées dans l'indice ROSS ont obtenu un investissement en phase seed, le total des financements suivis s'élevant à 169 millions de dollars. L'analyse indépendante de l'enquête a révélé que Union Labs, classé premier de l'indice ROSS au Q2 2025 (croissance des Stars de 54,2 fois, total de 74 300 Stars), présentait de sérieux soupçons d'achat de Stars : 32,7 % des Stars provenaient de comptes sans dépôt, 52 % de comptes sans abonnés, et StarScout a marqué 47,4 % de ses Stars comme suspectes. Un classement sectorial largement cité par les VC, et le projet en tête a près de la moitié de ses Stars suspectées d'être fausses.

Des cas concrets viennent étayer la chaîne de conversion des Stars vers le financement : Lovable (anciennement GPT Engineer) a obtenu 7,5 millions de dollars en pre-seed avec 50 000+ Stars, une valorisation de 1,8 milliard de dollars en Série A ; Browser-use a obtenu 17 millions de dollars en seed après avoir atteint 50 000 Stars en trois mois ; Pangolin est entré à Y Combinator avec 1 000 Stars et a bouclé un tour de financement seed de 4,7 millions de dollars en huit mois.

Asymétrie de l'application chez GitHub : Suppression des dépôts mais conservation des comptes

La politique d'utilisation acceptable de GitHub interdit explicitement les « interactions fausses », la « manipulation du classement » et la création d'un marché secondaire pour les fausses Stars, interdisant même spécifiquement l'achat de Stars incité par des « airdrops de crypto-monnaies ».

Mais l'application est passive et asymétrique. GitHub a supprimé 90,42 % des dépôts marqués par StarScout, mais n'a nettoyé que 57,07 % des comptes exécutants. La « main-d'œuvre » de l'industrie des fausses Stars est largement intacte. Après la publication du rapport d'enquête de Dagster en 2023, les comptes de fausses Stars concernés ont été supprimés sous 48 heures — mais c'était une réaction suite à une exposition publique, et non le résultat d'une détection proactive.

L'équipe de recherche de la CMU a recommandé à GitHub d'adopter une métrique de popularité pondérée basée sur la centralité du réseau pour remplacer le simple décompte de Stars, anéantissant structurellement l'économie des fausses Stars. GitHub ne l'a pas encore mis en œuvre.

Cela forme une boucle auto-renforçante : Les VC utilisent les Stars comme signal de filtrage → Les startups achètent des Stars → Les VC voient une popularité factice → Plus de VC adoptent le suivi des Stars → Plus de startups achètent des Stars. Les chiffres de référence publiés par Redpoint (2 850 pour le seed, 4 980 pour la Série A) équivalent à donner aux startups une liste de courses tarifée.

Comme l'a dit un commentateur dans le rapport d'enquête : « Le nombre de Stars peut être falsifié, mais une correction de bug qui fait gagner un week-end à quelqu'un ne peut pas l'être. »

Questions liées

QCombien d'étoiles (Stars) factices ont été identifiées sur GitHub selon l'étude de l'université Carnegie Mellon ?

AEnviron 6 millions d'étoiles factices ont été identifiées, impliquant 1,86 million de dépôts et 301 000 comptes.

QQuelle est la catégorie de projets la plus touchée par les étoiles factices à des fins non malveillantes ?

ALes projets d'IA et de LLM (Large Language Models) sont la catégorie la plus touchée, avec 177 000 étoiles factices, dépassant même les projets de blockchain et de cryptomonnaies.

QQuel est le prix le plus bas pour l'achat d'une étoile GitHub factice sur le marché ?

ALe prix le plus bas pour une étoile factice est de 0,03 dollar, proposé dans le segment le moins cher utilisant des comptes nouveaux et jetables.

QCombien coûterait approximativement à une startup pour atteindre le nombre médian d'étoiles requis pour un tour de financement de type seed ?

AIl coûterait entre 85 et 285 dollars pour acheter environ 2 850 étoiles, ce qui correspond au nombre médian observé pour les tours de financement seed.

QComment GitHub a-t-il réagi face aux comptes et dépôts impliqués dans les étoiles factices selon l'étude ?

AGitHub a supprimé 90,42 % des dépôts signalés, mais seulement 57,07 % des comptes utilisés pour générer ces étoiles factices ont été nettoyés, montrant une application asymétrique des règles.

Lectures associées

Casper Lance une Boîte à Outils IA pour Agents Autonomes et Constructeurs

La Casper Association a lancé la Casper AI Toolkit, l'offre IA la plus complète sur une blockchain de Layer 1. Cette boîte à outils permet aux agents IA d'effectuer deux tâches principales : réaliser des transactions autonomes en tant qu'acteurs économiques, et créer, tester et déployer de nouvelles applications sans assistance humaine. Pour les transactions, le protocole x402 intègre le paiement directement dans la requête, permettant des micropaiements HTTP instantanés sans comptes de facturation ni intervention humaine. Les agents peuvent également interagir directement avec la blockchain via le Model Context Protocol (MCP) pour interroger des soldes ou soumettre des transactions. En tant que développeurs, les agents IA peuvent utiliser le cadre de travail Odra pour concevoir et déployer des contrats intelligents de manière autonome, un processus soutenu par le package CSPR.build Agent Skills. Ces composants forment un système cohérent où les agents peuvent à la fois construire des services et payer pour les utiliser, formant ainsi les bases d'une "économie machine". La prochaine étape, l'abstraction de compte, vise à donner aux agents leurs propres identités on-chain. Pour encourager le développement, la Casper Association organise un "Buildathon" avec 150 000 $ de prix et une utilisation gratuite parrainée du facilitateur x402 pour les équipes participantes.

TheNewsCryptoIl y a 12 mins

Casper Lance une Boîte à Outils IA pour Agents Autonomes et Constructeurs

TheNewsCryptoIl y a 12 mins

SpaceX, OpenAI, Anthropic : Les trois géants de l'IA dans la dernière ligne droite vers l'introduction en Bourse. Sur lequel faut-il miser ?

Les plus grandes introductions en bourse de l'histoire, SpaceX, OpenAI et Anthropic, se préparent à lever jusqu'à 1800 milliards de dollars, dépassant le total de la bulle internet. Cette ruée soudaine vers le marché public s'explique par l'énorme appétit en dépenses d'infrastructure pour l'IA (centres de données, GPU, électricité), que les flux de trésorerie actuels ne peuvent plus financer. SpaceX, avec son modèle commercial non éprouvé de centres de données spatiaux, redéfinit les règles d'entrée dans les indices pour attirer massivement les fonds de retraite passifs. Anthropic se distingue par une croissance explosive de ses revenus récurrents (450 milliards de dollars annualisés) et une profitabilité imminente, tirée par son adoption dans les grandes entreprises. OpenAI, comme Google qui lève 800 milliards de dollars séparément, a un besoin urgent de capitaux pour construire son infrastructure. Malgré les montants vertigineux et les ajustements de règles, les animateurs restent globalement optimistes. Ils estiment que ces investissements construisent la base physique essentielle de la prochaine ère technologique. La demande réelle dépasse l'offre de capacités de calcul, et les contraintes physiques (production de puces, construction) limitent les risques de bulle purement financière. Les trois sociétés représentent des paris à long terme sur les fondations de l'avenir.

marsbitIl y a 1 h

SpaceX, OpenAI, Anthropic : Les trois géants de l'IA dans la dernière ligne droite vers l'introduction en Bourse. Sur lequel faut-il miser ?

marsbitIl y a 1 h

« Vieilles actions » devenues « nouvelles valeurs prisées » : de Dell à Nokia, comment l'IA réévalue les anciennes infrastructures ?

Il y a un an, des entreprises comme Dell, Nokia, Cisco, Corning ou Western Digital n'étaient pas considérées comme des acteurs clés de l'IA, souvent perçues comme des valeurs à croissance lente. Aujourd'hui, leur performance boursière relance le débat. Cette réévaluation s'explique par une transition cruciale : l'IA passe de la théorie à la construction d'infrastructures physiques. Le marché identifie désormais la valeur des actifs historiques de ces entreprises—leurs chaînes d'approvisionnement, leur expérience de livraison et leur base client—dans le déploiement à grande échelle des data centers IA. Il ne s'agit pas d'une simple mode, mais d'une réponse aux besoins concrets de l'ingénierie système de l'IA. Trois catégories d'entreprises sont principalement revalorisées : 1. **Serveurs et intégration système** (Dell, HPE) : Leur force réside dans l'intégration des GPU dans des systèmes complets (serveurs, refroidissement, alimentation) pour les clients. 2. **Réseau et connectivité** (Corning, Nokia, Cisco) : L'IA à grande échelle dépend d'interconnexions à haut débit dans et entre les data centers, ainsi que des réseaux télécoms pour l'IA en périphérie. 3. **Stockage** (Western Digital, Seagate) : L'explosion des données d'entraînement, des journaux et des archives froides de l'IA génère une demande robuste pour des disques durs haute capacité. Pour une réévaluation durable, trois critères sont essentiels : la concrétisation des commandes et revenus liés à l'IA, la révision à la hausse des prévisions financières, et une amélioration de la qualité des marges bénéficiaires. En résumé, l'IA ne rajeunit pas ces "villes valeurs", mais leur redonne de la pertinence en ayant à nouveau besoin des infrastructures qu'elles maîtrisent depuis des décennies. La réévaluation profitera surtout à celles qui transforment réellement la demande d'IA en revenus et profits durables.

marsbitIl y a 1 h

« Vieilles actions » devenues « nouvelles valeurs prisées » : de Dell à Nokia, comment l'IA réévalue les anciennes infrastructures ?

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片