GitHub anuncia que utilizará datos de usuarios de Copilot para entrenar modelos de IA a partir del 24 de abril por defecto

marsbitPublicado a 2026-03-26Actualizado a 2026-03-26

Resumen

GitHub ha anunciado que, a partir del 24 de abril de 2026, actualizará su política de uso de datos para entrenar sus modelos de IA con información procedente de las interacciones de los usuarios. Esta medida afectará a los planes Copilot Free, Pro y Pro+, e incluirá datos como entradas y salidas del modelo, fragmentos de código, contexto, estructura de repositorios y registros de conversación. Según GitHub, el objetivo es mejorar la precisión y seguridad de las sugerencias de código. Los usuarios podrán optar por no participar mediante ajustes de privacidad, aunque la opción estará activada por defecto. Los usuarios empresariales, educativos y aquellos bajo acuerdos contractuales específicos quedan excluidos de este cambio. La polémica surge por el uso potencial de código de repositorios privados, desdibujando los límites de lo considerado "privado". Esta estrategia refleja una tendencia en la industria de IA de aprovechar datos de interacciones ante la escasez de datos públicos de alta calidad, marcando una evolución hacia ecosistemas de entrenamiento de IA más cerrados y complejos en cuanto a privacidad y rendimiento.

GitHub anunció recientemente que actualizará su política de repositorios a partir del 24 de abril de 2026, planeando utilizar datos de interacción de usuarios para entrenar sus modelos de IA. Este alcance de recopilación de datos cubre a usuarios de Copilot Free, Pro y Pro+, incluyendo específicamente entradas y salidas del modelo, fragmentos de código, información contextual, estructura de repositorios y registros de interacciones de chat.

Mario Rodriguez, Director de Producto de GitHub, declaró que la introducción de datos de interacción tiene como objetivo mejorar la precisión y seguridad de las sugerencias de código del modelo, y mencionó que las pruebas previas con datos internos de Microsoft ya han aumentado significativamente la tasa de aceptación de sugerencias. Es notable que esta política adopta un mecanismo de "participación predeterminada", lo que requiere que los usuarios afectados accedan manualmente a la configuración de privacidad para desactivar la opción correspondiente si desean excluirse, lo que ha generado un amplio debate en la comunidad de desarrolladores sobre la definición de repositorios privados y la determinación de derechos de datos.

Actualmente, los usuarios de Copilot Business, Enterprise y los usuarios de la versión educativa, sujetos a términos contractuales, no se ven afectados por este cambio por el momento. GitHub enfatizó en su explicación que esta medida se alinea con las prácticas comunes de la industria seguidas por grandes empresas como Anthropic, JetBrains y Microsoft. Sin embargo, incluir código de repositorios privados en conjuntos de entrenamiento desafía esencialmente los límites del concepto tradicional de "privado", incluso si GitHub afirma que su objetivo es optimizar el flujo de trabajo de desarrollo.

Desde una perspectiva de la industria, a medida que los datos de código de dominio público de alta calidad se agotan, los principales fabricantes de IA están acelerando la转向 hacia la explotación de "datos profundos", como datos de interacción privados, para buscar beneficios en el rendimiento del modelo. Este cambio de política no solo marca una mayor inclinación de GitHub desde una plataforma de alojamiento de código abierto hacia un ecosistema cerrado de entrenamiento de IA, sino que también预示 que el campo de herramientas de IA para desarrolladores está entrando en una nueva etapa de博弈 entre el cumplimiento de datos y la evolución de modelos.

Preguntas relacionadas

Q¿A partir de qué fecha GitHub comenzará a utilizar los datos de los usuarios de Copilot para entrenar sus modelos de IA?

AGitHub comenzará a utilizar los datos de los usuarios de Copilot para entrenar sus modelos de IA a partir del 24 de abril de 2026.

Q¿Qué tipos de datos de usuario planea recopilar GitHub para el entrenamiento de su IA?

AGitHub planea recopilar datos de interacción que incluyen entradas y salidas del modelo, fragmentos de código, información contextual, estructura de repositorios y registros de conversaciones de chat.

Q¿Qué usuarios de Copilot NO se verán afectados inicialmente por este cambio de política?

ALos usuarios de Copilot Business, Enterprise y los usuarios de la versión educativa no se verán afectados inicialmente por este cambio de política debido a las restricciones de sus contratos.

Q¿Qué argumenta GitHub como principal justificación para esta recopilación de datos?

AGitHub argumenta que la recopilación de datos de interacción tiene como objetivo mejorar la precisión y seguridad de las sugerencias de código del modelo, citando que las pruebas internas en Microsoft ya han aumentado significativamente la tasa de aceptación de sugerencias.

Q¿Qué preocupación importante ha surgido en la comunidad de desarrolladores respecto a esta nueva política?

ALa comunidad de desarrolladores ha expresado preocupación por la definición de repositorios privados y la propiedad de los datos, ya que la política desafía los límites tradicionales de lo 'privado' al incluir este código en conjuntos de entrenamiento, a pesar de que los usuarios pueden optar por no participar manualmente.

Lecturas Relacionadas

Bajando las expectativas para el próximo ciclo alcista de BTC

**Resumen del artículo: "Bajar las expectativas para el próximo ciclo alcista de BTC" por Alex Xu** El autor, que tenía a Bitcoin como su mayor activo, ha reducido progresivamente su exposición durante el actual ciclo alcista: eliminó el apalancamiento a 70k y redujo su posición de un 100% a un 30% entre 100k-120k. Recientemente, vendió más a 78k-79k, argumentando una revisión a la baja de las expectativas para el próximo máximo alcista. Las razones principales son: 1. **Narrativa de adopción agotada:** El impulso de adopción masiva (de minorista a institucional vía ETFs) parece agotado. El siguiente paso, la adopción por bancos centrales o fondos soberanos importantes, se ve muy difícil a corto plazo. 2. **Coste de oportunidad:** El autor ha identificado otras oportunidades de inversión en empresas atractivas. 3. **Contracción del ecosistema crypto:** La mayoría de modelos de negocio Web3 (SocialFi, GameFi, DePIN) no han funcionado. Solo DeFi genera valor, pero se contrae por la falta de activos nativos de calidad, lo que reduce la base de usuarios y holders de BTC. 4. **Problemas del mayor comprador:** MicroStrategy, el mayor tenedor corporativo, enfrenta un coste de financiación creciente (11.5% para su préstamo perpetuo), lo que podría ralentizar su ritmo de compra y ejercer presión vendedora. 5. **Competencia del oro tokenizado:** El oro tokenizado ha cerrado la brecha en portabilidad y divisibilidad, erosionando la ventaja competitiva de BTC como "oro digital". 6. **Problema de seguridad:** La reducción de la recompensa por minado (halving) amenaza la seguridad de la red, ya que las nuevas fuentes de ingresos por fees (como las inscripciones) no han podido dar solución. Conclusión: El autor mantiene una posición significativa en BTC y espera que suba, pero es menos optimista sobre su potencial alcista. Vender en la reciente subida fue una decisión táctica. Si sus razones para ser bajista se invalidan, estaría abierto a recomprar, aceptando si se equivoca y el precio sube.

marsbitHace 6 hora(s)

Bajando las expectativas para el próximo ciclo alcista de BTC

marsbitHace 6 hora(s)

Trading

Spot
Futuros
活动图片