GitHub anuncia que utilizará datos de usuarios de Copilot para entrenar modelos de IA a partir del 24 de abril por defecto

marsbitPublicado a 2026-03-26Actualizado a 2026-03-26

Resumen

GitHub ha anunciado que, a partir del 24 de abril de 2026, actualizará su política de uso de datos para entrenar sus modelos de IA con información procedente de las interacciones de los usuarios. Esta medida afectará a los planes Copilot Free, Pro y Pro+, e incluirá datos como entradas y salidas del modelo, fragmentos de código, contexto, estructura de repositorios y registros de conversación. Según GitHub, el objetivo es mejorar la precisión y seguridad de las sugerencias de código. Los usuarios podrán optar por no participar mediante ajustes de privacidad, aunque la opción estará activada por defecto. Los usuarios empresariales, educativos y aquellos bajo acuerdos contractuales específicos quedan excluidos de este cambio. La polémica surge por el uso potencial de código de repositorios privados, desdibujando los límites de lo considerado "privado". Esta estrategia refleja una tendencia en la industria de IA de aprovechar datos de interacciones ante la escasez de datos públicos de alta calidad, marcando una evolución hacia ecosistemas de entrenamiento de IA más cerrados y complejos en cuanto a privacidad y rendimiento.

GitHub anunció recientemente que actualizará su política de repositorios a partir del 24 de abril de 2026, planeando utilizar datos de interacción de usuarios para entrenar sus modelos de IA. Este alcance de recopilación de datos cubre a usuarios de Copilot Free, Pro y Pro+, incluyendo específicamente entradas y salidas del modelo, fragmentos de código, información contextual, estructura de repositorios y registros de interacciones de chat.

Mario Rodriguez, Director de Producto de GitHub, declaró que la introducción de datos de interacción tiene como objetivo mejorar la precisión y seguridad de las sugerencias de código del modelo, y mencionó que las pruebas previas con datos internos de Microsoft ya han aumentado significativamente la tasa de aceptación de sugerencias. Es notable que esta política adopta un mecanismo de "participación predeterminada", lo que requiere que los usuarios afectados accedan manualmente a la configuración de privacidad para desactivar la opción correspondiente si desean excluirse, lo que ha generado un amplio debate en la comunidad de desarrolladores sobre la definición de repositorios privados y la determinación de derechos de datos.

Actualmente, los usuarios de Copilot Business, Enterprise y los usuarios de la versión educativa, sujetos a términos contractuales, no se ven afectados por este cambio por el momento. GitHub enfatizó en su explicación que esta medida se alinea con las prácticas comunes de la industria seguidas por grandes empresas como Anthropic, JetBrains y Microsoft. Sin embargo, incluir código de repositorios privados en conjuntos de entrenamiento desafía esencialmente los límites del concepto tradicional de "privado", incluso si GitHub afirma que su objetivo es optimizar el flujo de trabajo de desarrollo.

Desde una perspectiva de la industria, a medida que los datos de código de dominio público de alta calidad se agotan, los principales fabricantes de IA están acelerando la转向 hacia la explotación de "datos profundos", como datos de interacción privados, para buscar beneficios en el rendimiento del modelo. Este cambio de política no solo marca una mayor inclinación de GitHub desde una plataforma de alojamiento de código abierto hacia un ecosistema cerrado de entrenamiento de IA, sino que también预示 que el campo de herramientas de IA para desarrolladores está entrando en una nueva etapa de博弈 entre el cumplimiento de datos y la evolución de modelos.

Preguntas relacionadas

Q¿A partir de qué fecha GitHub comenzará a utilizar los datos de los usuarios de Copilot para entrenar sus modelos de IA?

AGitHub comenzará a utilizar los datos de los usuarios de Copilot para entrenar sus modelos de IA a partir del 24 de abril de 2026.

Q¿Qué tipos de datos de usuario planea recopilar GitHub para el entrenamiento de su IA?

AGitHub planea recopilar datos de interacción que incluyen entradas y salidas del modelo, fragmentos de código, información contextual, estructura de repositorios y registros de conversaciones de chat.

Q¿Qué usuarios de Copilot NO se verán afectados inicialmente por este cambio de política?

ALos usuarios de Copilot Business, Enterprise y los usuarios de la versión educativa no se verán afectados inicialmente por este cambio de política debido a las restricciones de sus contratos.

Q¿Qué argumenta GitHub como principal justificación para esta recopilación de datos?

AGitHub argumenta que la recopilación de datos de interacción tiene como objetivo mejorar la precisión y seguridad de las sugerencias de código del modelo, citando que las pruebas internas en Microsoft ya han aumentado significativamente la tasa de aceptación de sugerencias.

Q¿Qué preocupación importante ha surgido en la comunidad de desarrolladores respecto a esta nueva política?

ALa comunidad de desarrolladores ha expresado preocupación por la definición de repositorios privados y la propiedad de los datos, ya que la política desafía los límites tradicionales de lo 'privado' al incluir este código en conjuntos de entrenamiento, a pesar de que los usuarios pueden optar por no participar manualmente.

Lecturas Relacionadas

"Xiaomei" y Yuanbao se interconectan, ¿están preparando el camino para los Agentes Inteligentes de WeChat?

El CEO de Meituan, Wang Xing, anunció tras los resultados del primer trimestre de 2026 que su asistente de IA "Xiaomei" se integrará con "Yuanbao" de Tencent. Esta colaboración permitirá a los usuarios solicitar servicios de vida local en Yuanbao y desencadenar automáticamente una comunicación entre agentes para acceder a pedidos de comida a domicilio y otros servicios de Meituan. El artículo analiza este movimiento como una respuesta estratégica de Meituan frente a la creciente competencia. Mientras plataformas como Doubao (ByteDance) y Qianwen (Alibaba) están construyendo ecosistemas cerrados ("jardines amurallados") integrando sus asistentes de IA con sus propios servicios comerciales, Meituan carece de un gran portal de IA independiente. La alianza con Yuanbao le permite a Meituan utilizar un punto de entrada conversacional de IA a cambio de proporcionar su infraestructura de servicios y datos de vida local, una relación vista como complementaria. Sin embargo, la colaboración enfrenta desafíos: la limitada experiencia del usuario debido a la arquitectura "Agente a Agente", la compleja distribución de beneficios comerciales y la necesidad de una integración fluida entre dos empresas diferentes. El artículo sitúa esta asociación en un contexto más amplio, vinculándola con los informes sobre el desarrollo de un "Agente de IA" nativo en WeChat. La cooperación entre Meituan y Yuanbao se interpreta como una prueba piloto o un modelo para futuras integraciones de alto nivel ("Agente a Agente") dentro del ecosistema de WeChat. Su éxito podría sentar un precedente crucial para atraer a otras grandes plataformas a la futura red de agentes de inteligencia artificial de Tencent, determinando en última instancia el alcance de dicho ecosistema.

marsbitHace 31 min(s)

"Xiaomei" y Yuanbao se interconectan, ¿están preparando el camino para los Agentes Inteligentes de WeChat?

marsbitHace 31 min(s)

Morningstar valora SpaceX en sólo 780.000 millones, menos de la mitad del objetivo de la OPI, ¿la OPI más grande de la historia está sobrevalorada?

La firma de investigación Morningstar ha emitido un informe sobre la valoración de SpaceX antes de su salida a bolsa, estableciendo su valor justo en 780 mil millones de dólares, un 45% del objetivo de 1.75 billones que persigue la empresa. La valoración de Morningstar separa su negocio central de lanzamientos y Starlink (611 mil millones) de las operaciones de IA, como xAI, que reciben una valoración ponderada de solo 170 mil millones. A pesar de esta crítica, la analista reconoce que factores como la baja oferta inicial de acciones, la fuerte demanda por empresas de infraestructura de IA y la posible inclusión rápida en el índice Nasdaq 100 podrían impulsar el precio a corto plazo tras la OPV. No obstante, advierte sobre presiones de venta a medio plazo debido a un calendario escalonado de desbloqueo de acciones para empleados e inversores internos. Elon Musk respondió a las dudas sobre la valoración sugiriendo que el mercado juzgará, en referencia al éxito de Tesla. Morningstar también destaca riesgos como la refinanciación de un préstamo puente de 200 mil millones de dólares y cuestiones de gobierno corporativo, incluida la estructura de control de voto de Musk y la adquisición reciente de xAI. La OPV, la más grande de la historia, está prevista para la segunda semana de junio.

marsbitHace 34 min(s)

Morningstar valora SpaceX en sólo 780.000 millones, menos de la mitad del objetivo de la OPI, ¿la OPI más grande de la historia está sobrevalorada?

marsbitHace 34 min(s)

a16z: Por qué los mercados de predicción serán la infraestructura de las "probabilidades futuras"

Los mercados de predicción, al convertir eventos futuros en contratos comercializables, permiten a los participantes expresar juicios con dinero real y agregar información dispersa en tiempo real, generando una probabilidad aproximada a través del precio. A diferencia de encuestas o predicciones de expertos, su ventaja radica en el incentivo económico para que participen quienes poseen información relevante. Estos mercados no son máquinas de profecía, sino una aplicación directa de la capacidad de los mercados para agregar información. Permiten abordar cuestiones específicas, desde geopolítica hasta el rendimiento de modelos de IA, que los activos financieros tradicionales no pueden expresar. Sin embargo, su eficacia no es automática. Depende de quién comercia, del diseño de los contratos, de la determinación de resultados y de la resistencia a la manipulación por parte de actores internos o interesados. Sin una participación informada, los precios son ruido; con información privilegiada, se pierde equidad. Por tanto, el siguiente paso no es solo escalar, sino construir una infraestructura más confiable: reglas de participación transparentes, diseño de contratos claro, mecanismos de liquidación auditables y restricciones contra la manipulación. Su verdadero valor reside en proporcionar una nueva señal de probabilidad pública en entornos de alta incertidumbre.

marsbitHace 45 min(s)

a16z: Por qué los mercados de predicción serán la infraestructura de las "probabilidades futuras"

marsbitHace 45 min(s)

Trading

Spot
Futuros
活动图片