Los contenidos de Reddit bloqueados para la IA de Microsoft

Reddit (freepik image)

El director ejecutivo de Reddit afirmó que impedir que Microsoft rastree datos con inteligencia artificial fue un «gran dolor de cabeza»

A diferencia de la Unión Europea, que ha regulado la inteligencia artificial, Estados Unidos no tiene aún una regulación global y eso hace que sucedan situaciones como la que explicamos en este post, de la mano de PCMAG

Reddit quiere que se entienda que su plataforma social es de pago

Reddit ha tenido problemas para impedir que empresas tecnológicas como Microsoft, Perplexity AI y Anthropic rastree su contenido, y quiere que entiendan que su plataforma social es de pago.

En una entrevista reciente con The Verge, el director ejecutivo de Reddit, Steve Huffman, reafirmó la postura de Reddit contra el raspado de datos con inteligencia artificial sin licencia. A diferencia de la (cómoda) opinión de algunas empresas de que deberían poder raspar activamente cualquier dato «disponible públicamente» sin permiso y de forma gratuita, Reddit se opone firmemente a esta postura.

Microsoft no notificó a Reddit que estaba rastreando el contenido de Reddit y usándolo para sus funciones de inteligencia artificial en Bing, dice Huffman. Para empeorar las cosas, Huffman también alega que Microsoft revendió los datos de Reddit después de rasparlos de forma gratuita a otros motores de búsqueda a través de la API de Bing.

Desde entonces, Reddit ha impedido que Microsoft rastree su sitio, una iniciativa que Huffman califica de «un verdadero dolor de cabeza».

¡Protege tus sistemas con Aratecnia!

Descubre nuestros servicios de seguridad informática para mantener tus datos seguros

¡Confía en Aratecnia para proteger tu información sensible y garantizar la integridad de tus sistemas!

“Microsoft, Anthropic y Perplexity actúan como si todo el contenido de Internet fuera gratuito para ellos”: Steve Huffman

«Hemos visto a Microsoft, Anthropic y Perplexity actuar como si todo el contenido de Internet fuera gratuito para ellos», le dice Huffman a The Verge. «Esa es su verdadera postura».

Otros gigantes tecnológicos también han adoptado esta postura. Apple confirmó previamente a PCMag el mes pasado que ha utilizado datos disponibles públicamente para entrenar a su próximo Apple Intelligence. De manera similar, Salesforce defendió anteriormente su uso de transcripciones de videos de YouTube y otros datos sin licencia argumentando que lo que utilizó estaba «disponible públicamente». Sin embargo, en todos estos casos, no está claro qué significa realmente «disponible públicamente».

Un portavoz de Microsoft le dijo a PCMag: «Microsoft respeta el estándar robots.txt y respetamos las instrucciones proporcionadas por los sitios web que no quieren que el contenido de sus páginas se use con nuestros modelos de IA generativa. Bing dejó de rastrear Reddit después de que implementaron su archivo robots.txt actualizado el 1 de julio, que prohíbe todo rastreo de su sitio».

En los últimos meses, Reddit ha estado haciendo cambios para intentar controlar cómo las empresas de IA usan los datos, publicaciones y comunidades de los usuarios de Reddit. A principios de este año, llegó a un acuerdo de licencia de IA de 60 millones de dólares con Google y también llegó a un acuerdo con OpenAI en mayo. Sin embargo, los usuarios individuales de Reddit no recibirán un pago si se usan sus publicaciones.

¿Llegaría Microsoft a un acuerdo con Reddit?

¿Llegaría Microsoft a un acuerdo con Reddit? Es poco probable. En respuesta a un usuario de Twitter que le rogaba a Microsoft que pagara a Reddit para competir con Google, el director de búsqueda de Microsoft, Jordi Ribas, rechazó la idea. «Bing necesita valerse por sí mismo como otros productos de nuestra empresa», dijo Ribas.

Reddit presenta sus acuerdos de licencia como su forma de saber qué hacen estas empresas con el contenido de sus usuarios. “Sin estos acuerdos, no tenemos voz ni voto ni conocimiento sobre cómo se muestran nuestros datos y para qué se utilizan, lo que nos ha puesto en una posición en la que tenemos que bloquear a personas que no han estado dispuestas a aceptar cómo nos gustaría que se utilizaran o no nuestros datos”, dice Huffman.

Es poco probable que las grandes empresas tecnológicas como Microsoft cambien su postura sobre los datos “públicos” hasta que se apruebe una regulación sustancial de la IA en los EE. UU. o hasta que algunas de las demandas de derechos de autor de alto perfil contra las empresas de IA sienten un precedente.

Artículo PCMAG