23.4 C
Colombia
domingo, julio 6, 2025

Denas Grybauskas, Director de Gobernanza y Estrategia de Oxylabs – Serie de entrevistas


Denas Grybauskas es el director de gobernanza y estrategia de Oxylabs, un líder mundial en recopilación de inteligencia net y soluciones de proxy premium.

Fundado en 2015, Oxilabs Proporciona una de las redes proxy de origen ético más grandes del mundo, que anulan más de 177 millones de IP en 195 países, junto con herramientas avanzadas como el desbloqueador net, la API de raspador net y la oxycopilot, un asistente de liquidación con IA que convierte el lenguaje pure en consultas de datos estructurados.

Ha tenido un impresionante viaje authorized y de gobierno en el espacio tecnológico authorized de Lituania. ¿Qué le motivó personalmente a abordar uno de los desafíos más polarizadores de la IA, la ética y los derechos de autor, en su papel en Oxylabs?

Los oxylabs siempre han sido el flagerador de la innovación responsable en la industria. Fuimos los primeros en abogar por el abastecimiento de representación ética y los estándares de la industria de raspado net. Ahora, con la IA moviéndose tan rápido, debemos asegurarnos de que la innovación esté equilibrada con la responsabilidad.

Vimos esto como un gran problema que enfrenta la industria de la IA, y también pudimos ver la solución. Al proporcionar estos conjuntos de datos, estamos permitiendo que las compañías y creadores de IA estén en la misma página con respecto al desarrollo justo de IA, que es beneficioso para todos los involucrados. Sabíamos lo importante que period mantener los derechos de los creadores a la vanguardia, pero también proporcionar contenido para el desarrollo de futuros sistemas de IA, por lo que creamos estos conjuntos de datos como algo que puede satisfacer las demandas del mercado precise.

El Reino Unido está en medio de una batalla de derechos de autor calentada, con fuertes voces en ambos lados. ¿Cómo se interpreta el estado precise del debate entre la innovación de IA y los derechos de los creadores?

Si bien es importante que el gobierno del Reino Unido favorezca la innovación tecnológica productiva como una prioridad, es important que los creadores se sientan mejorados y protegidos por la IA, no robado. El marco authorized actualmente bajo debate debe encontrar un punto óptimo entre fomentar la innovación y, al mismo tiempo, proteger a los creadores, y espero que en las próximas semanas los veamos encontrar una manera de lograr un equilibrio.

Oxylabs acaba de lanzar los primeros conjuntos de datos éticos de YouTube del mundo, que requiere el consentimiento del creador para la capacitación de IA. ¿Cómo funciona exactamente este proceso de consentimiento y qué tan escalable es para otras industrias como la música o la publicación?

Todos los millones de movies originales en los conjuntos de datos tienen el consentimiento explícito de los creadores que se utilizarán para la capacitación de IA, conectando éticamente a los creadores e innovadores. Todos los conjuntos de datos ofrecidos por oxylabs incluyen movies, transcripciones y metadatos ricos. Si bien dichos datos tienen muchos casos de uso potenciales, Oxylabs lo refinó y lo preparó específicamente para el entrenamiento de IA, que es el uso que los creadores de contenido han acordado a sabiendas.

Muchos líderes tecnológicos argumentan que requerir una opción explícita de todos los creadores podría “matar” a la industria de la IA. ¿Cuál es su respuesta a esa afirmación y cómo demuestra lo contrario el enfoque de Oxylabs?

Requerir que, para cada uso de materials para la capacitación de IA, hay una opción explícita previa presenta desafíos operativos significativos y tendrá un costo significativo para la innovación de la IA. En lugar de proteger los derechos de los creadores, podría incentivar involuntariamente a las empresas a cambiar las actividades de desarrollo a jurisdicciones con una aplicación menos rigurosa o diferentes regímenes de derechos de autor. Sin embargo, esto no significa que no pueda haber un término medio donde se fomente el desarrollo de la IA mientras se respeta los derechos de autor. Por el contrario, lo que necesitamos son mecanismos viables que simplifiquen la relación entre las compañías de IA y los creadores.

Estos conjuntos de datos ofrecen un enfoque para avanzar. El modelo de exclusión, según el cual el contenido se puede usar a menos que el propietario de los derechos de autor opte explícitamente, es otro. La tercera forma sería facilitar los acuerdos entre editores, creadores y compañías de IA a través de soluciones tecnológicas, como plataformas en línea.

En última instancia, cualquier solución debe operar dentro de los límites de las leyes aplicables de derechos de autor y protección de datos. En Oxylabs, creemos que la innovación de IA debe llevarse a cabo de manera responsable, y nuestro objetivo es contribuir a marcos legales y prácticos que respeten a los creadores al tiempo que permiten el progreso.

¿Cuáles fueron los mayores obstáculos que tu equipo tuvo que superar para hacer que los conjuntos de datos basados ​​en el consentimiento sea viable?

YouTube abrió la ruta para nosotros, lo que permite a los creadores de contenido licenciar fácil y convenientemente su trabajo para la capacitación de IA. Después de eso, nuestro trabajo fue principalmente técnico, involucrando la recopilación de datos, limpiándolos y estructurarlos para preparar los conjuntos de datos y construir toda la configuración técnica para que las empresas accedan a los datos que necesitaban. Pero esto es algo que hemos estado haciendo durante años, de una forma u otra. Por supuesto, cada caso presenta su propio conjunto de desafíos, especialmente cuando se trata de algo tan grande y complejo como los datos multimodales. Pero teníamos tanto el conocimiento como la capacidad técnica para hacer esto. Dado esto, una vez que los autores de YouTube tuvieron la oportunidad de dar su consentimiento, el resto period solo cuestión de poner nuestro tiempo y recursos en ello.

Más allá del contenido de YouTube, ¿imagina un futuro en el que otros tipos de contenido importantes, como la música, la escritura o el arte digital, también pueden licenciarse sistemáticamente para su uso como datos de capacitación?

Desde hace un tiempo, hemos estado señalando la necesidad de un enfoque sistemático para el consentimiento y la licencia de contenido para permitir la innovación de IA mientras lo equilibramos con los derechos de los creadores. Solo cuando haya una forma conveniente y cooperativa para que ambas partes alcancen sus objetivos, habrá un beneficio mutuo.

Este es solo el comienzo. Creemos que proporcionar conjuntos de datos como el nuestro en una variedad de industrias puede proporcionar una solución que finalmente lleva el debate de los derechos de autor a un cierre amistoso.

¿La importancia de ofertas como los conjuntos de datos éticos de Oxylabs varía según los diferentes enfoques de gobernanza de IA en la UE, el Reino Unido y otras jurisdicciones?

Por un lado, la disponibilidad de conjuntos de datos basados ​​en el consentimiento explícito nivela el campo para las compañías de IA con sede en jurisdicciones donde los gobiernos se inclinan hacia una regulación más estricta. La principal preocupación de estas compañías es que, en lugar de apoyar a los creadores, las reglas estrictas para obtener el consentimiento solo darán una ventaja injusta a los desarrolladores de IA en otras jurisdicciones. El problema no es que a estas compañías no les importe el consentimiento, sino que sin una forma conveniente de obtenerlo, están condenadas a quedarse atrás.

Por otro lado, creemos que si se simplifica otorgar el consentimiento y acceder a datos con licencia para la capacitación de IA, no hay razón por la cual este enfoque no debería convertirse en la forma preferida a nivel mundial. Nuestros conjuntos de datos construidos en el contenido de YouTube con licencia son un paso hacia esta simplificación.

Con una creciente desconfianza pública hacia cómo se capacita la IA, ¿cómo crees que la transparencia y el consentimiento pueden convertirse en ventajas competitivas para las empresas tecnológicas?

Aunque la transparencia a menudo se ve como un obstáculo para la ventaja competitiva, también es nuestra mayor arma para luchar contra la desconfianza. Cuanta más transparencia puedan proporcionar las empresas de IA, más evidencia hay para la capacitación de IA ética y beneficiosa, reconstruyendo así la confianza en la industria de la IA. Y a su vez, los creadores que vean que ellos y la sociedad pueden obtener valor de la innovación de IA tendrán más razones para dar su consentimiento en el futuro.

Oxylabs a menudo se asocia con el raspado de datos e inteligencia net. ¿Cómo encaja esta nueva iniciativa ética en la visión más amplia de la empresa?

El lanzamiento de conjuntos de datos de YouTube de origen ético continúa nuestra misión en Oxylabs para establecer y promover prácticas de la industria ética. Como parte de esto, cofundamos la Iniciativa de Recopilación de Datos Internet Moral (EWDCI) e introdujo un marco de nivel transparente de la industria para el abastecimiento de proxy. También lanzamos el Proyecto 4β como parte de nuestra misión para permitir a los investigadores y académicos maximizar su impacto en la investigación y mejorar la comprensión de los datos net públicos críticos.

Mirando hacia el futuro, ¿cree que los gobiernos deberían exigir consentimiento por defecto para los datos de capacitación, o debería seguir siendo una iniciativa voluntaria dirigida por la industria?

En una economía de libre mercado, generalmente es mejor dejar que el mercado se corrija a sí mismo. Al permitir que la innovación se desarrolle en respuesta a las necesidades del mercado, continuamente reinventamos y renovamos nuestra prosperidad. La legislación de mano dura nunca es una buena primera opción y solo debe recurrir a cuando todas las demás vías para garantizar la justicia mientras permiten la innovación se han agotado.

No parece que ya hayamos llegado a ese punto en el entrenamiento de IA. Las opciones de licencia de YouTube para los creadores y nuestros conjuntos de datos demuestran que este ecosistema está buscando activamente formas de adaptarse a nuevas realidades. Por lo tanto, aunque se necesita una regulación clara, por supuesto, para garantizar que todos actúen dentro de sus derechos, los gobiernos pueden querer pisar a la ligera. En lugar de requerir un consentimiento expresado en todos los casos, es posible que desee examinar las formas en que las industrias pueden desarrollar mecanismos para resolver las tensiones actuales y tomar sus señales de eso al legislar para alentar la innovación en lugar de obstaculizarla.

¿Qué consejo ofrecería a las nuevas empresas y a los desarrolladores de IA que desean priorizar el uso de datos éticos sin detener la innovación?

Una forma en que las startups pueden ayudar a facilitar el uso de datos éticos es mediante el desarrollo de soluciones tecnológicas que simplifiquen el proceso de consentimiento y el valor derivado de los creadores. A medida que surgen opciones para adquirir datos de origen transparente, las compañías de IA no necesitan comprometerse a la velocidad; Por lo tanto, les aconsejo que mantengan los ojos abiertos para tales ofrendas.

Gracias por la gran entrevista, los lectores que deseen obtener más información deben visitar Oxilabs.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles