22.8 C
Colombia
sábado, julio 5, 2025

Las máquinas de ayuda a comprender el contenido visible con la IA | MIT Information



Los datos deben impulsar cada decisión que tome un negocio moderno. Pero la mayoría de las empresas tienen un punto ciego masivo: no saben lo que está sucediendo en sus datos visuales.

Coactive está trabajando para cambiar eso. La compañía, fundada por Cody Coleman ’13, Meng ’15 y William Gaviria Rojas ’13, ha creado una plataforma synthetic con inteligencia que puede dar sentido a datos como imágenes, audio y video para desbloquear nuevas concepts.

La plataforma de Coactive puede buscar, organizar y analizar instantáneamente el contenido visible no estructurado para ayudar a las empresas a tomar decisiones más rápidas y mejores.

“En la primera revolución de Massive Information, las empresas mejoraron para obtener valor de sus datos estructurados”, cube Coleman, refiriéndose a datos de tablas y hojas de cálculo. “Pero ahora, aproximadamente del 80 al 90 por ciento de los datos en el mundo no están estructurados. En el próximo capítulo de Massive Information, las empresas tendrán que procesar datos como imágenes, video y audio a escala, y la IA es una pieza clave de desbloqueo esa capacidad”.

Coactive ya está trabajando con varios medios grandes y compañías minoristas para ayudarlos a comprender su contenido visible sin depender de la clasificación y etiquetado guide. Eso les está ayudando a obtener el contenido correcto a los usuarios más rápido, eliminar contenido explícito de sus plataformas y descubrir cómo el contenido específico influye en el comportamiento del usuario.

En términos más generales, los fundadores creen que Coactive sirve como un ejemplo de cómo la IA puede empoderar a los humanos para trabajar de manera más eficiente y resolver nuevos problemas.

“La palabra coactiva significa trabajar juntos simultáneamente, y esa es nuestra gran visión: ayudar a los humanos y máquinas a trabajar juntos”, cube Coleman. “Creemos que la visión es más importante ahora que nunca porque la IA puede separarnos o unirnos. Queremos que Coactive sea un agente que nos une y les da a los seres humanos un nuevo conjunto de superpoderes”.

Dar la visión de las computadoras

Coleman conoció a Gaviria Rojas en el verano antes de su primer año a través del programa MIT Interphase Edge. Ambos continuarían en especialización en ingeniería eléctrica e informática y trabajarían para traer MIT OpenCourseWare contenido a las universidades mexicanas, entre otros proyectos.

“Ese fue un gran ejemplo de emprendimiento”, recuerda Coleman del Proyecto OpenCourseware. “Fue realmente empoderador ser responsable del negocio y el desarrollo de software program. Me llevó a comenzar mis propios pequeños negocios de desarrollo net después, y a tomar [the MIT course] Viaje del fundador “.

Coleman exploró por primera vez el poder de la IA en el MIT mientras trabajaba como investigador de posgrado en la Oficina de Aprendizaje Digital (ahora MIT Open Studying), donde utilizó el aprendizaje automático para estudiar cómo los humanos aprenden en MITX, que alberga cursos en línea masivos y abiertos creados por profesores e instructores del MIT.

“Fue realmente sorprendente para mí que pudieras democratizar este viaje de transformación que pasé en el MIT con el aprendizaje digital, y que podría aplicar AI y el aprendizaje automático para crear sistemas adaptativos que no solo nos ayuden a comprender cómo aprenden los humanos, sino que también ofrecen experiencias de aprendizaje más personalizadas a las personas de todo el mundo”, cube Coleman de MITX. “Esa fue también la primera vez que pude explorar contenido de video y aplicarle IA”.

Después del MIT, Coleman fue a la Universidad de Stanford para su doctorado, donde trabajó para reducir las barreras para usar IA. La investigación lo llevó a trabajar con compañías como Pinterest y Meta en AI y aplicaciones de aprendizaje automático.

“Ahí es donde pude ver a la vuelta de la esquina en el futuro de lo que la gente quería hacer con IA y su contenido”, recuerda Coleman. “Estaba viendo cómo las empresas líderes estaban usando la IA para impulsar el valor comercial, y de ahí proviene la chispa inicial de Coactive. Pensé: ‘¿Qué pasaría si creamos un sistema operativo de grado empresarial para el contenido y la IA multimodal para facilitar eso?'”

Mientras tanto, Gaviria Rojas se mudó al Área de la Bahía en 2020 y comenzó a trabajar como Un científico de datos en eBay. Como parte del movimiento, necesitaba ayuda para transportar su sofá, y Coleman period el afortunado amigo al que llamó.

“En el viaje en automóvil, nos dimos cuenta de que ambos vimos una explosión en torno a los datos y la IA”, cube Gaviria Rojas. “En el MIT, obtuvimos un asiento de primera fila para la revolución de Massive Information, y vimos a las personas que inventaban tecnologías para desbloquear el valor de esos datos a escala. Cody y yo nos dimos cuenta de que teníamos otro barril de polvo a punto de explotar con las empresas recopilando una cantidad tremenda de datos, pero esta vez period datos multimodales como imágenes, video, audio y texto. Había una tecnología faltante para desbloquear a escala a escala, pero period AI”.

La plataforma que los fundadores continuaron, lo que Coleman describe como un “sistema operativo de IA”, es el modelo agnóstico, lo que significa que la compañía puede cambiar los sistemas de IA debajo del capó a medida que los modelos continúan mejorando. La plataforma de Coactive incluye aplicaciones previas a la construcción que los clientes comerciales pueden usar para hacer cosas como buscar a través de su contenido, generar metadatos y realizar análisis para extraer concepts.

“Antes de la IA, las computadoras verían el mundo a través de bytes, mientras que los humanos verían el mundo a través de la visión”, cube Coleman. “Ahora con la IA, las máquinas finalmente pueden ver el mundo como nosotros, y eso hará que los mundos digitales y físicos se difuminen”.

Mejora de la interfaz humana-computadora

La base de datos de imágenes de Reuters proporciona a los periodistas del mundo millones de fotos. Antes de Coactive, la compañía confió en los reporteros que ingresan manualmente las etiquetas con cada foto para que aparecieran las imágenes correctas cuando los periodistas buscaron ciertos temas.

“Fue increíble lento y costoso pasar por todos estos activos crudos, por lo que la gente simplemente no agregó etiquetas”, cube Coleman. “Eso significaba que cuando buscaba cosas, había resultados limitados incluso si las fotos relevantes estaban en la base de datos”.

Ahora, cuando los periodistas en el sitio net de Reuters seleccionan ‘Habilitar búsqueda de IA’, Coactive puede extraer contenido relevante en función de la comprensión de su sistema de IA de los detalles en cada imagen y video.

“Está mejorando enormemente la calidad de los resultados para los periodistas, lo que les permite contar historias mejores y precisas que nunca”, cube Coleman.

Reuters no está solo en luchar por administrar todo su contenido. Digital Asset Administration es un gran componente de muchos medios y empresas minoristas, que hoy a menudo confían en metadatos ingresados ​​manualmente para clasificar y buscar ese contenido.

Otro cliente coactivo es Fandom, que es una de las plataformas más grandes del mundo para información sobre programas de televisión, videojuegos y películas con más de 300 millones de usuarios activos mensuales. Fandom está utilizando coactivos para comprender los datos visuales en sus comunidades en línea y ayudar a eliminar el contenido excesivo de sangre y sexualizado.

“Solía ​​tomar de 24 a 48 horas para que Fandom revise cada nuevo contenido”, cube Coleman. “Ahora con Coactive, han codificado las pautas de su comunidad y pueden generar información de grano más fino en un promedio de aproximadamente 500 milisegundos”.

Con cada caso de uso, los fundadores consideran que el coactivo permite un nuevo paradigma en las formas en que los humanos trabajan con las máquinas.

“A lo largo de la historia de la interacción humana-computadora, hemos tenido que doblar un teclado y un mouse para ingresar información de una manera que las máquinas puedan entender”, cube Coleman. “Ahora, por primera vez, podemos hablar naturalmente, podemos compartir imágenes y movies con IA, y puede entender ese contenido. Ese es un cambio basic en la forma en que pensamos acerca de las interacciones humanas.

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles