AI a la vanguardia de los medios y el entretenimiento

Malav Shah, DIRECTV

Arizé / Malav Shah

Malav Shah es científico de datos II en DIRECTV. Se une a DIRECTV desde AT&T, donde trabajó en múltiples negocios de consumo, incluidos banda ancha, servicios inalámbricos y video, e implementó modelos de aprendizaje automático (ML) en una amplia gama de casos de uso que abarcan el ciclo de vida completo del cliente, desde la adquisición hasta la retención. Malav tiene una Maestría en Ciencias de la Computación con especialización en Aprendizaje Automático de Georgia Tech, un título que aprovecha todos los días en DIRECTV al aplicar técnicas modernas de ML para ayudar a la empresa a ofrecer experiencias de entretenimiento innovadoras.

¿Puede resumir su trayectoria profesional y por qué se dedicó por primera vez al aprendizaje automático?

Ha sido un viaje interesante. Durante mis años de pregrado, en realidad estudié tecnología de la información, por lo que la mayor parte de mi trabajo de curso no fue inicialmente en aprendizaje automático. Alrededor de mi tercer año, tomé un curso de IA en el que aprendimos sobre las máquinas de Turing y eso me interesó mucho en el mundo de la inteligencia artificial. Incluso en ese entonces, sabía que había encontrado mi vocación. Empecé a tomar algunas clases adicionales fuera de mis cursos habituales y, finalmente, asumí un proyecto final para construir un modelo que predijera valores atípicos en el diagnóstico y pronóstico médico que me dejó fascinado con el poder del aprendizaje automático. Hice mi maestría en Georgia Tech y me especialicé en aprendizaje automático, tomando una variedad de cursos, desde datos y análisis visual hasta una clase de IA impartida por el exlíder técnico de Google Glass. Thad Starner. Después de graduarme, asumí mi primer cargo en AT&T y trabajé durante aproximadamente un año y medio en la organización del director de datos, creando modelos de adquisición y retención para el producto de banda ancha de la empresa. En julio de 2020, me uní a una nueva organización dentro de DIRECTV como parte del equipo responsable de todo lo relacionado con la ciencia de datos con voz en cómo construimos la infraestructura de ML y nuestra canalización de MLOps en toda la organización. Estar en una organización de datos centralizada donde podía impactar no solo a mi equipo sino también a otros equipos fue un gran motivador para unirme a DIRECTV.

¿Qué te atrajo de tu puesto actual?

Hice una pasantía para AT&T mientras completaba mi maestría. Si bien la pasantía se centró en el producto de banda ancha, también toqué la conexión inalámbrica y la transmisión de video, cosas que usaba todos los días como consumidor. Después de graduarme, la mayoría de los otros puestos que me ofrecieron en ese momento eran en ingeniería de software o ingeniería de ML, pero AT&T me ofreció un puesto de científico de datos. Ser un científico de datos y pensar en cómo investigar y resolver problemas finalmente resultó atractivo.

Ese rol condujo directamente a la oportunidad de ser parte de un viaje en la transmisión de video basado en un legado de casi 30 años en DIRECTV. La oportunidad de crear y definir nuevas herramientas en la nube, nueva infraestructura y herramientas de aprendizaje automático en una etapa tan temprana de mi carrera es emocionante. No creo que pueda obtener tanta exposición a tantos niveles de ejecutivos en ningún otro lugar.

¿Cómo está estructurada la organización de aprendizaje automático en DIRECTV? ¿Hay un equipo central de ML o están más vinculados a los equipos de productos o negocios?

Nuestro equipo dentro de DIRECTV actúa como un centro de excelencia. Nuestras responsabilidades son dobles. La primera responsabilidad es ayudar a resolver problemas y desarrollar soluciones para las partes interesadas de marketing, experiencia del cliente (CX) y otros equipos. Por ejemplo, podemos ayudar a crear un modelo desde cero e implementarlo en producción para el equipo de marketing antes de entregárselo a sus científicos de datos para que sean dueños del día a día, mientras ofrecemos actualizaciones continuas del modelo como nuevos requisitos. adelante. La segunda parte del trabajo de nuestro equipo es definir la infraestructura que estos equipos utilizarán, asegurándose de que tengan las herramientas y tecnologías que necesitan para crear e implementar modelos de aprendizaje automático de manera efectiva. Nuestro equipo también es responsable de definir las mejores prácticas para el desarrollo y la implementación de ML en toda la organización. Con ese fin, siempre estamos buscando formas de mejorar nuestras canalizaciones de ML existentes en función de nuestra estrategia y objetivos, ya sea creando algo internamente o observando qué capacidades hay en el mercado.

Al evaluar esta infraestructura, ¿cómo evalúa si construir o comprar? El panorama de la infraestructura de ML obviamente ha evolucionado mucho en los últimos años.

Esa es una pregunta interesante que surgió recientemente en el contexto de la evaluación de plataformas de observabilidad de ML como Arize. En general, primero analizamos el valor comercial para asegurarnos de que cualquier nueva capacidad realmente generará valor para la organización. Luego, observamos qué tan pronto necesitamos la capacidad, el tiempo que llevaría construir internamente, las capacidades que podríamos construir en comparación con un proveedor y, finalmente, el costo de comprar o construir. Este proceso de evaluación requiere bastante de nuestro tiempo, pero ha demostrado ser efectivo para brindar el máximo retorno de la inversión al negocio.

¿Cuáles son sus casos de uso de aprendizaje automático?

Principalmente, DIRECTV está haciendo mucho modelado de datos estructurados. Por ejemplo, trabajamos con nuestro equipo de experiencia del cliente para crear un modelo detractor de puntaje neto de promotor (NPS) que usamos para permitir mejores experiencias para los clientes que enfrentan problemas con nuestro servicio. También trabajamos con nuestras partes interesadas en marketing para crear modelos en torno a ofertas de clientes "personalizadas" y la predicción de abandonos a corto y largo plazo.

Otra área de interés es la inteligencia de contenido: no análisis, sino inteligencia. En el espacio de inteligencia de contenido, la creación de un motor de recomendación para los diversos carruseles que los clientes ven en el producto DIRECTV es una de nuestras áreas clave de enfoque. También estamos comenzando a desarrollar y ver más tracción en los modelos de procesamiento de lenguaje natural (NLP) y visión por computadora. El lanzamiento de Arize de seguimiento de incrustación de imagen y NLP es algo que probablemente necesitaremos a medida que hagamos la transición para trabajar más con datos no estructurados durante el próximo año.

Mucho ha cambiado en el panorama de los medios solo en los últimos años. ¿Estás viendo un repunte en cosas como deriva del concepto?

El consumo después de la pandemia definitivamente se disparó. A medida que las personas se quedaron atrapadas en sus hogares, la rotación disminuyó en toda la industria. Con personas que trabajan desde casa, estos hábitos pueden tener cierto poder de permanencia, y no solo en áreas rurales donde la televisión satelital ya es líder. Una de las otras tendencias en la industria de la transmisión es un aumento histórico en la audiencia de deportes en general en comparación con 2019 (realmente no debería comparar 2020 o 2021 dados los horarios deportivos comprimidos y los eventos cancelados). La participación de los fanáticos de los deportes también se está convirtiendo en una gran tendencia a medida que más servicios de transmisión en la industria ingresan a los deportes y agregan interactividad, como permitir que las personas apuesten en la televisión. Con estos patrones de consumo en constante cambio, se vuelve más importante para nosotros hacer un seguimiento de cosas como la deriva de concepto y la deriva de características para asegurarnos de que estamos abordando los problemas de rendimiento del modelo de inmediato.

¿Cuáles son algunos de los desafíos a los que se enfrenta una vez que los modelos se implementan en producción y por qué? seguimiento del modelo ¿importante?

En la industria del video, los comportamientos están cambiando rápidamente. Si se está desviando un mes después, puede afectar negativamente el rendimiento del modelo y provocar una pérdida de valor empresarial. Esa es una de las razones principales por las que creo que las actualizaciones de monitoreo de ML en tiempo real son tan importantes en MLOps. Si mi modelo se ha desviado esta mañana, entonces debería saberlo en ese segundo. Si mi predicción se ha desviado, o si hay una desviación de funciones o alguna función está vacía, entonces no quiero esperar una semana para que un analista la verifique; idealmente, quiero saber antes de que se publiquen las predicciones de una semana. el campo.

Los modelos nunca son perfectos; siempre van a desviarse en función de los comportamientos cambiantes, los datos cambiantes o los sistemas de origen cambiantes. Tener una plataforma de monitoreo centralizada como Arize es inmensamente beneficioso.

¿Qué consejo le daría a las personas que asumen su primer rol en ciencia de datos?

Una de las cosas que aconsejo que no hagan los científicos de datos recién graduados es obsesionarse con obtener puntajes métricos perfectos de inmediato. Mientras se enfoca en un modelo métrico como precisión es importante, es conceptualmente más importante centrarse en comprender los datos subyacentes (qué están haciendo los datos, qué le están diciendo los datos) y asegurarse de que comprende el impacto en el negocio y el problema que está tratando de resolver. Estos fundamentos son importantes, pero a menudo las personas los pierden de vista porque se mueven demasiado rápido para intentar construir el mejor modelo. En cambio, diría que concentre entre el 70 y el 80 % de su tiempo en todo lo que está poniendo en el modelo porque la basura que entra es la basura que sale. Una vez que te hayas asegurado de que no estás poniendo basura en el modelo, el resto se soluciona solo.

Un consejo adicional para los recién graduados es prestar atención a la ola de herramientas de IA centradas en datos que está surgiendo. Es probable que estos sean el próximo gran avance en el aprendizaje automático y vale la pena seguirlos de cerca.

¿Cómo colabora con los clientes potenciales comerciales y de productos y vincula las métricas del modelo con los resultados comerciales?

Eso siempre está pasando. Cada vez que creamos modelos para cualquier parte interesada, nos reunimos regularmente con ellos para asegurarnos de que lo que estamos viendo coincida con lo que debería verse en el mundo real. Al iniciar un proyecto, asegurarse de que los requisitos y los datos estén ahí y de que los comprenda correctamente es fundamental. Ni siquiera entro en qué tipo de modelo voy a construir hasta las últimas etapas del ciclo de desarrollo, que podría ser en el sprint cuatro o incluso en el sprint cinco. Mi enfoque no es comenzar describiendo qué tipo de modelo quiero construir; Prefiero comenzar con lo que el valor comercial debe impulsar primero. Tener una comprensión profunda de los datos también me ayuda a responder preguntas matizadas cuando presento a los ejecutivos de negocios y las partes interesadas.

¿Cómo ve la evolución del espacio de infraestructura de MLOps y ML?

Creo que nos estamos moviendo hacia una era muy innovadora en el aprendizaje automático porque hay muchas soluciones nuevas de ML que surgen en la industria cada semana. La observabilidad de ML es un gran ejemplo de un espacio donde suceden cientos de cosas. La producción de ML frente a la producción de otras aplicaciones es completamente diferente porque otras aplicaciones han existido por un tiempo (15 o incluso 25 años) y tienen una línea de producción muy madura, pero para el aprendizaje automático todavía es relativamente nuevo. Será emocionante ver cómo podemos hacer que la implementación de ML, que es un punto débil para muchos equipos, sea más fácil y sin problemas. Otras áreas de innovación que estaré observando de cerca incluyen herramientas de generación de información automatizada, herramientas de IA centradas en datos y cómo podemos mejorar aún más el espacio de infraestructura de ML donde todo está en la nube.

Fuente: https://www.forbes.com/sites/aparnadhinakaran/2022/07/07/ai-at-the-forefront-of-media-and-entertainment/