Principales retos actuales en la adopción de IA


En base a mi experiencia, con el estado actual de madurez en la adopción de la práctica de Inteligencia Artificial, hasta las empresas más avanzadas siguen enfrentándose a importantes retos en la operacionalización – y también aún en la construcción – de los modelos, que deben tenerse en cuenta y estudiar cómo abordarlos. Para ello, es importante conocerlos y, si es preciso, aplicar ajustes organizativos, definir y aplicar nuevos métodos de trabajo y apoyarse en herramientas tecnológicas que, a su vez, maduran y evolucionan para poder dar respuesta a algunos de estos retos.
La siguiente figura esquematiza algunos de estos retos presentes tanto en la construcción de modelos como en su operacionalización.


Principales retos actuales en la adopción de IA

Para aquellos no iniciados en la materia, quedémonos en que hay dos grandes grupos de tareas: obtener el modelo a partir del entrenamiento con los datos, trabajo que suele recaer en un perfil tipo científico de datos; y operacionalizar el modelo e integrarlo en una aplicación en producción, un trabajo más cercano a la ingeniería del software, con importantes variaciones, en función de cada proyecto.

Las estrellas de la figura identifican cada uno de los retos y su ubicación aproximada en el proceso que parte de los datos, pasa por los modelos que se obtienen de esos datos y finaliza con la operacionalización de éstos en aplicaciones de inteligencia artificial, que los integran como parte de su funcionalidad.

1. Acceso a los datos: En muchas empresas, todavía hoy, un científico de datos tiene dificultades para acceder a los datos que necesita del entorno empresarial, especialmente si se trata de nuevos tipos de datos, como por ejemplo textos o logs de aplicaciones. El acceso a datos estructurados, de aplicaciones, suele presentar menos problemas, pero, aun así, no es raro observar importantes retardos y dificultades en el acceso a datos de las aplicaciones operacionales por parte del científico de datos que necesita trabajar con esos datos.

2. Infraestructura para entrenar modelos: Sobre todo cuando una organización empieza a trabajar con textos o imágenes, y necesita disponer de GPUs para que los entrenamientos no se eternicen, se constata – a veces con dolor – que este tipo de procesador no está disponible en los servidores empresariales. La solución táctica suele ser la adquisición de un PC de juegos de gama alta, que proporcionan una GPU de prestaciones aceptables. Sin embargo, está claro que no es la mejor solución, al ser poco escalable y robusta. Es pues, un aspecto que, sin ser de los más apremiantes, conviene abordar en cuanto la necesidad de utilizar GPUs sea recurrente.

3. Industrialización de la operacionalización: El objetivo es poder completar los pasos necesarios para poder llevar un modelo a producción de la forma más automatizada posible, pero sin perder el control ni renunciar a las pruebas y validaciones que cada familia de modelos necesite aplicar en base a determinadas políticas de control preestablecidas.

4. Monitorización de aplicaciones IA: Una vez la aplicación IA, aquella que utiliza uno o más modelos para llevar a cabo su función, está desplegada en el entorno operacional productivo, es preciso monitorizarla. Primero, como cualquier aplicación, requiere de una monitorización técnica, pero, además, al utilizar modelos operacionalizados, éstos también deben ser monitorizados incluyendo diversos atributos específicos de los modelos de machine learning (o deep learning).

5. Confianza en la aplicación IA: De forma alineada con el punto anterior, es importante establecer los mecanismos necesarios para que el negocio confíe en las decisiones que pueda tomar un modelo en un entorno productivo, sin que sea necesaria una revisión sistemática de cada decisión por parte de un profesional. Esto implica tener, además de las capacidades de monitorización, un modelo de gobierno que garantice que se sabe en todo momento qué es lo que hay en productivo, cómo se comporta el modelo y poder dar cualquier explicación requerida sobre los resultados obtenidos al aplicar el modelo sobre datos en producción.

6. Realización del valor de negocio esperado de la aplicación IA: Este reto consiste en asegurar que el esfuerzo de implementación y mejora invertido en la aplicación IA, especialmente en construir y mantener los modelos, produce el valor de negocio esperado. Así, es importante medir la mejora en métricas de negocio que, se supone, proporciona la aplicación. Del mismo modo interesa conocer si los esfuerzos invertidos en mejorar, por ejemplo, un 10% la precisión del modelo, realmente se traducen en una mejora notable en alguno de los KPIs de interés. De no ser así quizás es mejor no invertir en mejorar un modelo y, a cambio, invertir en otros modelos o iniciativas.

7. Trazabilidad datos – modelo – aplicación IA: Desde el punto de vista de la mantenibilidad del ciclo de vida del modelo, y también para garantizar la repetibilidad en la obtención del modelo en uso (por si se perdiese, corrompiese, …), es importante asegurar la existencia de trazabilidad entre los conjuntos de datos utilizados para entrenar el modelo y cada versión obtenida del modelo, así como controlar qué aplicaciones utilizan qué versión de cada modelo. De este modo, si se detectase cualquier problema con un conjunto de datos, se podría trazar el impacto hacia los modelos derivados y las aplicaciones que están utilizándolos. Y del mismo modo, a la inversa: sólo si existe esta trazabilidad podría explicarse un comportamiento extraño de una aplicación a partir de un defecto en el conjunto de datos utilizado para entrenar un modelo usado por la aplicación. Las herramientas utilizadas para la gestión del ciclo de vida de los modelos deben asegurar dicha trazabilidad. Por esta razón las plataformas integradas de gobierno del dato y de los modelos están mejor posicionadas que aquellas que sólo contemplan el gobierno del modelo o del dato de forma aislada.

8. Reutilización de modelos y conjuntos de datos: El último de esta lista de retos tiene que ver con el fomentar y facilitar la reutilización de activos, como son los modelos obtenidos o los conjuntos de datos utilizados para entrenar modelos. Esto que, a escala global, en internet, y mediante opensource, es una realidad autogestionada, a nivel de una organización empresarial aún sigue siendo un reto. Para reutilizar, primero hay que catalogar y además hay que incorporar ciertos metadatos que permitan descubrir estos activos y utilizarlos de forma controlada y medible.

A lo largo del libro «Proyectos de Inteligencia Artificial» se desgranan estos retos y se apuntaran los métodos, mejores prácticas y herramientas que deben ayudar a abordarlos, aunque algunos de ellos aún necesitarán cierto tiempo de maduración para alcanzar soluciones satisfactorias en la industria.


¡Si te ha interesado este artículo, valora comprar el libro!

Buy from Amazon
Buy from Amazon Kindle
Buy from Google Play
Buy from Apple Books

guest
0 Comments
Inline Feedbacks
View all comments