¿Pensando en implementar un proyecto de Machine Learning en la Empresa?

Wayner Barrios Bustamante
2 min readMar 31, 2021

--

Se está convirtiendo en un “boom” o moda formular la solución de alguna problemática empresarial mediante un proyecto de aprendizaje automático (Machine Learning) al interior de las Empresas. En muchos casos, problemas formulados sin tener el conocimiento de que éstos se puedan solucionar a través del modelamiento de una máquina de aprendizaje, quizás motivado por el poco, o casi nulo, conocimiento que tiene algunos directivos sobre el tema. Mucha de esta motivación está soportada por lo que escuchan o leen en sitios Web especializados.

Sin embargo, como todo proyecto en el que se involucra la Analítica de Datos (Data Analysis), la participación y compromiso de la Alta Dirección e incluso de una Junta Directiva o de Socios es fundamental para llevar a cabo con éxito un proyecto de Machine Learning, más aún cuando la repercusión de la solución tenga una transversalidad en la operación de los procesos de la Empresa. Se estima que más de un 90% de las iniciativas de éste tipo de proyecto fracasan de manera anticipada e incluso en su etapa de formulación, cuando no se da ese compromiso.

En ocasiones no tropezamos con un grupo de directivos comprometidos con el proyecto y se logra definir y tomar partida del proyecto. Si esto sucede, un principal y relevante obstáculo a los que se enfrenta los ingenieros o científicos de datos es la identificación de las fuentes de datos que estarán involucradas en la implementación del modelo, a menudo situaciones como deficiencias o falta de control en los sistemas de información se reflejan en una mala calidad de los datos almacenados en las bases de datos y la carencia de una gobernanza de datos sin que existan políticas de atención y solución a las distintas anomalías que presentan los datos (valores nulos, valores faltantes, valores inconsistentes y atípicos), pueden comprometer la continuidad o cumplimiento del proyecto.

Entonces, surge la principal inquietud al pensar iniciar un proyecto de aprendizaje automático:

¿Están nuestros datos bien preparados?

Andrew Ng, profesor de la Universidad de Stanford en USA, y una de las personas más influyentes en el Mundo de la Inteligencia Artificial y su aplicabilidad, decía en algunas de sus charlas:

“Los datos son el alimento para la Inteligencia Artificial” (en inglés, Data is food for AI),

y se refería a que el 80% del tiempo de un proyecto de Inteligencia Artificial se invierte en la identificación de fuentes y preparación de los datos.

Conclusión. Antes de emprender una iniciativa de tecnología de la información aplicando la Inteligencia Artificial y sus distintas áreas, debemos evaluar la calidad de los datos que van a estar involucrados en la solución, indistintamente de la fuente de donde provengan.

--

--

Wayner Barrios Bustamante
Wayner Barrios Bustamante

Written by Wayner Barrios Bustamante

Systems Engineer, Universidad del Norte , Specialist in Computer Networks and student of Machine Learning.

No responses yet