Los sesgos son un aspecto muy importante de todo modelo basado en Inteligencia Artificial.

Si nunca has oído hablar de ellos y estás realizando proyectos de Analítica Avanzada, ya puedes ponerte las pilas. 

Porque los sesgos no solo tienen importancia a la hora de contar con modelos técnicamente sólidos sino, que tienen una gran relevancia cuando los aplicas a tu negocio. Un impacto en tu negocio, a veces silencioso, que puede directamente acabar con tu empresa.

Déjame que te ponga dos ejemplos para que veas lo que suponen los sesgos.

Imagínate que eres el director de seguridad del Ayuntamiento de tu ciudad y quieres crear un modelo para predecir dónde se va a producir el siguiente crimen. De esta forma podrías reorganizar las patrullas y localizarlas donde hay una mayor probabilidad de que ocurra un delito.

Así que coges el histórico de las denuncias que ponen tus policías, entrenas el modelo y empiezas a organizar los turnos en función de sus predicciones

 ¡Oh sorpresa! el modelo predice que el crimen se va a producir en las zonas más peligrosas de tu ciudad. Así que envías más policías, que a su vez ponen más denuncias.

El sesgo del “loop positivo” se basa en que al usar un dataset en el que históricamente ha habido más presencia policial en zonas deprimidas (y por tanto con más denuncias) creará un desequilibrio en el dataset hacia esas zonas. Así que al mandar más policías, que a su vez pondrán más denuncias estás generando un loop perverso mientras en el resto de la ciudad no estás combatiendo el crimen.

Otro sesgo más claro está relacionado con la raza y el género. 

Eres el director de un banco y quieres desarrollar un algoritmo que te permita anticipar qué cliente van a realizar un impago. Así que coges el histórico de tus operaciones y entrenas  un modelo.

Pero claro, si tus clientes históricos han sido hombres blancos de media edad, ya te puedes imaginar a quién te va a proponer que deniegues el crédito.

Hay más sesgos relacionados con cómo se ha generado el dataset de entrenamiento, la forma en la que el científico de datos selecciona las variables o la calidad de la información que estás utilizando. 

Aspectos que van a tener un impacto en la calidad de tus predicciones. Y en última instancia en tu negocio y en tus clientes. 

Y cuando hablamos de negocio no puedes echarle la culpa al “técnico”: Él ha hecho bien su trabajo. El proceso lo ha realizado de manera impecable. El algoritmo funciona perfectamente.  

Y es justo ahí donde está el peligro. Cuando todo parece ir bien, te confías.

Y la confianza ciega en la tecnología es peligrosa. Si no comprendes el razonamiento que hay detrás. Si no eres consciente de sus implicaciones. 

Por eso es tan importante que la Inteligencia Artificial se dirija desde el negocio y no desde IT. Porque sólo tú que conoces a tu cliente, que sabes cuáles son las claves de tu negocio y tienes la visión para dirigir al equipo técnico.

La otra opción es no hacer nada y esperar a que todo explote. 

Porque explotará.

Encantado de tener una conversación.

Iñaki Pertusa
Socio en DECIDATA

DECIDATA logo