Con más de 2.500 millones de cuentas de consumidores, Mastercard conecta a casi todas las instituciones financieras del mundo y genera casi 75.000 millones de transacciones al año. Como resultado, la compañía ha construido durante décadas un almacén de datos que contiene «uno de los mejores conjuntos de datos sobre comercio en cualquier parte del mundo», dice Ed McLaughlin, presidente de operaciones y tecnología de Mastercard..
Y la empresa está haciendo un buen uso de esos datos. La parte de más rápido crecimiento del negocio de Mastercard en la actualidad son los servicios que ofrece al comercio, dice McLaughlin.
Derek Hulitzky de IDG se sentó con McLaughlin y Mark Kwapiszeski, presidente de componentes compartidos y soluciones de seguridad en Mastercard, para discutir cómo la compañía convierte los datos anónimos y agregados en valiosos conocimientos comerciales y sus consejos para obtener los mejores resultados de los modelos de aprendizaje automático.
A continuación se encuentran extractos editados de su conversación. Para escuchar directamente de McLaughlin y Kwapiszeski y obtener información adicional, mire el video completo incluido a continuación.
Derek Hulitzky: La plataforma de gestión de decisiones de Mastercard ganó nuestro premio CIO 100 en 2020. Y utiliza inteligencia artificial y datos para la detección de fraudes. ¿Puedes contarnos más sobre la plataforma?
Mark Kwapiszeski: Lo usamos para varios propósitos, principalmente en nuestros productos de fraude para crear cosas como puntajes de fraude en transacciones. Pero lo realmente emocionante de la plataforma es el tamaño, la escala y el alcance de lo que hace. Se basa en unos 900 servidores básicos y procesa alrededor de 1.200 millones de transacciones por día a una velocidad de unas 65.000 transacciones por segundo, todo lo cual lo hace en unos 50 milisegundos por transacción.
Utiliza muchas tecnologías y técnicas de inteligencia artificial diferentes; utiliza alrededor de 13 algoritmos diferentes, que incluyen cosas como redes neuronales, razonamiento basado en casos y aprendizaje automático. Pero no se trata solo de ejecutar un modelo a la vez. De hecho, hemos construido capas, donde puede ejecutar varios modelos al mismo tiempo, de modo que pueda analizar todo tipo de variables diferentes dentro de esa transacción.
Derek Hulitzky: Ha descrito cómo sus modelos de análisis no son estáticos y que los monitorea continuamente para comprender qué está sucediendo con una transacción y por qué sucedió. ¿Puede describir lo que quiere decir con eso?
Mark Kwapiszeski: Cuando considera cada transacción que vemos, cada interacción, podría ser un fraude o podría ser una madre que intenta comprar medicamentos para su hijo. Cada transacción es importante. Entonces, siempre tenemos que saber no solo lo que sucedió, sino también el por qué detrás de lo que sucedió.
Y aunque los modelos tienden a aparecer en los titulares en conversaciones como esta, para mí son todas estas cosas en torno al modelo lo que realmente se vuelve interesante cuando piensas en cómo no solo sabes lo que sucedió, por qué sucedió y luego cómo mire eso con el tiempo para estar atento a cosas como la deriva del modelo.
Una de las mejores formas de ver si tienes un modelo que se desvía es colocando un modelo Challenger y observándolo durante un período de tiempo. Y, de hecho, lo hemos hecho durante períodos de más de un año antes, viendo un modelo, comparándolo con otro, para que realmente obtenga el mejor modelo y los mejores resultados posibles.
Derek Hulitzky: Mark, hablaste de la deriva. ¿Pueden hablar un poco, Ed y Mark, sobre cómo resuelven eso, cómo reaccionan?
Ed McLaughlin: Creo que a menudo la gente casi usa la metáfora incorrecta cuando habla de IA y modelado. Usan más una metáfora de código, donde lo construyes, lo ejecutas, y permanece bastante estático hasta que terminas al final de su vida útil en algún momento en el futuro. Mientras que vemos más con estos modelos que necesitan ser atendidos y monitoreados constantemente.
Mark Kwapiszeski: Sí, se manifiesta de dos formas. Tenemos un entorno analítico completo que está realmente dedicado a cuáles son esos productos y cuáles fueron los resultados. Y luego buscamos unir eso con el resultado final real de una transacción, porque a menudo no sabremos si una transacción aprobada realmente resulta ser un fraude hasta algún tiempo después.
Entonces, nuestros científicos de datos toman esa información de fraude y las señales que estamos recibiendo, y la comparan con esa información analítica de lo que el DMP [Decision Management Platform] está posponiendo los puntajes de fraude que tenemos, y luego constantemente buscan modificar esas dos cosas para encontrar el equilibrio adecuado.
Ed McLaughlin: Una última cosa que agregaría, porque si quieres asegurarte de que no estás a la deriva, debes tener claros tus conceptos. Probablemente recuerde, como consumidor, como titular de una tarjeta, hace años, muchos rechazos, muchas reglas realmente contundentes, porque el énfasis estaba en la lucha contra el fraude. Ahora, lo que estamos diciendo es … [make] asegúrese de que todo lo bueno llegue a su fin, mientras usted lucha contra el fraude simultáneamente.