Cómo una científica de datos es pionera en técnicas para detectar amenazas a la seguridad

Por: Joy Chik, vicepresidenta corporativa de Microsoft Identity.

La ciencia de los datos es un campo de estudio cada vez más popular que es relevante para todas las industrias. Cuando María Puertas Calvo era estudiante, nunca imaginó que algún día sería pionera en técnicas de ciencia de los datos para detectar amenazas a la seguridad. Comenzó su carrera en Microsoft en el equipo de Safety Platform, en el que desarrollaba algoritmos para identificar cuentas de Microsoft que envían correos electrónicos no deseados. Luego trabajó en el aprendizaje automático para detectar el compromiso de la cuenta en tiempo real para las cuentas de Microsoft.

María ahora lidera el equipo de ciencia de los datos para la seguridad en la división de identidad, donde trabaja en varios problemas: proteger a los usuarios del compromiso de la cuenta, proteger nuestra propia infraestructura del fraude y abuso, y asegurarse de que los spammers y los bots no creen cuentas que dañen a las personas u otras organizaciones. Su trabajo ha sido tan crítico que su equipo ha duplicado su tamaño, expandiéndose desde Redmond a Dublín y Atlanta.

Alex Simons, vicepresidente corporativo de Gestión de Programas de Identidad, se sentó con María para aprender más sobre su trabajo pionero y su inspiradora historia. La entrevista ha sido editada para mayor claridad y extensión.

Alex: María, ¿Cómo entraste en la ingeniería?

María: Soy originaria de Madrid, España. Siempre me interesaron las matemáticas y las ciencias. Desde que era pequeña, siempre fui la estudiante sobresaliente, en verdad estaba enamorada de los números. Cuando comencé a estudiar física en la escuela secundaria, supe que quería tener una carrera en ciencias, hacer algo innovador.

En España, no te vas a la universidad. Vas a clase durante el día y luego vuelves a la casa de tus padres por la noche. Una universidad en verdad buena estaba a solo 10 minutos de mi casa. No estaba centrada en la ingeniería, pero tenía una escuela técnica que ofrecía ingeniería eléctrica e informática.

Alex: ¿Qué te impulsó a hacer la transición de la ingeniería eléctrica pura a algo más centrado en la ciencia forense y luego, al final, en la ciencia de datos?

María: Todo fue bastante accidental, no algo que había planeado. Lo hice muy bien en la universidad, fui la primera en mi clase. Y terminé en 2010, en plena Gran Recesión, que afectó de manera terrible al mercado laboral español. En ese momento, la tasa de desempleo era del 25 por ciento. Los afortunados, como los ingenieros, recibían ofertas de trabajo. Pero cuando estás en tecnología, las únicas opciones en España son trabajar para una empresa de consultoría o hacer soporte o ventas. No había ningún trabajo de nivel de entrada en investigación y desarrollo.

Entonces, comencé una maestría con un grupo que investigaba biometría. La maestría también estaba en ciencias de la computación y estaba muy relacionada con la inteligencia artificial y muchos campos interconectados como el procesamiento de señales multimedia, la visión por computadora y el procesamiento del lenguaje natural. Hice mi tesis sobre estadísticas sobre huellas dactilares forenses y la probabilidad de una coincidencia aleatoria entre una huella dactilar latente encontrada en la escena del crimen y una persona al azar que podría haber sido condenada de manera errónea por ese crimen.

Alex: Entonces, ¿Cuál es la probabilidad de que eso suceda?

María: Es en verdad muy baja. Pero no es de cero.

Alex: ¡Vaya, eso es en verdad fascinante! Recuerdo que hiciste tu trabajo de posgrado aquí en los Estados Unidos, ¿verdad?

María: Cuando terminé la maestría, comenzaba a salir con mi ahora esposo, que es estadounidense. Y no quería terminar todo el doctorado. Quería trabajar en la industria porque ya había sido estudiante durante siete años, más el resto de mi vida antes de eso. También quería empezar una vida, y no hacer largas distancias entre Madrid y Washington, D.C. Entonces, aproveché mi beca para convertirme en investigadora visitante en la Universidad de Maryland para trabajar en biometría de reconocimiento de iris. Terminé quedándome unos nueve meses.

Alex: Oh, vaya. De hecho, mi padre obtuvo su doctorado en la Universidad de Maryland; yo nací allí. ¡Es un mundo pequeño! Entonces, cuéntanos cómo terminaste en Microsoft.

María: No encontré la academia muy gratificante. Entonces, dije: «Busquemos un trabajo en la industria». Vivía en los Estados Unidos con mi prometido con una visa de estudiante. Y en el área de D.C., la mayoría de las empresas de tecnología son contratistas del gobierno que requieren autorizaciones de seguridad, que solo los ciudadanos estadounidenses pueden obtener. Tampoco tenía experiencia alguna en la industria.

Pasé un par de meses en la búsqueda de trabajo y nunca me llamaron. Luego, de la nada, recibí un mensaje de LinkedIn de un reclutador de Microsoft que decía: «Oye, tengo un puesto de científico de datos en el equipo de Safety Platform en Seattle». Y yo estaba como, «Seattle, no, de ninguna manera». Todo lo que sabía de Seattle es que llueve mucho y está al otro lado del país. Y está tan lejos de España. Pero mi esposo dijo: «Oye, tienes una entrevista, hazlo, mira cómo te va, podrás practicar».

Alex: En el equipo de Safety Platform realizaste un trabajo innovador que ha sido la base del éxito que hemos tenido hasta ahora. Cuéntanos un poco más.

María: Trabajé en aprendizaje automático para detectar compromisos en tiempo real para las cuentas de Microsoft. Cuando un usuario iniciaba sesión en su cuenta de Outlook.com o su cuenta de Xbox, o en cualquier servicio que ofreciera Microsoft, ejecutamos un modelo de aprendizaje automático (ML, por sus siglas en inglés) para determinar si ese inicio de sesión era legítimo o si algún pirata informático había obtenido la contraseña del usuario. Yo era el científico de datos que trabajaba en entrenar el modelo y mejorar su precisión. Aunque dejé de trabajar en él hace un tiempo, todavía lo monitoreamos y funciona muy bien.

Alex: En ese momento, nadie más en la industria tenía éxito en este tipo de trabajo. Hoy en día, existe toda una industria en torno a la analítica del comportamiento de las entidades de usuario, pero tú fuiste una de los primeras en el mundo en hacerlo. Me encanta el trabajo que hace tu equipo, María. Siento que son superhéroes que defienden el mundo, pero no sé si nuestros clientes tienen una gran visión del tipo de magia que hacen.

María: Gracias, Alex. Utilizamos la analítica y el aprendizaje automático para detectar una mala actividad en el ecosistema de identidad. Nuestro objetivo es proteger a nuestros clientes del fraude y el compromiso de la cuenta mediante técnicas avanzadas de inteligencia artificial y ciencia de datos. Creamos formas de detectar ataques maliciosos, fraudes o compromisos de cuentas entre todos los datos de seguridad que examinamos en Microsoft, que son cientos de terabytes todos los días. Es un problema complicado, pero es realmente genial.

Alex: Algunos de tus trabajos recientes más innovadores fueron sobre la detección de rociado contraseñas. ¿Puedes decirnos cómo tener datos de varios clientes te permite detectar cosas que tal vez nadie más podría?

María: En un ataque de rociado de contraseñas, una persona toma una lista de direcciones de correo electrónico que encuentra o recopila de una brecha de seguridad. Y luego prueban algunas contraseñas comunes con todas esas direcciones de correo electrónico, con miles de usuarios de miles de organizaciones.

Sabíamos que estos ataques les ocurrían a nuestros clientes, pero queríamos detectarlos con mucha precisión. Estos ataques se extienden por toneladas de diferentes direcciones IP, países y servidores proxy, por lo que no es fácil aislar los inicios de sesión que forman parte de un ataque real. Creamos una regla de detección que dice: «Está bien, vemos direcciones IP que tienen muchos inicios de sesión fallidos y que todos usan la misma contraseña». Y luego vemos que estos intentos se trasladan a una contraseña diferente.

Al hacer eso, podemos aislar un posible ataque, pero también hay mucho ruido. Entonces, uno de los increíbles científicos de datos de mi equipo, Sergio, agregó una capa de inteligencia artificial y entrenó un modelo con ataques conocidos. Mejoró la precisión de la heurística inicial en un 50 por ciento.

Alex: Este es un conjunto de capacidades clave muy importante para nosotros. Estoy muy emocionado de que hagamos crecer a tu equipo. En otro tema, otra cosa que tú y yo compartimos es la alegría de ser padres de gemelos. Claro que, mis gemelos son mucho mayores que los tuyos, pero cuéntanos cómo manejas el desafío de: «Oye, quiero ser una persona de familia y también quiero ser un verdadero líder en la industria».

María: ¡Todavía trato de averiguarlo! En definitiva es mucho trabajo y tienes que aprender a administrar mejor tu tiempo para tener éxito en ambos trabajos. Por fortuna, Microsoft ofrece una excelente licencia parental que tanto mi esposo como yo podríamos disfrutar (él es un ingeniero en Azure). Tengo un equipo increíble y mantuvieron las cosas en funcionamiento sin problemas durante mi ausencia. Además, trabajar de forma remota debido a la pandemia me ha facilitado las cosas. Puedo controlar a mis hijos entre reuniones, y no tener un viaje diario me da más tiempo para estar con mi familia.

Alex: La pandemia en definitiva ha acelerado el paso al trabajo remoto. Como padre, creo que es maravilloso poder administrar tu tiempo y no tener que preocuparte por tu ubicación.

Entonces, María, una última pregunta. Digamos que soy un estudiante universitario, o tal vez trabajo en mi maestría o doctorado en ciencia de datos e inteligencia artificial. Si quisiera trabajar en su equipo, ¿En qué me sugerirías trabajar o en qué pensar para prepararme para ese tipo de trabajo?

María: Un buen enfoque es encontrar una pasantía que tenga alguna conexión entre la ciencia de datos y la seguridad y el fraude, incluso si está relacionado de manera vaga. En este momento, hay tanta gente que estudia ciencia de datos y aprendizaje automático, por lo que es importante especializarse y comprender en verdad el mundo de la nube y la ciberseguridad. Hay toneladas de recursos solo para aprender sobre ello, como cursos específicos de ciberseguridad. Una pasantía no tiene que ser específica para la seguridad extrema; podría ser sobre fraude, como un fraude financiero. Cualquier cosa en un mundo de tipo adversario en el que intentas detectar cosas malas que suceden sería útil. Las pasantías son más fáciles de conseguir sin ningún tipo de especialización, pero haberlas hecho te da un pie en la puerta para un puesto de tiempo completo que se especializa en ciberseguridad. Además, Microsoft Security patrocina muchos programas educativos de ciberseguridad y yo animaría a las mujeres en la escuela secundaria a investigarlos.

Conozcan más

Para obtener más información sobre las soluciones de seguridad de Microsoft, visiten nuestro sitio web. Agreguen a Favoritos el blog de Seguridad para mantenerse al día con nuestra cobertura experta en asuntos de seguridad. Además, síganos en @MSFTSecurity para conocer las últimas noticias y actualizaciones sobre ciberseguridad.

Cómo una científica de datos es pionera en técnicas para detectar amenazas a la seguridad

Publicaciones Relacionadas