Entregar IA con datos: la siguiente generación de la plataforma de datos de Microsoft

Por: Joseph Sirosh, Vicepresidente Corporativo del Grupo de Datos de Microsoft.

Aprovechar la inteligencia de las cada vez más grandes cantidades de datos, puede hacer la diferencia entre ser el siguiente disruptor del mercado o ser relegado a las páginas de la historia. En el evento en línea Microsoft Data Amp, hicimos diferentes anuncios de producto que pueden ayudar a impulsar a cada organización en el planeta con inteligencia dirigida por datos. Entregamos una plataforma completa de datos para que los desarrolladores y negocios creen la siguiente generación de aplicaciones inteligentes que lleven a nuevas eficiencias, ayuden a crear mejores productos y mejoren las experiencias de los clientes.

Los invito a ver la transmisión del evento Data Amp, donde Scott Guthrie, Vicepresidente Ejecutivo de Nube y Empresa, y yo, describiremos las innovaciones de producto que integran datos con inteligencia artificial (AI) para transformar sus aplicaciones y sus negocios. Pueden transmitir y acceder a contenido técnico adicional bajo demanda para aprender más sobre los anuncios que realizaremos hoy.

En este día, vimos tres temas clave de innovación en nuestros anuncios de producto. El primero es la cercana integración de funciones de IA dentro de bases de datos, lagos de datos y la nube, para simplificar la implementación de aplicaciones inteligentes. El segundo es el uso de la IA dentro de nuestros servicios para mejorar el desempeño y la seguridad de los datos. El tercero es la flexibilidad, para que los desarrolladores produzcan múltiples servicios de nube en diferentes patrones de diseño para AI, y la flexibilidad de aprovechar Windows, Linux, Python, R, Spark, Hadoop, y otras herramientas de código abierto para construir dichos sistemas.

Hospedar la IA donde viven los datos

Un nuevo hilo de innovación que verán en nuestros productos es la profunda integración de la IA con los datos. En el pasado, un patrón común de aplicación era crear modelos estadísticos y analíticos fuera de la base de datos en la capa de la aplicación o en herramientas estadísticas especializadas y luego implementar esos modelos en sistemas de producción a la medida. Esto resultaba en un gran trabajo de desarrollo y la implementación y el ciclo de vida de la misma, podían tomar meses. Nuestro enfoque simplifica de manera importante la implementación de IA al traer inteligencia hacia plataformas de datos existentes con una buena ingeniería a través de un nuevo modelo computacional: aprendizaje profundo de GPU. Hemos tomado ese enfoque con el próximo lanzamiento de SQL Server, y hemos integrado de manera importante el aprendizaje profundo y las capacidades de aprendizaje automático para apoyar a la siguiente generación de aplicaciones de IA de grado empresarial.

De esta manera, anunciamos el primer RDBMS con IA integrada, una Community Technology Preview (CTP 2.0) de calidad de producción, de SQL Server 2017. En este lanzamiento de versión previa, introducimos soporte en la base de datos para una rica librería de funciones de aprendizaje automático, y ahora por primera vez, soporte para Python (junto con R). SQL Server ahora puede aprovechar el cómputo acelerado por GPU NVIDIA a través de la interfaz Python/R para impulsar incluso los trabajos más intensivos de aprendizaje profundo en imágenes, texto, y otros datos sin estructura. Los desarrolladores pueden implementar analítica acelerada por GPU NVIDIA y una muy sofisticada IA, directo en el servidor de base de datos como procedimientos almacenados y obtener órdenes de producción de magnitud mayor. Además, los desarrolladores pueden utilizar todas las ricas características del sistema de administración de base de datos para concurrencia, alta disponibilidad, encriptación, seguridad, y cumplimiento de normas par construir e implementar aplicaciones robustas de grado empresarial.

También hemos lanzado Microsoft R Server 9.1, que toma el concepto de llevar inteligencia hacia donde vivan sus datos a Hadoop y Spark, así como a SQL Server. En adición a diferentes algoritmos de aprendizaje automático avanzado de Microsoft, R Server 9.1 introduce modelos pre-entrenados de redes neurales para análisis de sentimientos y representación de imágenes, soporta SparklyR, SparkETL, y SparkSQL, y GPU para redes neurales profundas. También hacemos más sencilla la administración de modelos con muchas mejoras a la implementación de producción y operación. R Tools para Visual Studio brinda un IDE de vanguardia para que los desarrolladores trabajen con Microsoft R Server. Y también está disponible una imagen de Azure Microsoft R Server V, que permite a los desarrolladores abastecer de manera rápida el servidor en la nube.

En la nube, Microsoft Cognitive Services les permite infundir sus aplicaciones con inteligencia cognitiva. Hoy, me emociona anunciar que la API Face, la API Computer Vision y Content Moderator, están disponibles a nivel general en Azure Portal. Aquí algunos de los diferentes tipos de inteligencia que los servicios cognitivos pueden traer a su aplicación:

  • La API Face ayuda a detectar y comparar rostros humanos, organiza rostros en grupos de acuerdo a su similitud visual e identifica a gente que ha sido etiquetada de manera previa en imágenes.
  • La API Computer Vision les brinda las herramientas para entender los contenidos en cualquier imagen: Crea etiquetas que identifican objetos, seres como celebridades o acciones en una imagen, y elabora enunciados coherentes para describirlos. Ahora pueden detectar lugares emblemáticos y escritura a mano en imágenes. La detección de escritura a mano se mantiene como versión previa.
  • Content Moderator brinda una moderación asistida por máquina, de texto e imágenes, aumentada con herramientas de revisión humana.

Azure Data Lake Analytics (ADLA) es un servicio innovador de trabajo de analítica sin servidor en el que ustedes pueden desarrollar y correr, de manera sencilla, programas de transformación de datos a escala de petabytes que constituyen U-SQL, R, Python, y .NET. Sin infraestructura que manejar, ustedes pueden procesar datos bajo demanda, escalar de manera instantánea, y pagar sólo por trabajo. Más aún, hemos incorporado la tecnología que se coloca detrás de Cognitive Services, dentro de U-SQL, directo, como funciones. Ahora, ustedes pueden procesar datos masivos sin estructura, como texto/imágenes, extraer sentimiento, edad, y otras características cognitivas, a través de Azure Data Lake, y solicitar/analizar esto por contenido. Esto habilita lo que llamo “Big Cognition”, algo que no sólo es extraer una pieza de información cognitiva a la vez, y no sólo se trata de entender una emoción o si hay un objeto en una imagen individual, también se trata de integrar todos los datos cognitivos extraídos con otros tipos de datos, para que puedan realizar poderosas uniones, analítica, e IA integrada.

Azure Data Lake Store (ADLS) es un sistema de almacenamiento HDFS en la nube sin límite que trabaja con ADLA y otros servicios de big data para datos de escala de petabytes. Anunciamos la disponibilidad general de Azure Data Lake Analytics y Azure Data Lake Store en la región Azure North Europe.

Todavía más, otra poderosa integración de datos e IA es la de DocumentDB con Spark, que habilita el aprendizaje automático y la analítica avanzada por encima de los datos distribuidos a nivel global. Para recapitular, DocumentDB es un servicio de base de datos NoSQL en Azure único, distribuido a nivel global, sin límites, diseñado para aplicaciones de misión crítica. Diseñado como tal desde cero, permite a los clientes distribuir sus datos a través de cualquier número de regiones Azure a nivel mundial, garantiza baja lectura y latencia escrita, y ofrece SLA completos para pérdida de datos, latencia, disponibilidad, consistencia y rendimiento. Pueden utilizarlo como su base de datos operacional primaria o como un lago de datos indexado de manera automática y casi infinito. El conector Spark entiende la estructura física de la tienda DocumentDB (indexación y partición) y habilita el pushdown computacional para un procesamiento eficiente. Este servicio puede simplificar de manera significativa, el proceso de construir aplicaciones distribuidas e inteligentes a escala global.

También anunciamos la disponibilidad general de Azure Analytics Service. Construido en el probado motor de inteligencia de negocios (BI) en Microsoft SQL Server Analysis Services, entrega capacidades de modelado semántico de BI de grado empresarial con la escala, flexibilidad, y beneficios de administración de la nube. Azure Analysis Services les ayuda a integrar datos desde diferentes fuentes, por ejemplo, Azure Data Lake, Azure SQL DW, y una variedad de bases de datos en sitio y en la nube, y transformarlas en información de valor accionable. Acelera el tiempo de entrega de sus proyectos de BI al remover la barrera de procuración y administración de infraestructura. Y al aprovechar las habilidades de BI, herramientas y datos con los que su equipo cuenta hoy en día, ustedes pueden obtener más de las inversiones que ya han realizado.

Incrementar el desempeño y la seguridad

El desempeño y la seguridad son centrales para las bases de datos. SQL Server se mantiene como líder en comparaciones de desempeño de bases de datos, y en cada lanzamiento realizamos mejoras significativas. SQL Server 2016 en Windows Server 2016 mantiene diferentes récords en las comparaciones de Transaction Processing Performance Council (TPC) por desempeño de carga de trabajo analítica y operativa, y SQL Server 2017 lo hace aún mejor. También me enorgullece anunciar que la siguiente versión de SQL Server correrá igual de rápido en Linux y en Windows, como lo podrán ver en la recién publicada comparación de 1TB TPC-H para el récord mundial de desempeño de datos de almacén sin clúster, conseguido con SQL Server 2017 en Red Hat Enterprise Linux y hardware HPE ProLiant.

SQL Server 2017 también incluirá desempeño de vanguardia, escala, y características de seguridad para el almacenamiento de datos. Con consultas analíticas hasta 100 veces más rápidas que utilizan Columnsotres en memoria, PolyBase para consultas sencillas T-SQL a través de sistemas relacionales y Hadoop, la capacidad de escalar a cientos de terabytes de datos, reporteo moderno, además de BI móvil y más, brinda una poderosa plataforma de datos integrados para todas sus necesidades de analítica empresarial.

En la nube, Azure SQL Database trae inteligencia para asegurar sus datos e incrementar el desempeño de la base de datos. Threat Detection en Azure SQL Database trabaja en todo momento, y utiliza aprendizaje automático para detectar actividades anómalas de base de datos que indican intentos inusuales y potencialmente dañinos, para acceder o explotar bases de datos. Con sólo activar Threat Detection, se ayuda a los clientes a hacer las bases de datos resistentes a la posibilidad de una intrusión. Otras características de Azure SQL Database como afinación de auto desempeño implementan de manera automática, afinación, y validan el desempeño para garantizar el desempeño más óptimo de consultas. En conjunto, nuestras características de administración inteligente de base de datos ayudan a hacer su base de datos más segura y más rápida, en automático, para liberar la escasa capacidad DBA para un trabajo más estratégico.

Soluciones de multiservicio IA simples, flexibles, y en la nube

Estamos muy comprometidos con simplificar el desarrollo de sistemas de IA. Cortana Intelligence es una colección de servicios de big data y analítica administrados por completo, que pueden ser producidos en conjunto para construir en Azure, aplicaciones sofisticadas de IA y analítica de grado empresarial. Hoy anunciamos plantillas de solución de Cortana Intelligence que facilitan producir servicios e implementar patrones comunes de diseño. Estas plantillas de soluciones han sido construidas en diseños de mejores prácticas motivados por implementaciones de clientes en el mundo real, realizadas por nuestro equipo de ingeniería, e incluyen Personalized Offers (por ejemplo, para aplicaciones de minoristas), Quality Assurance (por ejemplo, para aplicaciones de manufactura), y Demand Forecasting. Estas plantillas aceleran su tiempo a valor para una solución inteligente, para permitirles implementar una arquitectura compleja en minutos, en lugar de días. Las plantillas son flexibles y escalables por diseño. Pueden personalizarlas de acuerdo a sus necesidades específicas, y están apoyadas por un rico ecosistema de socios entrenados en la arquitectura y modelos de datos. Comiencen hoy visitando la galería de Azure para soluciones de Cortana Intelligence.

También, AppSource es un destino sencillo para descubrir y probar de manera constante, aplicaciones de negocios construidas por socios y verificadas por Microsoft. Socios como KenSci ya han comenzado a mostrar sus soluciones inteligentes que están enfocadas en los tomadores de decisión en AppSource. Ahora los socios pueden enviar aplicaciones de Cortana Intelligence en la página “List an app” de AppSource.

Diferentes plataformas y flexibilidad en código abierto

Ya sea en sitio o en la nube, la compatibilidad entre plataformas es cada vez más importante en los estados cada vez más cambiantes y diversos de los datos de nuestros clientes. SQL Server 2017 será la primera versión de SQL Server que es compatible con Windows, Linux, e imágenes de contenedor basadas en Linux para Docker. Además de correr en Windows Server, la nueva versión también correrá en Red Hat Enterprise Linux, SUSE Enterprise Linux Server, y Ubuntu. También puede correr dentro de contenedores de Docker en Linux o Mac, lo que puede ayudar a sus desarrolladores a que pasen más tiempo en desarrollo y menos en DevOps.

Para comenzar

Nunca había sido tan fácil comenzar con los avances más recientes en la plataforma inteligente de datos. Los invitamos a unirse a nosotros para aprender más sobre SQL Server 2017 en Windows, Linux, e imágenes de contenedor basadas en Linux para Docker; Cognitive Services para API inteligentes y flexibles para IA; transformación e inteligencia escalables de datos de Azure Data Lake Store y Azure Data Lake Analytics; el enfoque de Azure SQL Database para una detección proactiva de amenazas y afinación inteligente de base de datos; nuevas plantillas de solución de Cortana Intelligence, y modelos pre-calibrados para Linux, Hadoop, Spark, y Teradata en R Server 9.1.

¡Entren a nuestro micrositio de Data Amp para conocer más! También podrán ver la transmisión de conferencias y ver el contenido técnico adicional bajo demanda que ya está disponible. Espero que participen en esta emocionante jornada de infundir inteligencia e IA en cada aplicación de software.