Oracle anuncia MySQL HeatWave ML: la forma más fácil, rápida y económica para que los desarrolladores incluyan potentes capacidades de aprendizaje automático a sus aplicaciones MySQL
HeatWave ML automatiza completamente el entrenamiento, la inferencia y la explicación del modelo
HeatWave ML es 25 veces más rápido que Amazon Redshift ML y a solo un 1% del costo
Santo Domingo, República Dominicana. Abril 2022— Oracle anuncia que Oracle MySQL HeatWave ahora es compatible con el aprendizaje automático en la base de datos, además del procesamiento y análisis de transacciones disponibles previamente, es el único servicio de base de datos en la nube de MySQL que lo hace. MySQL HeatWave ML automatiza completamente el ciclo de vida del aprendizaje automático y almacena todos los modelos entrenados dentro de la base de datos MySQL, y así elimina la necesidad de migrar datos o el modelo a una herramienta o servicio de aprendizaje automático. La eliminación de ETL reduce la complejidad de la aplicación, minimiza los costos y mejora la seguridad de los datos y del modelo. HeatWave ML se incluye con el servicio en la nube de la base de datos MySQL HeatWave en las 37 regiones de Oracle Cloud Infrastructure (OCI).
Hasta ahora, agregar capacidades de aprendizaje automático a las aplicaciones MySQL ha sido difícil y lento para muchos desarrolladores. Primero está el proceso de extraer información de la base de datos y llevarla a otro sistema para crear e implementar modelos de aprendizaje automático. Este enfoque genera múltiples silos para aplicar el aprendizaje automático a los datos de la aplicación e introduce latencia a medida que los datos se mueven. También lleva a la proliferación de información fuera de la base de datos, lo que la hace más vulnerable a las amenazas de seguridad y añade complejidad para que los desarrolladores programen en múltiples entornos. En segundo lugar, los servicios existentes esperan que los desarrolladores sean expertos en guiar el proceso de capacitación del modelo de aprendizaje automático. De lo contrario, el modelo es subóptimo, lo que disminuye la precisión de las predicciones. Finalmente, la mayoría de las soluciones de aprendizaje automático existentes no incluyen una funcionalidad para brindar explicaciones de por qué los modelos que los desarrolladores crean ofrecen predicciones específicas.
MySQL HeatWave ML resuelve estos problemas mediante la integración nativa de las capacidades de aprendizaje automático dentro de la base de datos MySQL, lo que elimina la necesidad de ETL de los datos a otro servicio. HeatWave ML automatiza completamente el proceso de entrenamiento y genera un modelo con el mejor algoritmo, características óptimas e hiperparámetros ideales para un determinado conjunto de datos y una tarea específica. Todos los modelos generados por HeatWave ML pueden ofrecer explicaciones de modelos y predicciones.
Ningún otro proveedor de bases de datos en la nube proporciona capacidades de aprendizaje automático tan avanzadas dentro del servicio de base de datos. Las pruebas comparativas de aprendizaje automático de Oracle publicadas se realizaron en varios conjuntos de datos de clasificación y regresión de aprendizaje automático disponibles públicamente, como Numerai, Namao y Bank Marketing, entre otros. En promedio, en el clúster más pequeño, HeatWave ML entrena modelos de aprendizaje automático 25 veces más rápido al 1% del costo de Redshift ML. Además, la ventaja de rendimiento sobre Redshift ML aumenta cuando el entrenamiento se realiza en un clúster HeatWave más grande. La capacitación es un proceso que requiere mucho tiempo y, ya que se puede realizar de manera muy eficiente y rápida con MySQL HeatWave, ahora los clientes pueden volver a entrenar sus modelos con mayor frecuencia y mantenerse al día con los cambios en los datos. Esto hace que los modelos se mantengan actualizados y que mejore la precisión de las predicciones.
“Así como integramos análisis y procesamiento de transacciones en una sola base de datos, ahora estamos incorporando el aprendizaje automático dentro de MySQL HeatWave”, dijo Edward Screven, arquitecto corporativo principal de Oracle. “MySQL HeatWave es uno de los servicios en la nube de más rápido crecimiento en Oracle. Cada vez más clientes migran desde Amazon y otros servicios de bases de datos en la nube a MySQL HeatWave y han obtenido mejoras significativas en el rendimiento y costos reducidos. Hoy también estamos anunciando una serie de innovaciones que enriquecen las capacidades de HeatWave, mejoran la disponibilidad y reducen el costo. Nuestros resultados de referencia nuevos y totalmente transparentes demuestran nuevamente que Snowflake, AWS, Microsoft y Google son más lentos y más costosos que MySQL HeatWave por un amplio margen”.
HeatWave ML ofrece las siguientes capacidades en comparación con otros servicios de bases de datos en la nube:
Entrenamiento de modelos completamente automatizado: todas las etapas de la creación de un modelo con HeatWave ML están completamente automatizadas y no requieren ninguna intervención de los desarrolladores. Esto da como resultado un modelo ajustado y más preciso, que no requiere trabajo manual y cuyo proceso de entrenamiento siempre se completa. Otros servicios de bases de datos en la nube, como Amazon Redshift, brindan integración con capacidades de aprendizaje automático en servicios externos, que requieren intervenciones manuales de los desarrolladores durante el proceso de entrenamiento del aprendizaje automático.
Explicaciones de modelo e inferencia: la capacidad de explicación del modelo ayuda a los desarrolladores a comprender el comportamiento de un modelo de aprendizaje automático. Por ejemplo, si un banco niega un préstamo a un cliente, el banco debe poder determinar qué parámetros del modelo se tomaron en cuenta o si tiene algún sesgo. La explicabilidad de las predicciones es un conjunto de técnicas que ayudan a responder a la pregunta de por qué un modelo de aprendizaje automático realizó una predicción en particular. Las explicaciones de predicción son cada vez más importantes hoy en día, pues las empresas deben poder explicar las decisiones que han tomado sus modelos de aprendizaje automático. HeatWave ML integra la explicación del modelo y las explicaciones de predicción como parte de su proceso de entrenamiento. Como resultado, los modelos creados por HeatWave ML pueden ofrecer explicaciones del modelo y de la inferencia, sin necesidad de datos de entrenamiento, al momento de la explicación de la inferencia. Oracle ha aumentado las técnicas de explicación existentes para mejorar el rendimiento, la interpretabilidad y la calidad. Otros servicios de bases de datos en la nube no ofrecen una explicación tan rica para sus modelos de aprendizaje automático.
Ajuste de hiperparámetros: HeatWave ML implementa un nuevo algoritmo de reducción basado en la búsqueda de gradientes para el ajuste de hiperparámetros. Esto permite que la búsqueda de hiperparámetros se ejecute en paralelo sin poner en riesgo la precisión del modelo. El ajuste de hiperparámetros es la etapa más larga del entrenamiento del modelo de aprendizaje automático, y esta capacidad única proporciona HeatWave ML una ventaja significativa sobre otros servicios en la nube para construir modelos de aprendizaje automático.
Selección de algoritmo: HeatWave ML utiliza la noción de modelos proxy, que son modelos simples que exhiben las propiedades de uno complejo para determinar el mejor algoritmo de aprendizaje automático para el entrenamiento. Con un modelo de proxy simple, la selección de algoritmos se realiza de manera muy eficiente y sin perder precisión. Ningún otro servicio de base de datos para crear modelos de aprendizaje automático tiene esta capacidad de modelado proxy.
Muestreo inteligente de datos: durante el entrenamiento del modelo, HeatWave ML muestrea un pequeño porcentaje de los datos para mejorar el rendimiento. Este muestreo se lleva a cabo de tal manera que todos los puntos de datos representativos se capturan en el conjunto de datos de muestra. Otros servicios en la nube para crear modelos de aprendizaje automático adoptan un enfoque menos eficiente (usando muestreo aleatorio de datos) que extrae un pequeño porcentaje de datos sin considerar las características de su distribución.
Selección de funciones: la selección de funciones ayuda a determinar los atributos de los datos de entrenamiento que influyen en el comportamiento del modelo de aprendizaje automático para predicciones. Las técnicas de HeatWave ML para la selección de funciones se han entrenado en un amplio conjunto de juegos de datos en varios dominios y aplicaciones. A partir de estas estadísticas y metainformación recopiladas, HeatWave ML puede identificar eficientemente las características relevantes en un nuevo conjunto de datos.
Además de las capacidades de aprendizaje automático, Oracle lanzó más innovaciones para el servicio MySQL HeatWave. La elasticidad en tiempo real permite a los clientes aumentar y reducir el tamaño de su clúster HeatWave a cualquier cantidad de nodos, sin tiempo de inactividad o tiempo de solo lectura, y sin la necesidad de reequilibrar manualmente el clúster. También está incluida la compresión de datos, quepermite a los clientes procesar el doble de datos por nodo y reduce los costos en casi un 50%., manteniendo la misma relación precio-rendimiento. Finalmente, las funciones de pausar y reanudar permiten a los clientes pausar HeatWave para ahorrar costos. Al reanudar, tanto los datos como las estadísticas necesarias para MySQL Autopilot se vuelven a cargar automáticamente en HeatWave.
Un impulso para clientes y socios en MySQL HeatWave
Astute Business Solutions es uno de los principales aliados de Oracle Cloud MSP. “Recientemente tuvimos la oportunidad de utilizar las capacidades de HeatWave ML. Nos parece muy innovador, fácil de usar, rápido y, lo que es más importante, seguro, pues los datos o el modelo no dejan la base de datos”, dijo Arvind Rajan, cofundador y director ejecutivo de Astute Business Solutions. “Creemos que proporcionar aprendizaje automático en la base de datos es fundamental para nuestros clientes y acelerará aún más la adopción de MySQL HeatWave”.
Estuda.com es un proveedor educativo de SaaS para pruebas de estudiantes K-12 en Brasil. “MySQL HeatWave mejoró 300 veces nuestro rendimiento de consultas complejas para obtener respuestas en segundos, y al 85% del costo comparado con Google BigQuery sin cambios en el código. Ahora podemos ofrecer mejor análisis en tiempo real a una escala de tres millones de usuarios y mejorar continuamente nuestra aplicación para mejorar el rendimiento de los estudiantes”, dijo Vitor Freitas, cofundador y director de tecnología de Estuda.com.
VRGlass es un productor brasileño de SaaS de aplicaciones y equipos del metaverso para clientes corporativos. “Motivados por el progreso logrado dentro del programa Oracle for Startup, VRGlass migró todos los datos de la aplicación a MySQL HeatWave desde AWS EC2. En tres horas logramos quintuplicar el rendimiento de la base de datos para un evento virtual que recibió a más de un millón de visitantes y 1,7 millones de sesiones con mayor seguridad y a la mitad del costo”, dijo Ohmar Tacla, director ejecutivo de VRGlass.
Genius Sonority es diseñador, desarrollador y operador de videojuegos en Japón. “Descubrimos que MySQL HeatWave mejoró el rendimiento 90 veces, lo que resolvió los desafíos e inquietudes que teníamos al mover datos para ejecutar análisis en tiempo real. Nos sorprendió mucho. Las mejoras extremas en el rendimiento nos ayudan a mejorar continuamente la experiencia de juego para el entretenimiento de clientes en todo el mundo”, dijo Masayuki Kawamoto, director de tecnología, Genius Sonority.
Neovera es un proveedor reconocido de soluciones de ciberseguridad gestionada desde hace más de 20 años. “MySQL HeatWave en OCI aumentó nuestro rendimiento de consultas 300 veces, con una reducción del costo total de propiedad del 80% en comparación con nuestro entorno de base de datos MySQL local. Ahora podemos generar informes de análisis en tiempo real dentro de nuestra base de datos OLTP para acelerar la mejora de nuestra aplicación de seguridad”, dijo Arman Rawls, Sr. Oracle Database Architect, Neovera Inc.
“Oracle anunció MySQL HeatWave con Autopilot en agosto pasado, que muy bien podría haber sido la mayor innovación individual en bases de datos en la nube de código abierto en los últimos 20 años hasta ese momento”, dijo Carl Olofson, vicepresidente de investigación, software de gestión de datos, IDC. “Ahora Oracle ha llegado más allá de la unificación original de OLTP y OLAP en HeatWave con MySQL HeatWave ML. Oracle está incorporando todo el procesamiento y los modelos de aprendizaje automático a la base de datos, de modo que los clientes no solo evitan administrar las bases de datos de aprendizaje automático aparte de la base de datos central, sino que también eliminan las molestias de ETL, adquiriendo velocidad, precisión y rentabilidad para el negocio”.
Acerca de Oracle
Oracle ofrece conjuntos integrados de aplicaciones, además de una infraestructura segura y autónoma en Oracle Cloud. Para obtener más información sobre Oracle (NYSE: ORCL), visítanos en www.oracle.com.
Recursos adicionales
- Mira el Oracle Live con Edward Screven
- Ejecuta tus propias pruebas comparativas aquí
- Mira el video explicativo de MySQL HeatWave
- Lee el blog técnico para obtener más información, incluidas las pruebas comparativas de TPC-DS*
- Lee el informe técnico de MySQL HeatWave ML
Marcas registradas
Oracle, Java y MySQL son marcas comerciales registradas de Oracle Corporation.
* Las prueas comparativas se derivan de la referencia TPC-DS, pero los resultados no son comparables a los resultados publicados de la referencia TPC-DS, ya que no cumplen con la especificación TPC-DS.