SoftNER AI de Microsoft utiliza aprendizaje desatendido para solucionar problemas de interrupciones del servicio en la nube


Realice la última encuesta de VB para compartir cómo su empresa está implementando la IA hoy.


Microsoft utiliza técnicas de aprendizaje sin supervisión para extraer conocimiento sobre las interrupciones del servicio en la nube. En un artículo publicado en el servidor de preimpresión Arxiv.org, los investigadores de SoftNER describen un marco que fue proporcionado internamente por Microsoft para recopilar información sobre 400 fallos de almacenamiento, informática y otras fallas en la nube. Afirman que ya no es necesario anotar una gran cantidad de datos de entrenamiento mientras se escala a un alto volumen de tiempos de espera, conexiones lentas y otras interrupciones del producto.

La información estructurada tiene un valor inherente, especialmente en la nube y la operación web con dominios de alto uso. No solo se puede usar para crear modelos de inteligencia artificial personalizados para tareas como el triaging, sino que también puede ahorrar tiempo y esfuerzo para los ingenieros al automatizar procesos como realizar comprobaciones de recursos.

El marco SoftNER intenta extraer conocimiento analizando y reconociendo entidades de texto no estructuradas en descripciones de fallas y clasificación de entidades en categorías. Se utilizan componentes que identifican patrones de estructura en las descripciones para iniciar los datos de entrenamiento, así como la propagación de etiquetas y un modelo multitarea para generalizar datos más allá de los patrones y extraer entidades de las descripciones.

SoftNER comienza cada ejecución con ruidos de eliminación de datos. SoftNER registra declaraciones de incidentes, conversaciones, seguimientos de apilamiento, scripts de shell y resúmenes de fuentes como clientes de Microsoft, ingenieros de características y sistemas de vigilancia automatizados, y normaliza las descripciones recortando tablas con más de dos columnas y eliminando etiquetas innecesarias (como etiquetas HTML). . Luego, las descripciones se dividen en oraciones y las oraciones se dividen en palabras.

Después de realizar el etiquetado de entidades (por ejemplo, tipos de problemas, mensajes de excepción, ubicaciones y códigos de estado, y etiquetado de tipos de datos (para direcciones IP, URL, ID de suscripción) y más), SoftNER pasa los tipos de valores de entidad a todas las descripciones de incidentes. Por ejemplo, si la dirección IP "127.0.0.1" se extrae como la entidad "IP de origen", se marcarán todas las apariciones no marcadas de "127.0". 0.1 "como" IP de origen ".

En experimentos, los investigadores evaluaron el desempeño de SoftNER señalando 41,000 fallas de Microsoft durante un período de dos meses de" grandes sistemas en línea "con" una amplia distribución de usuarios ". Contienen un promedio de 472 palabras. Informan que el marco ha logrado extraer 77 entidades válidas por 100 de las descripciones con una precisión de más del 96% (un promedio de más de 70 tipos de entidades diferentes). También dicen que SoftNER es lo suficientemente preciso como para manejar un triaging utomático en Microsoft.

Los investigadores dicen que planean usar SoftNER en el futuro para evaluar informes de errores y mejorar las herramientas de gestión e informes de incidentes existentes. La administración es una parte integral de la construcción y operación de servicios en la nube a gran escala ", escriben." Mostramos que el conocimiento extraído puede usarse para crear modelos mucho más precisos para tareas críticas de gestión de incidentes "

Microsoft no es el único gigante tecnológico que utiliza el aprendizaje automático para solucionar errores. El servicio CodeGuru de Amazon que fue parcialmente entrenado en revisiones de código y aplicaciones desarrolladas internamente en Amazon, detecta problemas tales como fugas de recursos y ciclos de CPU desperdiciados. Facebook ha desarrollado una herramienta llamada SapFix que genera correcciones de errores antes de enviarlas a los ingenieros humanos para su aprobación, y otra herramienta llamada Zoncolan que mapea el comportamiento y las funciones de las bases de código y busca posibles problemas en y entre las industrias Interacciones de diferentes caminos a través del programa.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *