Microsoft, 47.000 Geliştiricisinin Her Ay Ürettiği 30.000 Hatayı Nasıl Ele Alıyor?

Microsoft’un makine öğrenimi modeli yüzde 99 oranında doğru.

Microsoft, makine öğrenme modellerini kullanarak yazılımındaki ve hizmetlerindeki hataları nasıl ele aldığını detaylandırıyor. “47.000 geliştirici ayda yaklaşık 30.000 hata üretiyor” diyor Scott ChristiansenMicrosoft’ta kıdemli bir güvenlik programı yöneticisi olan . Yazılım üreticisi, GitHub ve AzureDevOps depolarındaki bu hataları izler, ancak yalnızca geleneksel etiketleme ve önceliklendirme ile takip etmek için birçok sorun vardır.

Microsoft, güvenlik ve güvenlikle ilgili olmayan hataları zamanın yüzde 99’unu ayırabilen bir makine öğrenme modeli oluşturmak için 13 milyon iş öğesi ve hata arasında yaklaşık 20 yıllık geçmiş verileri kullanıyor. Geliştiricilerin, düzeltilmesi gereken kritik güvenlik sorunlarını doğru bir şekilde tanımlamasına ve öncelik vermesine yardımcı olmak için tasarlanmış bir modeldir.

[baslik]BİR MAKİNE ÖĞRENME MODELİ KURTARMAYA GELİYOR[/baslik]

Christiansen, “Hedefimiz, hataları bir güvenlik uzmanınınkine mümkün olduğunca yakın bir doğruluk düzeyinde güvenlik / güvenlik dışı ve kritik / kritik olmayan olarak sınıflandıran bir makine öğrenme sistemi oluşturmaktı” diyor. Microsoft, onu eğitmek ve verilerin çok gürültülü olmadığından emin olmak için güvenlik ve güvenlik olmayan olarak etiketlenmiş makine öğrenme modeli hatalarını besledi. Model daha sonra güvenlik hatalarının nasıl sınıflandırılacağını ve her birine kritik, önemli veya düşük etkili gibi önem etiketlerinin nasıl uygulanacağını öğrendi.

Güvenlik uzmanları ve veri bilimcileri, modeli oluşturmak için Microsoft’ta birlikte çalışarak, üretimde izlenebilmesini ve rastgele bir örneklemenin manuel olarak gözden geçirilmesini sağladı. Model ayrıca Microsoft’un güvenlik uzmanları tarafından gözden geçirilen yeni verilerle sürekli olarak yeniden eğitilmektedir. Bu makine öğrenme modeli, Microsoft’un artık güvenlik hatalarını zamanın yüzde 99’unu doğru bir şekilde tanımladığı ve bunları yüzde 97’sini doğru bir şekilde etiketlediği anlamına gelir.

Microsoft’un büyüklüğü olan bir şirket için, geliştiricilerinin aylık olarak kaç tane hata ürettiğini, bununla nasıl başa çıkacağını açıklamak sıra dışıdır. Microsoft şu anda metodolojisini GitHub’a açık kaynak yapmayı planlıyor ve benzer veri setlerine sahip diğer şirketlerin benzer bir model uygulamasına izin veriyor.

[post_kaynak baslik=”https://www.theverge.com/2020/4/22/21230816/microsoft-developers-bugs-machine-learning-numbers-statistics”]