Aykırı Değer Tespiti

Yazar: Eugene Taylor
Yaratılış Tarihi: 11 Ağustos 2021
Güncelleme Tarihi: 10 Mayıs Ayı 2024
Anonim
Veri Kümesinde Aykırı Değerleri Yorumlama (Matematik) (İstatistik ve Olasılık)
Video: Veri Kümesinde Aykırı Değerleri Yorumlama (Matematik) (İstatistik ve Olasılık)

İçerik

Tanımı - Outlier Detection ne anlama geliyor?

Aykırı değer tespiti, aykırı değerlerin belirli bir veri kümesinden çıkarılması ve ardından çıkarılması işlemidir.


Bir aykırı verilen veri setinin verilen normundan veya ortalamasından büyük ölçüde sapan bir veri parçası veya gözlem olarak tanımlanabilir. Bir ayyaşçı basitçe tesadüfen kaynaklanmış olabilir, ancak ölçüm hatasını veya verilen veri setinin yoğun kuyruklu bir dağılıma sahip olduğunu da gösterebilir.

Aşağıda, saptama saptamasında basit bir senaryo var; bir ölçüm işlemi sürekli olarak 1 ile 10 arasında okumalar yapıyor, ancak bazı ender durumlarda 20'den büyük ölçümler alıyoruz.

Normun ötesindeki bu nadir ölçümlere normal dağılım eğrisini "dışarıda bıraktıkları" için aykırı değerler denir.

Microsoft Azure ve Microsoft Cloud'a Giriş | Bu kılavuz boyunca, bulut bilişimin neyle ilgili olduğunu ve Microsoft Azure'un işinizi buluttan geçirmeniz ve yürütmenizde size nasıl yardımcı olabileceğini öğreneceksiniz.

Techopedia Outlier Algılama açıklar

Bir aykırı belirlemek için standartlaştırılmış ve katı bir matematiksel yöntem yoktur, çünkü küme veya veri popülasyonuna bağlı olarak gerçekten değişir, bu yüzden belirlenmesi ve tespiti sonuçta öznelleşir. Belirli bir veri alanında sürekli örnekleme yoluyla, algılamayı kolaylaştırmak için bir ayracın özellikleri belirlenebilir.


Aykırı değerlerin algılanması için model tabanlı yöntemler vardır ve verilerin tümünün normal bir dağılımdan alındığını ve aykırı değerler olarak ortalama veya standart sapmalara dayanmalarının muhtemel olmadığı gözlemleri veya noktaları tanımlayacağını varsaymaktadırlar. Aykırı değer tespiti için birkaç yöntem vardır:

  • Grubb’un Outliers için Testi - Bu, verilerin normal bir dağıtım olduğu varsayımına dayanır ve testte artık aykırı değer bulunamayana kadar yinelenen test ile bir aykırı değeri kaldırır.
  • Dixon’ın Q Testi - Ayrıca, veri setinin normal olmasına bağlı olarak, bu yöntem kötü verileri test eder. Bunun bir veri setinde az miktarda ve asla bir defadan fazla kullanılması gerektiği not edilmiştir.
  • Chauvenet’in Kriteri - Bu, dışlanan kişinin sahte olup olmadığını veya hala sınırlar dahilinde olup olmadığını ve setin bir parçası olarak değerlendirildiğini analiz etmek için kullanılır. Ortalama ve standart sapma alınır ve aykırı oluşma olasılığı hesaplanır. Sonuçlar dahil edilip edilmemesi gerektiğini belirleyecektir.
  • Pierce’in Kriteri - Çok büyük bir hatayı içerdikleri için tüm gözlemlerin ötesine atılacağı bir dizi gözlem için bir hata limiti belirlenir.