GeneralData Science

Kümelemede Data Normalization Yöntemleri

Öklid uzaklık yöntemine  dayalı kümeleme işlemlerinde verilerin model üzerinde eşit etki gösterebilmesi için standartlaştırma işlemi  gerekmektedir. Veri ölçeklendirmede en yaygın kullanılan yöntemler min-max normalizasyonu ve z-score’ dur. Amaç, verileri ortak bir noktaya getirerek karşılaştırılabilmelerini sağlamak, veriler arasındaki büyük farkları tek bir düzene sokmaktır. Bu amaçla en sık kullanılan iki yöntem min-max ve z-score ‘dur. 

Min – Max  Normalizasyonu 

Bu işlemde ki  amaç en küçük değeri 0 ve en büyük değeri 1 olacak şekilde normalleştirmek ve diğer bütün verileri bu [0-1] aralığına yaymaktır.  

0 XtglG0u3tmEQ0xALayJNclh35Ngawyv62Ws6UrPuC2Qu9 csfaDtTKLKz 1YjCVdjuMS0o255izXj45BZi6Ahp SU9M7AD4aHRQ1GG6FLRmfvcOfs0Nh1xlU0JINE5ma5wOuCputqRSeIB A

Z- score  

Her nitelik için ortalama değerden uzaklığa ve nitelik değerlerindeki standart sapmaya göre yeni değeri hesaplanarak veriler standartlaştırılır.  Mevcut model üzerine veriler streaming olarak geldiği için öncesinde bu verinin depolanmış seti üzerinde mean ve standart sapma değerleri feature’ lar için çıkarılarak model üzerinde normalizasyon için kullanılmaktadır. 

Ortalama,

kAxI6Q1NxFR6kmI3pQ0Wig9rRh UA5bxZIAUx4aAtkNe6Er7UY22VCzgVFem6DU3p xABo MkOTS

Standart Sapma, 

T qP SD84Mdx8N

Z- Score,

lGu5HfhSHbkacySpGeOl5qNHqmmQrPhfQNG288oLMhkY65MPCS5PNOVVHZ8ipTKLwaee82QjqDXF0HDswaYKUZm6PyFjX2D KEdimj bcR9GywShNVSB3U4u0i0TQhOVwsJmizN1gHg7nopLQQ

X değişken , μ ortalama, σ  standart sapma değeridir. 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Başa dön tuşu

Ad-Blocker Detected

Lütfen reklam engelleyiciyi devre dışı bırakarak bizi desteklemeyi düşünün