Skip to main content

Kümeleme Başarı Değerlendirme Yöntemleri

Kümeleme analizinde genel amaç birbirine benzer olan bireylerin aynı grup­ larda toplanmasıdır. Kümelerin başarısını değerlendirmek için sınıflara atanan veriler arasındaki benzerliklere ve kümeler arasındaki farklılığa bakılmaktadır. Bu bakımdan kümeler arasın­ daki benzerliği ölçmede hangi ölçünün kullanılacağı kümeleme analizinin en önemli sorunlarından birini teşkil eder. Kümeleme yapan bir model ortaya konduktan sonra bu modelin başarısının ölçülmesi […]

Devamını Oku

Cross-Validation Nedir?

Literatürde k-fold cross validation (k katlamalı Çapraz doğrulama) olarak geçmektedir, makine öğrenme modellerinin başarılarının değerlendirilmesi için kullanılan bir yöntemdir. Bu yöntemde veri seti eğitim ve test seti olarak ayrılmaktadır bu işlem için seçilen yöntem modelin başarısını önemli ölçüde etkilemektedir. Bu yöntemlere örnek verecek olursak örneğin data setinin %70’i train %30’u test için kullanılsın, veya data […]

Devamını Oku

Basit Doğrusal Regresyon / Linear Regresyon

Simple linear regresyon, 2 nicel veri arasındaki ilişkiyi özetleyen istatiksel bir metoddur. Bağımsız değişkenlerin (X) değerlerini temel alarak bağımlı değişkeni (Y) tahmin etmenin bir yöntemidir. İki değişkenin doğrusal olarak birbirleri ile ilişkili olduğu varsayılmaktadır. Basit doğrusal regresyon bize normal dağılmış, belirli bir oranda  veri toplanmış iki değişken arasında doğrusal ilişki olup olmadığını test etme olanağı […]

Devamını Oku

Veri Ön İşleme / Python

Adım 1 :  Gerekli Kütüphaneyi İçe Aktarma (import) Python da makine öğrenmesi işlemlerinin yaparken her zaman import  edeceğimiz iki kütüphanemiz vardır bunlar Numpy ve Pandas. Numpy, Matematiksel fonksiyonları içeren bir kütüphanedir. Pandas, Veri setlerini içeri aktarmak ve yönetmek için kullanılan kütüphanedir.   import numpy as np import pandas as pd Adım 2 :  Veri Setini […]

Devamını Oku

Soft Clustering – Yumuşak Kümelenme Nedir ?

  Kümelenme veri madenciliğinde neredeyse her alanda, gerçek yaşam içinde ki problemlerde kullanılan yaklaşımlardan birisidir.  Bu nedenle kümelenme yöntemlerine duyulan ilgide artmış ve yeni yöntemler geliştirilmeye başlanmıştır. Ben de bu yazımda sizlere hard kümelenmenin yanı sıra soft kümelenme mantığı hakkında bilgiler vermeye çalışacağım. Yumuşak kümelemede geleneksel kümeleme tekniklerinde veri kümesi içerisindeki her bir noktayı bir […]

Devamını Oku

error: Content is protected !!