Skip to main content

Cross-Validation Nedir?

Literatürde k-fold cross validation (k katlamalı Çapraz doğrulama) olarak geçmektedir, makine öğrenme modellerinin başarılarının değerlendirilmesi için kullanılan bir yöntemdir. Bu yöntemde veri seti eğitim ve test seti olarak ayrılmaktadır bu işlem için seçilen yöntem modelin başarısını önemli ölçüde etkilemektedir. Bu yöntemlere örnek verecek olursak örneğin data setinin %70’i train %30’u test için kullanılsın, veya data […]

Devamını Oku

Basit Doğrusal Regresyon / Linear Regresyon

Simple linear regresyon, 2 nicel veri arasındaki ilişkiyi özetleyen istatiksel bir metoddur. Bağımsız değişkenlerin (X) değerlerini temel alarak bağımlı değişkeni (Y) tahmin etmenin bir yöntemidir. İki değişkenin doğrusal olarak birbirleri ile ilişkili olduğu varsayılmaktadır. Basit doğrusal regresyon bize normal dağılmış, belirli bir oranda  veri toplanmış iki değişken arasında doğrusal ilişki olup olmadığını test etme olanağı […]

Devamını Oku

Veri Ön İşleme / Python

Adım 1 :  Gerekli Kütüphaneyi İçe Aktarma (import) Python da makine öğrenmesi işlemlerinin yaparken her zaman import  edeceğimiz iki kütüphanemiz vardır bunlar Numpy ve Pandas. Numpy, Matematiksel fonksiyonları içeren bir kütüphanedir. Pandas, Veri setlerini içeri aktarmak ve yönetmek için kullanılan kütüphanedir.   import numpy as np import pandas as pd Adım 2 :  Veri Setini […]

Devamını Oku

Imputatıon – Eksik Verilerin Tamamlanması

Araştırmacılar, her ne kadar eksiksiz veri elde etmek isteselerde veriler bazı dış kaynaklı veya yazılımsal nedenlerden dolayı istenildiği gibi eksiksiz bir şekilde toplanamayabilir. Özellikle büyük veri çalışmaları üzerinde yapılan işlerde  eksiksiz veri setlerinin elde edilmesi neredeyse imkansızdır. Bu yüzden eksik verilerin tamamlanması için değişik yöntemler ortaya atılmıştır.  Genelde verinin hatalı okunması, veri kaynağında yaşanan bozulma,  bazı […]

Devamını Oku

One Hot Encoding Nedir – Nasıl Yapılır?

  Makine öğrenme algoritmaları doğrudan kategorik veriler üzerinde çalışmamaktadır bu yüzden verilerimizin sayısal verilere dönüştürülmesi gerekmektedir. Bu yazımda sizlere Python’da derin öğrenmeyle sınıflandırma problemlerinde kullanmak üzere verilerimizin one hot encode şeklinde dönüştürülmesinden bahsedeceğim. Scikit-learn ve Keras  kütüphanelerini kullanarak örnek üzerinden açıklamaya çalışacağım. One Hot Encoding Nedir? One Hot Encoding, kategorik değişkenlerin ikili (binary) olarak temsil […]

Devamını Oku

Soft Clustering – Yumuşak Kümelenme Nedir ?

  Kümelenme veri madenciliğinde neredeyse her alanda, gerçek yaşam içinde ki problemlerde kullanılan yaklaşımlardan birisidir.  Bu nedenle kümelenme yöntemlerine duyulan ilgide artmış ve yeni yöntemler geliştirilmeye başlanmıştır. Ben de bu yazımda sizlere hard kümelenmenin yanı sıra soft kümelenme mantığı hakkında bilgiler vermeye çalışacağım. Yumuşak kümelemede geleneksel kümeleme tekniklerinde veri kümesi içerisindeki her bir noktayı bir […]

Devamını Oku

Veri Madenciliği Nedir?

Verileri işlemek için bazı yöntemlere ihtiyaç doğmuştur, Veri madenciliği büyük ölçekli verilerden yararlı ve anlaşılır sonuçlar ortaya koyan bir işlemdir.  Veri Madenciliği ile gelecekle ilgili tahminler yapılabilmekte.  Bu işlemler içinde veri madenciliği yazılımları mevcuttur.  Aşağıda bazı yazılımlara örnek verilmiştir.    Veri Madenciliğinin Kullanım Alanları;  Bankacılık, borsa, pazarlama yönetimi, perakende satış, istihbarat, sigortacılık, tıp, biyoloji, telekomünikasyon, işaret işleme, elektronik ticaret, sağlık, genetik, endüstri, eğitim, bilim ve mühendislik  gibi birçok dalda […]

Devamını Oku