Skip to main content

Kümeleme Başarı Değerlendirme Yöntemleri

Kümeleme analizinde genel amaç birbirine benzer olan bireylerin aynı grup­ larda toplanmasıdır. Kümelerin başarısını değerlendirmek için sınıflara atanan veriler arasındaki benzerliklere ve kümeler arasındaki farklılığa bakılmaktadır. Bu bakımdan kümeler arasın­ daki benzerliği ölçmede hangi ölçünün kullanılacağı kümeleme analizinin en önemli sorunlarından birini teşkil eder. Kümeleme yapan bir model ortaya konduktan sonra bu modelin başarısının ölçülmesi […]

Devamını Oku

Veri Ön İşleme / Python

Adım 1 :  Gerekli Kütüphaneyi İçe Aktarma (import) Python da makine öğrenmesi işlemlerinin yaparken her zaman import  edeceğimiz iki kütüphanemiz vardır bunlar Numpy ve Pandas. Numpy, Matematiksel fonksiyonları içeren bir kütüphanedir. Pandas, Veri setlerini içeri aktarmak ve yönetmek için kullanılan kütüphanedir.   import numpy as np import pandas as pd Adım 2 :  Veri Setini […]

Devamını Oku

KAFKA – FLINK – STORM PLATFORMLARI

Flink Apache Flink, veri akışları üzerinden dağıtılmış hesaplama için olanaklar sağlamayı amaçlayan çekirdeği java ve scala dili ile yazılmış olan bir veri akış motorudur. Toplu iş süreçlerini özel bir veri akışı durumu olarak ele alan Flink, hem toplu işler hem de gerçek zamanlı bir işlem çerçevesi olarak etkilidir, Büyük ölçekli  verileri işleyebilir. Flink ayrıca FlinkML […]

Devamını Oku

Knime (Konstanz Information Miner)

Açık kaynak kodlu olan knime java dilinde yazılmış eclipse tabanlı, Node‘lararasında ilişkilendirmeler yapılarak verinin işlenmesi, yorumlanması, görselleştirmesi ve raporlanmasını sağlayan bir veri analiz platformudur. Knime’ı kuran firmanın asıl merkezi zürih olmakla birlikte, silikon vadisi ve Berlin’de ofisleri bulunmaktadır. Knime, genişletilebilme özellikleri ile ön planda olmasının yanı sıra kullanıcıların kendi modüllerini yazabilmelerini sağlayan tek uygulamadır. Knime yazılımı .txt […]

Devamını Oku

Veri Madenciliği Nedir?

Verileri işlemek için bazı yöntemlere ihtiyaç doğmuştur, Veri madenciliği büyük ölçekli verilerden yararlı ve anlaşılır sonuçlar ortaya koyan bir işlemdir.  Veri Madenciliği ile gelecekle ilgili tahminler yapılabilmekte.  Bu işlemler içinde veri madenciliği yazılımları mevcuttur.  Aşağıda bazı yazılımlara örnek verilmiştir.    Veri Madenciliğinin Kullanım Alanları;  Bankacılık, borsa, pazarlama yönetimi, perakende satış, istihbarat, sigortacılık, tıp, biyoloji, telekomünikasyon, işaret işleme, elektronik ticaret, sağlık, genetik, endüstri, eğitim, bilim ve mühendislik  gibi birçok dalda […]

Devamını Oku