Veri Madenciliği Nedir?
Verileri işlemek için bazı yöntemlere ihtiyaç doğmuştur, Veri madenciliği büyük ölçekli verilerden yararlı ve anlaşılır sonuçlar ortaya koyan bir işlemdir. Veri Madenciliği ile gelecekle ilgili tahminler yapılabilmekte. Bu işlemler içinde veri madenciliği yazılımları mevcuttur. Aşağıda bazı yazılımlara örnek verilmiştir.
Veri Madenciliğinin Kullanım Alanları;
Bankacılık, borsa, pazarlama yönetimi, perakende satış, istihbarat, sigortacılık, tıp, biyoloji, telekomünikasyon, işaret işleme, elektronik ticaret, sağlık, genetik, endüstri, eğitim, bilim ve mühendislik gibi birçok dalda kenndisine uygulama alanı bulunmaktadır.
Ticari yazılımlar;
SPSS Modeler (Clementine), Excel, SPSS, SAS, Angoss, KXEN, MS, SQL Server, MATLAB ve Oracle’ın geliştirdiği modüller.
Açık kaynak yazılımlar;
Orange, Rapid Miner, WEKA, R, Knime, Tanagra Scriptella ETL, Keel, jHepWork ve Elki örnek olarak verilebilir.
CRISP-DM (Cross Industry Standard Process Model for Data Mining)
Veri Madenciliği ve Veri Biliminde en popüler metodolojidir. Projelerin planlanıp, yürütülmesinde kullanılmaktadır. Bir crisp-dm dönülmesi küçük çaplı problemler için 3-4 ay sürerken büyük çaplı projelerde 1-2 seneye kadar sürebilmektedir.
1- İşin Anlaşılması
Projenin hedefleri ihtiyaçlarının belirlenmesi anlaşılması ve veri madenciliği tanımına uyarlanması aşamasıdır.
2- Verinin Anlaşılması
Veri toplama işlemiyle başlayan bu süreç veriden ilk anlamı çıkarma adımları ile devam eden bir süreç.
3) Verinin Hazırlanması
Veri seç, veri temizle, veri dönüştür gibi işlemlerin yapıldığı aşamadır.
4- Modelleme
çeşitli modellerin seçilip parametrelerinin belirlendiği aşamadır.
5- Değerlendirme
Modelin denenip gözden geçirildiği ve gerekirse iyileştirmelerin yapıldığı aşamadır.
6- Konuşlandırma
Modelin analist ve son kullanıcılara sunularak yorumlandığı son aşamadır.