AIForBusiness Data Labeling – Veri Etiketleme

Merhaba arkadaşlar Deep Learning Türkiye ekibi ile birlikte 4 – 5 Ocak 2020 de düzenlenen AIForBusiness etkinliğinde bende sunum yaptım veri etiketleme konusundan ve nasıl yapıldığından bahsettim. 2020 benim için çok güzel başladı birçok insanla tanışma fırsatı elde ettim. Bu tarz etkinliklerin bizlerin iş hayatında büyük etkisi olduğu kanaatindeyim. Sizlerde kendinize hitap eden etkinlikleri lütfen […]

Devamını Oku

Veri Ön İşleme / Python

Adım 1 :  Gerekli Kütüphaneyi İçe Aktarma (import) Python da makine öğrenmesi işlemlerinin yaparken her zaman import  edeceğimiz iki kütüphanemiz vardır bunlar Numpy ve Pandas. Numpy, Matematiksel fonksiyonları içeren bir kütüphanedir. Pandas, Veri setlerini içeri aktarmak ve yönetmek için kullanılan kütüphanedir.   import numpy as np import pandas as pd Adım 2 :  Veri Setini […]

Devamını Oku

KAFKA – FLINK – STORM PLATFORMLARI

Flink Apache Flink, veri akışları üzerinden dağıtılmış hesaplama için olanaklar sağlamayı amaçlayan çekirdeği java ve scala dili ile yazılmış olan bir veri akış motorudur. Toplu iş süreçlerini özel bir veri akışı durumu olarak ele alan Flink, hem toplu işler hem de gerçek zamanlı bir işlem çerçevesi olarak etkilidir, Büyük ölçekli  verileri işleyebilir. Flink ayrıca FlinkML […]

Devamını Oku

Imputatıon – Eksik Verilerin Tamamlanması

Araştırmacılar, her ne kadar eksiksiz veri elde etmek isteselerde veriler bazı dış kaynaklı veya yazılımsal nedenlerden dolayı istenildiği gibi eksiksiz bir şekilde toplanamayabilir. Özellikle büyük veri çalışmaları üzerinde yapılan işlerde  eksiksiz veri setlerinin elde edilmesi neredeyse imkansızdır. Bu yüzden eksik verilerin tamamlanması için değişik yöntemler ortaya atılmıştır.  Genelde verinin hatalı okunması, veri kaynağında yaşanan bozulma,  bazı […]

Devamını Oku