Mlliyet Milliyet Blog Milliyet Blog
 
Facebook Connect
Blog Kategorileri
 

05 Kasım '17

 
Kategori
Teknoloji
Okunma Sayısı
894
 

Büyük Veri Analizi / Veri Madenciliği ve Makine Öğrenmesi

Büyük Veri Analizi / Veri Madenciliği ve Makine Öğrenmesi
 

Endüstri 4.0 konusu içinde Büyük Veri Analizini incelerken Veri Madenciliği ve Makine öğrenmesi gibi  olmazsa olmazları es geçmiştik.Aşağıda bu konuların kısa bir açıklamasını bulacaksınız:

..................

Veri Madenciliği (Data Mining): En basit tanımıyla büyük ölçekli veriler arasından istenilen bilgiye erişme yani bir tür o bilginin maden misali ortaya çıkarılmasıdır. Başka bir deyişle büyük veri yığınları içerisinden gelecekle ilgili tahminlerde bulunmamızı ağlayabilecek bağıntıların bilgisayar programları kullanılarak aranmasıdır.

Veri madenciliği süper bilgisayarlar tarafından yapılsa bile bir çırpıda bitmez. Bazı belli adımların, merhalelerin tek tek geçilmesi gerekir. Bu adımlar:

1- Veri Temizleme: İçinden çıkılmayacak derecede karmaşık ve tutarsız verileri çıkarmak,

2- Veri bütünleştirme: Birçok veri kaynağını birleştirme,

3- Veri Seçme: Yapılacak analizlerle ilgili verileri belirleme,

4-  Veri Dönüşümü: Verinin; veri madenciliği yapılabilecek kıvama getirilmesi, dönüştürülmesi,

5- Veri Madenciliği: Bir nesne veya olay kümesindeki elemanların ardışık olarak düzenli bir biçimde birbirini izleyerek yenilenmesi anlamına gelen veri örüntülerini saptayabilmek için akıllı metodları kullanmak,

6- Örüntü Değerlendirme: Bazı ölçümlere göre elde edilmiş olan bilgiyi temsil eden ilginç örüntüleri tanımlamak,

7- Bilgi Sunumu: Veri madenciliği yoluyla elde edilmiş olan bilginin kullanıcıya sunumunu gerçekleştirmek.

Veri madenciliği disiplinler arası bir çalışmadır. İstatistik, veri tabanı teknolojileri, makine öğrenmesi, yapay zekâ ve görselleştirme gibi birçok farklı disiplin bünyesinde geliştirilmiş yöntemleri kullanır.

Veri madenciliğinin farklı sektörlerdeki ticari işlemelerde kullanım şekli söyledir:

Parakendecilik: Market içinde ürünlerin yerleştirilmesi ve çapraz satış yapılması.

- Bankacılık: Müşteri ilişkileri yönetimi, kampanya yönetimi, kredi puanının hesaplanması, kredi kartı sahtekârlağının belirlenmesi.

Sigortacılık: Soruşturma gerektiren tazmin taleplerinin tespiti.

- İnsan Kaynakları Yönetimi: Firmadan ayrılma ihtimali olan personelin tesbiti.

 

İlgili resim 

 

Makine Öğrenmesi (Machine Learning):

Yaygın olarak kullanılan bir tanıma göre makine öğrenmesi; bilgisayarların algılayıcı verisi, ya da veritabanları gibi veri türlerine dayalı öğrenimini mümkün kılan algoritmaların tasarım ve geliştirme süreçlerini konu edinen bilim dalıdır.

Yapay zekâ çalışmalarıyla yakından ilgili olan makine öğrenimi araştırmalarının odaklandığı temel konu karmaşık örüntüleri algılama veriye dayalı akılcı kararlar verebilme becerisi kazandırmaktır. Tabiatıyla bu çalışmalar da istatistik, olasılık kuramı, veri madenciliği, örüntü tanıma, uyarlamalı denetim ve kuramsal bilgisayar gibi alanlardan da yararlanmasını gerektirmektedir.

Bu teknolojinin başlıca uygulama alanları olarak makine algılaması, bilgisayar görme yetisi, doğru dil işleme, söz dizinsel örüntü tanıma, arama motorları, tıbbi tanı, biyoinformatik, beyin makine arayüzleri, DNA dizilerinin sınıflandırılması, konuşma ve elyazısı tanıma, oyun oynama, yazılım mühendisliği, uyarlamalı web siteleri ve robot dinamiğidir.

Ayrı bir alan olarak ilk defa 1990’ı yıllarda geliştirilmeye başlanan makine öğrenmesi, veri madenciliği ile sık sık aynı yöntemleri kullanır. Bu yöntemler yalnızca şu iki halde birbirinden ayrılırlar:

- Makine öğrenmesi bilinen özelliklere dayanarak öğrenilen verilerden yapılan tahminler üzerinde odaklanır.

- Veri madenciliği ise verilerdeki bilinmeyen özelliklerin keşfedilmesine dayanır. Bu bir veri tabanı okyanusunda yapılan keşif gezisidir.

Ancak yukarıda da değinildiği gibi iki disiplin de sık sık birbirlerinin metodlarından istifade eder. Hatta  o kadar ki bazı bilim adamları iki disiplini birleştirerek; veri Madenciliği ve makine öğrenmesi kavramını kullanmışlardır.

Yakın bir gelecekte birbirleriyle iletişim kurabilen ürünlerin sayısı akıllı telefonlar ve bilgisayarlar hariç, 20 milyarın üzerine çıkacağından bunların kontrölü, verilerin değerlendirilip sonuçlarının ortaya konması artık insanların yapabileceğinin çok ötesine geçmiş olacaktır. Bu nedenle “Öğrenen makinelerin” kullanıldığı sistemler yeni problemlerle karşılaştıklarında, analiz ettikleri verilerin ışığında çözüm şeklini otomatik olarak ortaya koyabileceklerdir. 

 

Önerilerine Ekle Beğendiğiniz blogları önerin, herkes okusun.

 
Tıklayın, siz de blog yazarı olun! Aklınızdan geçenleri paylaşın!
Facebook hesabınızla yorum yapın, daha çabuk onaylansın!
 
Toplam blog
: 297
Toplam yorum
: 156
Toplam mesaj
: 8
Ort. okunma sayısı
: 430
Kayıt tarihi
: 19.02.11
 
 

Marmara Üniversitesi İktisadi İdari Bilimler Fakültesi mezunuyum. Teknoloji Yönetimi dalında mast..

 
 
Yazarı paylaş
  • Tümünü göster