Veri Madenciliği
Dijital verinin toplanması ve saklanmasındaki gelişmeler, saklanan verilerin giderek artan bir ivme ile büyümesine sebep olmaktadır. Öte yandan internet kullanımının sıradanlaşması ve günlük yaşamın ayrılmaz bir parçası haline gelmesi bu yolla elde edilen verinin artışını hızlandırmaktadır. Bu nedenle veri çeşitliliği de düzenli olarak artmaktadır. Kredi kartı verileri, banka kayıtları, giriş/çıkış kart sistem kayıtları, market alışveriş verileri, web sitesi logları, e-mail içerikleri, tıbbi kayıt verileri gibi çok çeşitli alanlarda yeni veri türleri ile karşılaşmak mümkündür.

Veri madenciliği (data mining) en temel tanımı ile büyük miktarda verinin içerisinde gizli kalmış anlamlı verinin bulunması amacıyla otomatik ya da yarı otomatik yöntemler ile işlenmesidir., Veri madenciliğinin temelinde bilgisayar bilimleri kullanılarak istatistik çalışmalarının yapılması yatmaktadır. Genel olarak veri madenciliği, makine öğrenmesi ve yapay zeka bir arada kullanabilen bilimsel disiplinlerdir. Bu disiplinler arasında keskin sınırlar çizmek oldukça zordur.

Makine Öğrenmesi
Bilgisayarların öğrenmesi konusunu inceleyen akademik disiplin makine öğrenmesidir.Kararlarını geçmiş tecrübelerini kullanarak ve kendisine avantaj sağlayacak şekilde verebilen bir canlı ya da makine öğrenme yetisine sahiptir denilebilir. Eğer bir bilgisayar programının belirli bir konudaki başarımı tecrübe edindikçe artıyorsa makine öğrenmesinden bahsedilebilir.

Makine Öğrenmesi, matematiksel ve istatistiksel yöntemler kullanarak mevcut verilerden çıkarımlar yapan, bu çıkarımlarla bilinmeyene dair tahminlerde bulunan yöntemlerin bütününe verilen bir isimdir. Makine öğrenmesine güncel bazı örnekler verilmesi gerekirse: yüz tanıma, belge sınıflandırma, spam tespiti verilebilir. Makine öğrenmesi, veri madenciliği gibi bir çok disiplin ile ilişkili bir disiplindir.

Gözetimli Öğrenme
Girdi ve çıktılar, modelleme çalışmasının başında belirlenmiş ise bu yönteme gözetimli öğrenme denir. Bu yöntemde bilinen gerçekler kullanılarak bilinmeyen veri üzerinde bir fonksiyon uydurulur ve istenen sonuca en yakın veriler elde edilmeye çalışılır.

Gözetimsiz Öğrenme
Girdi ve çıktılar, modelleme çalışmasının başında belirsiz durumdadır. Bu teknikte bütün veriler girdi olarak alındıktan sonra algoritma veri üzerinde çalışarak bir örüntü elde etmeye çalışır. Veri üzerinde birliktelik analizi ve kümeleme yapılarak ilişki içerisindeki veriler temel anlamda gruplanır.

Veri madenciliği ve Makine Öğrenmesi çeşitli sektörlerde farklı şekillerde uygulanabilmektedir.

Örnek 1 – Turizm Sektörü
Bir Tur Operatörü için Eski Müşterilerin Yeniden Kazanılması
Bir tur operatörü ile tatile gitmiş ancak son 5 yıldır bu operatör ile çalışmayan müşterilere ulaşılması ve müşterilerin tekrar kazanılması hedeflenmektedir. Bu durumda olan 75.000 eski müşteri bulunmaktadır.
1. Bunun için öncelikle teklifi kabul edeceği düşünülen 1.000 müşteri klasik yöntemlerle yaş, cinsiyet, eğitim, meslek, medeni durum vs.. gibi bilgileri dikkate alınarak veritabanından seçilmiştir.
2. Bu kişiler çağrı merkezi üzerinden aranarak yeni teklif iletilmiş ve bir kısmı teklifi kabul ederek bir sonraki tatil planını bu operatör ile yapmaya karar vermişlerdir.

Amaçlanan öncelikle yeni teklifi kabul etmesi olasılığı yüksek olan müşterilere ulaşmak olduğu için geriye kalan 74.000 müşteri içerisinde doğru seçimi yaparak çağrı merkezine bildirim yapılmasını sağlamaktır. Bunun için 1000 kişilik örnek veri seti üzerinde gerekli makine öğrenmesi yöntemleri uygulanarak sonraki veri seti tespit edilmektedir. Böylece her yeni veri setinde geri dönüş yüzdesi çok daha yükselmektedir.

Örnek 2 – Telekom Sektörü
GSM Operatörü Ürün Tavsiye Motoru
Amaçlanan belirli sayıda ürünün mevcut müşterilere en yüksek geri dönüşüm yüzdesi ile sunulmasını sağlamaktır. Müşterilerin mevcut kullanım alışkanlıkları göz önüne alınarak milyonlarca transaction analiz edilerek kullanıcıya en doğru teklifin sunulması sağlanmaktır.

Örnek 3 – Bankacılık Sektörü
Kredi Analizi
Son 5 yıllık süreçte kredi verilen müşteriler analiz edilerek gelecekte farklı özelliklere sahip müşterilerin risk analizi yapılır. Bu şekilde müşteri temsilcisinin ekranında ilgili müşteriye kredi verilip verilmeyeceği konusunda yönlendirme yapılabilir.