ÜCRETSİZ VERİ MADENCİLİĞİ ARAÇLARI VE TÜRKİYE’DE BİLİNİRLİKLERİ ÜZERİNE BİR ARAŞTIRMA

Onur Doğan
2.198 690

Öz


Veri madenciliği, istatistik temelli ve bilgisayar destekli teknikler kullanılarak veriden bilgiye ulaşma süreci olarak tanımlanabilir. Veri analizleri için sıklıkla kullanılan veri madenciliği araçlarının sayısı günden güne artış göstermektedir. Bu çalışmanın amacı ücretsiz veri madenciliği araçlarını derlemek ve tanıtmaktır. Bu amaca uygun olarak, akademik ve ticari araştırmalarda kullanılan ücretsiz veri madenciliği araçlarının önemli bir kısmı belirlenmiştir. Bu yazılımlar hakkında tarihçe bilgisi, kullanım alanı vb. bazı genel bilgiler verilmiştir. Ayrıca, Türkiye’de veri madenciliği konusunda araştırma, proje vb. çalışmalarda bulunan kişilere kartopu örneklem metodu ile ulaşılarak bu veri madenciliği yazılımlarının Türkiye’deki bilinirliği ve kullanım yaygınlıkları belirlenmeye çalışılmıştır. Araştırmacıların, çalışmaya konu olan 38 adet yazılımdan yalnızca 5 tanesi üzerinde yoğunlaştıkları geri kalan yazılımların birçoğunu kullanmadıkları gibi bu yazılımlardan haberdar da olmadıkları görülmüştür. Çalışmanın Türkiye’deki araştırmacılar için veri madenciliği araçları için veri seti oluşturma ve farklı veri madenciliği araçlarını araştırmacılara tanıtma amacına ulaşacağı düşünülmektedir.

Veri madenciliği sürecinde araştırmacının girdi sayısı, girdi tipi, kullanılacak veri madenciliği yeteneği gibi vermesi gereken çok sayıda karar vardır. Kullanılacak veri madenciliği aracı da bu kararlardan biridir. Çalışmanın, araştırmacıların çalışmalarında kullandıkları veri madenciliği araçları konusunda tercih şanslarını arttırarak çalışma sürecinin ve sonuçlarının kalitesine katkı yapacağı düşünülmektedir. 


Tam metin:

PDF