KDD ve Veri madenciliği arasındaki fark

Anonim

KDD ve Veri madenciliği

KDD (Veri Tabanlarında Bilgi Bulma) alanlarında bilgisayarlara yardımcı olan araçlar ve teoriler içeren bilim, insanlara sayısallaştırılmış verilerin büyük koleksiyonlarından yararlı ve önceden bilinmeyen bilgileri (yani bilgi) ayıklamasına yardımcı olacak araçları ve teorileri içerir. KDD birkaç adımdan oluşur ve Veri Madenciliği bunlardan biridir. Veri Madenciliği, verileri desenlerden çıkarmak için özel bir algoritma uygulamasıdır. Bununla birlikte, KDD ve Veri Madenciliği birbirlerinin yerine kullanılır.

KDD Nedir?

Yukarıda belirtildiği gibi, KDD, daha önce bilinmeyen ve ilginç bilgilerin ham verilerden çıkarılması ile ilgilenen bir bilgisayar bilimi alanıdır. KDD, uygun yöntem veya teknikler geliştirerek veriyi anlamlandırmaya çalışan tüm süreçtir. Bu süreç, alt düzey verilerin daha kompakt, soyut ve kullanışlı olan diğer biçimlerle eşleştirilmesiyle ilgilidir. Bu, kısa raporlar oluşturarak, veri üretme sürecini modelleyerek ve gelecekteki olayları öngörebilecek tahmini modeller geliştirerek sağlanmaktadır. Özellikle iş gibi alanlarda verilerin üssel olarak büyümesinden dolayı, KDD, bu geniş veri zenginliğini iş zekasına dönüştürmek için çok önemli bir süreç haline gelmiştir; zira son birkaç on yıl içinde manuel kalıp çıkarma imkansız hale gelmiştir. Örneğin şu anda sosyal ağ analizi, dolandırıcılık tespiti, bilim, yatırım, üretim, telekomünikasyon, veri temizleme, spor, bilgi edinme ve pazarlama gibi çeşitli uygulamalar için kullanılmaktadır. KDD, gelecek sene Wal-Mart'da yüksek kar elde etmeye yardımcı olabilecek ana ürünler nelerdir gibi sorulara cevap bulmak için genellikle kullanılır?. Bu işlemin birkaç basamağı vardır. Uygulama alanını ve hedefini anlama ve ardından bir hedef veri kümesi oluşturma ile başlar. Bunu temizleme, ön işleme, azaltma ve verilerin izdüşümü izler. Sonraki adım, deseni tanımlamak için Veri Madenciliği'ni (aşağıda açıklanmıştır) kullanmaktadır. Son olarak, keşfedilen bilgiler, görselleştirme ve / veya yorumlama yoluyla konsolide olur.

Veri Madenciliği Nedir?

Yukarıda belirtildiği gibi Veri Madenciliği KDD sürecinin sadece bir adımındadır. Başvurunun amacına göre tanımlanan iki büyük Veri Madenciliği hedefi vardır ve bunlar doğrulama veya keşiftir. Keşif, otomatik olarak ilginç kalıplar bulurken doğrulama, kullanıcının veriyle ilgili hipotezini doğrulamaktadır. Dört ana veri madenciliği görevi vardır: kümeleme, sınıflandırma, gerileme ve ilişkilendirme (özetleme). Kümeleme, yapılandırılmamış verilerden benzer grupları tanımlamaktadır. Sınıflandırma, yeni verilere uygulanabilen öğrenme kurallarıdır. Regresyon, model verilerine minimum hata ile fonksiyonlar buluyor.Ve ilişki değişkenler arasındaki ilişkileri araştırıyor. Ardından, özel veri madenciliği algoritmasının seçilmesi gerekir. Hedefe bağlı olarak doğrusal regresyon, lojistik regresyon, karar ağaçları ve Naïve Bayes gibi farklı algoritmalar seçilebilir. Ardından, bir veya daha fazla temsilde görülen kalıplar aranır. Son olarak, modeller öngörülü doğruluk veya anlaşılabilirlik kullanılarak değerlendirilir.

KDD ve Veri madenciliği arasındaki fark nedir?

KDD ve Veri Madenciliği terimleri birbirlerinin yerine kullanılırken, birbiriyle ilişkili ancak biraz farklı iki kavrama değinmektedirler. Veri Madenciliği, verilerdeki kalıpları belirleme ile ilgilenen KDD sürecindeki bir adım ise, KDD, veriden bilgi çıkarma genel süreci. Başka bir deyişle Veri Madenciliği yalnızca KDD sürecinin genel hedefine dayalı belirli bir algoritmanın uygulanmasıdır.