Veri Madenciliği ve Veri Ambarı Arasındaki Fark

Anonim

Veri madenciliği ve Veri Depolama

Veri Madenciliği ve Veri Ambarı hem verileri analiz etmek için çok güçlü ve popüler tekniklerdir. İstatistik eğilimli kullanıcılar Veri Madenciliği kullanır. Verilerde gizli kalıpları bulmak için istatistiksel modellerden faydalanırlar. Veri madencileri, işletmeler için nihai olarak karlı olan farklı veri öğeleri arasında yararlı ilişkiler bulmakla ilgileniyorlar. Öte yandan, iş boyutlarını analiz edebilen veri uzmanları doğrudan Veri ambarlarını kullanmaya eğilimlidir.

Veri madenciliği Veri Keşfi (KDD) olarak da bilinir. Yukarıda bahsedildiği gibi, daha önce bilinmeyen ve ilginç bilgilerin ham verilerden çıkarılması ile ilgilenen bir bilgisayar bilimi alanıdır. Verilerin, özellikle de iş gibi alanlarda üssel olarak büyümesi nedeniyle, veri madenciliği, bu geniş veri zenginliğini iş zekasına dönüştürmek için çok önemli bir araç haline geldi; zira kalıpların manuel olarak çıkarılması son birkaç on yıl içinde görünüşte imkansız hale geldi. Örneğin, şu anda sosyal ağ analizi, dolandırıcılık tespiti ve pazarlama gibi çeşitli uygulamalar için kullanılmaktadır. Veri madenciliği genellikle aşağıdaki dört görevi ele alır: kümeleme, sınıflandırma, gerileme ve ilişkilendirme. Kümeleme, yapılandırılmamış verilerden benzer grupları tanımlamaktadır. Sınıflandırma, yeni verilere uygulanabilen öğrenme kuralları olup, tipik olarak aşağıdaki adımları içerir: verilerin önişleme, modelleme tasarımı, öğrenme / özellik seçimi ve Değerlendirme / doğrulama. Regresyon, model verilerine minimum hata ile fonksiyonlar buluyor. Ve ilişki değişkenler arasındaki ilişkileri araştırıyor. Veri madenciliği, gelecek sene Wal-Mart'da yüksek kar elde etmeye yardımcı olabilecek ana ürünler nelerdir gibi sorulara cevap bulmak için genellikle kullanılır?

Yukarıda belirtildiği gibi, veri ambarı, verileri analiz etmek için, ancak farklı kullanıcı grupları ve akılda tutulacak biraz farklı amaçlarla kullanılır. Örneğin, perakende sektörü söz konusu olduğunda, veri ambarlama kullanıcıları, müşteriler arasında popüler olan satın alma türlerinden daha çok endişe duymaktadır; bu nedenle, analiz sonuçları müşteri deneyimini geliştirerek müşteriye yardımcı olabilir. Ancak, veri madencileri, önce müşterilerin belirli bir ürün türünü satın alacağı ve hipotezi test etmek için verileri analiz ettiği gibi bir hipotez öne sürüyor. Veri ambarı, daha sonra, New York depolarının Chicago depolarından daha hızlı daha küçük boyutlu envanter sattığını öğrenmek için başlangıçta aynı boyutta ürünlerle mağazalarını stoklayan önemli bir perakende satıcısı tarafından gerçekleştirilebilir. Dolayısıyla, bu sonuca bakarak perakendeci Chicago depolarına kıyasla New York mağazasını daha küçük boyutlarda stoklayabilir.

Yani, açıkça görebileceğiniz gibi, bu iki analiz türü çıplak gözle aynı niteliktedir. Her ikisi de geçmiş verilere dayanan artan kârdan endişe ediyorlar. Ancak tabii ki önemli farklılıklar var. Basit bir ifadeyle, Veri Madenciliği ve Veri Ambarı, farklı türdeki analitik malzemeleri sağlamak için çalışmaktadır, ancak kesinlikle farklı kullanıcılar için. Başka bir deyişle, Data Mining istatistiksel bir hipotezi desteklemek için korelasyonlar arar. Fakat Data Warehousing, nispeten daha kapsamlı bir soruyu yanıtlar ve geleceğin iyileştirme yollarını tanımak için oradan veri keser ve siler.