Makale Özeti

OLAP (OnLine Analytical Processing), veri analizi ve raporlama ağırlıklı sistemlerin uygulama ve veritabanı altyapısı için kullanılan bir kavramdır. Bu makalede OLAP dünyasına yukarıdan bakarak bu konudaki genel bilgiyi arttımayı hedefliyoruz. Konu başlıkları ise veri analizine neden ihtiyaç duyulur ve temel OLAP konseptleri nelerdir...

Makale

OLAP kavramını tanımlamak zor olsa da; zaman, ürün, müşteri, lokasyon bilgisi vb. farklı boyutların hepsinin ya da bazılarının dahil olduğu çok boyutlu metrikleri analiz edebilme yeteneği olarak ifade edilebilir. Şimdi bu kavram merkezli business intelligence (kurumsal iş zekası) evrenindeki yıldızları tanımak için yol alalım.

Veri Analizine Neden İhtiyaç Duyulur?

Şirketler, anahtar iş performansı metriklerini anlamaya ihtiyaç duyarlar. Bunlar kar ve kayıp ya da birim satış olabileceği gibi iş tipine göre çok sayıda metriği bi arada barındırabilir. Örneğin bir hava yolu şirketi, doluluk oranları ile ilgilenirken; üretim yapan bir fabrika, hatalı üretim oranları ile ilgilenebilir. Şirketler, iş trendlerini ve konularını belirlemek isterler. Ayrıca kesitirmci modeller kullanarak, tahmin edebilecekleri davranışları belirlemek isterler. Predictive (kestirimci) modeller, geçmiş veriye bakarak gelecek sonuçları tahmin ederler. Örnek olarak borsa verilerini değerlendirmek ya da geçmiş kredi ödemelerine bakarak bir banka müşterisinin yeni kredi başvurusunu değerlendirmek vb. verilebilir.

Veri Analizi Çözüm Tipleri

Veri analizi çözümlerinin farklı formları vardır. İş sürecinin farklı ihtiyaçlarına göre hangisinin uygulanacağı değişkenlik gösterir. Veri üretmek için gerekli süreç, çözümün toplam ownership maliyeti (TCO –total cost of ownership-), ilişki ihtiyacı ve tahmin trendleri, hangi çözümün seçileceğini etkiler.

Relational Reporting:
Doğrudan OLTP veri kaynaklarından (canlı sistemlerin beslediği/beslendiği veritabanı sistemleri diyebiliriz) anlamlı veri çıkarmak için Sql Server Reporting Service 2005 gibi araçlar kullanılır. İlişkisel raporlama, kullanıcılara özet veri göstermek için hızlı ve efektif çözüm sunar. Veri, rapor üretildiği sırada özetlendiği için canlı sisteme büyük işlem yükü getirir. Buna çözüm olarak raporlar cache’lenebilir.

OLAP Reporting:
Olap sistemleri, çeşitli kategoriler üzerinden çeşitli düzeyde veriyi toplar ve saklar. Bu format interaktif analizler için idealdir ve tipik oltp raporlama uygulamalarına göre daha hızlı ve sezgiseldir. Canlı sistem tarafından taze veri ihtiyacına bğlı olarak belirli aralıklarla beslenen bir veri ambarı üzerinden bir raporlama aracı kullanılarak elde edilen çözümlerdir.

Data Mining :
Veri madenciliği, gizli modeller ve ilişkileri bulmak için büyük miktarda veri üzerinde çeşitli algoritmalar kullanarak arama yapma sürecidir. İş sorumlusu, sorumlu olduğu alanda süreci etkileyen ana sebepleri bilmesine rağmen bir veri madenciliği algoritması, etkenlerin her birini ağırlıklandırır ve gözden kaçabilen ilişkileri gösterebilir. Başarılı bir algoritma, geçmiş veriye bakarak gelecek verileri tahmin eder; ayrıca tahminler eldeki veriler ile test edilir. Veri madenciliği, OLTP ve OLAP sistemlerin her ikisi üzerinde de kullanılabilir.

Temel OLAP Konseptleri

OLAP çözümleriyle ilgili çok sayıda anahtar konsept mevcuttur. Analiz servis ile OLAP çözümleri planlanıp uygulandırken bu konseptlerin anlaşılmış olması önemlidir:

Data Warehouse (Veri ambarı):
Veri ambarı, iş analiz sürecine veri sağlamak için doğrulanmış farklı yapıdaki kaynak veriyi birleştirir. Veri ambarındaki veri, genellikle de-normalize durumdadır; böylece veri analizi için optimum şemayı oluşturmak ve veri ambarı tablolarından OLAP çözümünü inşa etmek kolaylaşır. Bir veri ambarı, data mart’ların sanal bir birleşimi ya da data mart’lardan kaynak veri sağlayan merkezileşmiş bir saklama yeri olabilir.

Data Mart:
Belli bir konu ya da iş aktivitesi üzerine veri sağlayan birkaç veri ambarı kümesidir.

Fact:
Facts, ağırlıklı olarak fiyat ya da miktar gibi nümerik ölçülerdir. Toplamak ve analiz etmek istenen anahtar iş parametrelerini temsil eder. Facts, hesaplamanın temellerini oluşturur ve çoğu zaman fact’leri bir dimension’ın üyeleri için toplarız.

Dimension (Boyut):
Dimension, fact’ler için bir alan oluşturur, sonucu etkileyen eksenlerdir. Toplanan, ortalaması alınan vb. fact’ler tarafından işin görünümü tanımlanır. Örneğin bir dimension, bir ürün ya da bir mağaza olabilir. Tipik bir sorgu ise her bir mağazada satılan her bir ürün biriminin toplam miktarlarını elde eden bir sorgu olabilir.

Cube:
Küp, çok boyutlu yapıların içerisinde işlenmiş (ya da özetlenmiş) fact ve dimension verisini saklar. Küpler, kendilerinden veri okunması için optimize edilmiştir ve kullanıcların veri ambarındaki veriye erişmek için giriş noktalarıdır.

Slicing and Dicing :
Bu terimler, iş analistlerinin OLAP kübü içerisindeki veriyi nasıl kullanacaklarını tanımlamak için kullanılırlar. Slicing, bir dimension’ın bir ya da faha fazla üyesini izole etmeyi ve onu diğer dimension’lar üzerinden hesaplamayı gerektirir. Örneğin her ay, her mağazanın bisiklet satışları hesaplanabilir. Bu örnekte bisiklet verisi döndürmek için ürün dimension’ı slice edilir. Dicing ise tek bir sonuç döndürmek için çoklu dimension’lardan üyeleri izole etmeyi gerektirir. Örneğin 2004 Mart’ında Münih’deki bisiklet satışları hesaplanabilir.

Pivot Table :
Pivot tabloları, kullanıcılara OLAP küplerini taramak için sezgisel bir arayüz sağlar. Kullanıcılar detaylı bilgi için drill down yaparak, özet bilgi için drill up yaparak pivot tablolarını kullabilirler. Aynı zamanda kullacılara veriyi slice ve dice edebilmek için de arayüz sağlamaktadır.

Bir sonraki makalede görüşmek dileğiyle...