Makale Özeti

İş zekası yazı dizisini diğer yazı dizileri devam ederken başlatmak istedim. Bu konuda teoriden pratiğe devam edecek bir seyir izleyerek bir yandan kavramları detayıyla ayırt edecek diğer yandan ilerideki vaka analizlerinde bu kavramların muhteviyatından faydalanacağız.

Makale

İş zekası yazı dizisini diğer yazı dizileri devam ederken başlatmak istedim. Bu konuda teoriden pratiğe devam edecek bir seyir izleyerek bir yandan kavramları detayıyla ayırt edecek diğer yandan ilerideki vaka analizlerinde bu kavramların muhteviyatından faydalanacağız. İş zekası ile tanışıklığım bu ay 2. senesini doldurmuşken geleceğin altın madeni kabul edilen BI konularında konuya ilgisi olan arkadaşlara basitten başlayarak aktaracağım bilgilerin yanında Koray da OLAP ve Datamining yazılarında daha çok vaka analizi (case-study) odaklı anlatımlar aktaracak. datawarehousevsdatamartDatawarehouse (Veri Ambarı): Her zaman değil ama genellikle bir ya da iki küp barındırıan tekil yapıdır. Veri ambarları organizasyonun verilerinin büyük kısmını kümelenmiş (aggregated) ya da toparlanmış (rolled up) ve salt okunur (read-only) görünümünü tutmak için kullanılırlar ve bazı zamanlar bu yapılar istemci sorgulama araçlarını (client query tools) da içermektedir. Datamart (Veri Kümesi): Bir veriambarının tanımlı alt grubu (subset) olan yapılar olup sıklıkla bir grubun tek kübünü içerirler. Tek bir küp büyük bir kitlenin (ki bu bütün organisazyondur) bir iş birimini (örneğin; finans) sunmaktadır. Analysis Services 2000’de veri kümeleri ürünün limitlerinden kaynaklı organizasyonun temel (basic) birimleriydi ancak bu durum Analysis Services 2005’den sonra bir vaka olmaktan çıktı ve artık veri ambarları genelde sadece tek küpten oluşan yapılar halini aldılar. Cube (Küp): Klasik veri ambarlama (data warehousing) ürünleri tarafından genelde çoğunlukla normalize olan birçok tablo yerine kullanılan depolama (storage) yapılarıdır. Satır (row) ve sütunlardan (column) oluşan tabloları kullanmaktan ziyade, küpler boyut (dimension) ve ölçüm (measure) ya da diğer adıyla nitelik (fact) kullanmaktadır. Aynı zamanda küpler herbir bireysel parça (ya da satır) yerine çoğunlukla kümelenmiş (aggregated) hatta toplanmış (summed) veri sunmaktadırlar. Bunu daha net şekilde açıklamak ve belirtmek gerekirse; Küpler detaylı veri sunan normalize edilmiş (normalized) tablo kaynaklarına karşılık kurumsal verilerin özetlenmiş (summarized) ve kümelenmiş (aggregated) görünümünü sunarlar. Küpler kaynak (source) ya da üretim ortamı (production) verisinin salt okunur (read-only) bir kopyasıyla türetilmişlerdir. Bazı durumlarda üretim verisinin tam kopyasını barındıran küpler diğer durumlarda da kaynak verinin alt gruplarını (subset) içerirler. Veriler kaynak sistemlerden hedef (destination) küplere ETL (Extract, Transform and Load) süreçleri yoluyla taşınırlar. Bu kavramlar çok keskin hatları olan tanımlar barındırıyor gibi görünse de genel adlandırmalar kurumsal projelerde form değiştirebilirler. Örneğin şirketimizde başlattığımız ikinci nesil BI platformu projesinin OLAP bacağından kabataslak bir örnek yapı kesiti sunarak yazımızda bahsettiğimiz kavramları somutlaştıralım.

fujitsuolapframework