基于可視化的數(shù)據(jù)發(fā)現(xiàn)是現(xiàn)代分析和商業(yè)智能(BI)平臺(tái)的一個(gè)重要特征.。這股新的潮流始于2004年左右,此后,市場(chǎng)和新的購(gòu)買趨勢(shì)從以IT為中心的記錄系統(tǒng)(SOR)轉(zhuǎn)向以業(yè)務(wù)為中心的、帶有自助服務(wù)的敏捷分析?,F(xiàn)代分析和BI平臺(tái)的特點(diǎn)是易于使用的工具,支持全面的分析工作流功能。它們不需要信息技術(shù)的大量參與就可以預(yù)先定義數(shù)據(jù)模型作為分析的先決條件,而且在某些情況下,將自動(dòng)生成可重用的數(shù)據(jù)模型(見(jiàn)“現(xiàn)代分析和商業(yè)智能平臺(tái)的技術(shù)洞察力”)。一個(gè)獨(dú)立的內(nèi)存柱狀引擎可以促進(jìn)探索,但也可以快速成型.?,F(xiàn)代分析和BI平臺(tái)可以有選擇性地從傳統(tǒng)IT建模的數(shù)據(jù)結(jié)構(gòu)中獲取資源,以促進(jìn)整個(gè)組織的治理和可重用性。許多組織可以通過(guò)以敏捷的方式擴(kuò)展IT建模結(jié)構(gòu)并將其與新的多結(jié)構(gòu)數(shù)據(jù)源相結(jié)合來(lái)開(kāi)展他們的現(xiàn)代化工作。
這是Gartner2018年報(bào)告中對(duì)市場(chǎng)的開(kāi)篇描述,從中我們可以看到傳統(tǒng)BI的數(shù)據(jù)模型是“預(yù)定義“,而現(xiàn)代分析和BI平臺(tái)的數(shù)據(jù)模型是”自定義“。其實(shí)這符合以業(yè)務(wù)為中心的Self-BI總體背景,預(yù)定義意味著”求人”,自定義意味著“效率”。而追求高效率的運(yùn)行方式不正是企業(yè)運(yùn)營(yíng)的本質(zhì)么!
Smartbi V8.5是如何踐行自助式的數(shù)據(jù)準(zhǔn)備呢,我們一起來(lái)看看自助數(shù)據(jù)集的功能和原理。簡(jiǎn)單來(lái)說(shuō),自助數(shù)據(jù)集的功能是:跨庫(kù)查詢、模型設(shè)計(jì)、抽取控制。其實(shí)對(duì)于熟悉數(shù)據(jù)倉(cāng)庫(kù)和ETL的技術(shù)人員來(lái)說(shuō),這就對(duì)應(yīng)目標(biāo)建模、Mapping和ETL作業(yè),但由于使用者從開(kāi)發(fā)階段的技術(shù)人員變成運(yùn)行階段的業(yè)務(wù)人員,因此很多功能細(xì)節(jié)是差異很大的。
功能一:跨庫(kù)查詢
凡是提到數(shù)據(jù)準(zhǔn)備,異構(gòu)數(shù)據(jù)源、信息孤島是最經(jīng)常被提及的,如果只能讀取一個(gè)固定數(shù)據(jù)源,那肯定不能稱之為“平臺(tái)”,Smartbi V8.5提供跨庫(kù)查詢的引擎,只要新建一個(gè)數(shù)據(jù)源,就會(huì)同步體現(xiàn)在這個(gè)跨庫(kù)查詢引擎中。
無(wú)論是跨庫(kù)還是單個(gè)數(shù)據(jù)庫(kù),查詢對(duì)于使用者都會(huì)需要做表關(guān)聯(lián),甚至還需要嵌套查詢(將可視化查詢、SQL查詢、原生SQL查詢、存儲(chǔ)過(guò)程查詢、JAVA查詢、組合分析和透視分析做為數(shù)據(jù)源),以及設(shè)置篩選條件、計(jì)算新字段等等。這些常用功能在自助數(shù)據(jù)集里都是可以支持的,而且操作方式都采用拖拽點(diǎn)選,無(wú)須任何專業(yè)計(jì)算機(jī)語(yǔ)言。
功能二:模型設(shè)計(jì)
自服務(wù)數(shù)據(jù)準(zhǔn)備,其結(jié)果必定也是一個(gè)數(shù)據(jù)模型,便于后續(xù)的可視化、表格化、報(bào)告化的展現(xiàn)和分析。自助數(shù)據(jù)集允許用戶輕松分組歸類、改別名、改類型、隱藏字段,也可以一鍵定義日期維和地理維字段,便于支持后續(xù)的鉆取分析。當(dāng)然所有的數(shù)據(jù)分析都會(huì)區(qū)分兩大類:維度和度量,這是最基本的概念。最后,你可以隨時(shí)預(yù)覽數(shù)據(jù),,以確認(rèn)自己的模型設(shè)計(jì)是否滿足預(yù)期的想法。
功能三:抽取控制(可選)
首先抽取不是必須的,如果你的數(shù)據(jù)源性能足夠好,自助數(shù)據(jù)集就相當(dāng)于一個(gè)實(shí)時(shí)SQL,查詢到的始終是最新的。但往往我們的數(shù)據(jù)源性能不特別好,尤其是跨庫(kù)查詢產(chǎn)生了一個(gè)有意義的數(shù)據(jù)分析模型,用戶更希望能增量更新數(shù)據(jù),以確保其可用性,這時(shí)抽取就變得非常必要了。在Smartbi V8.5的自助數(shù)據(jù)集界面,隨時(shí)可以定義抽取規(guī)則,甚至立刻啟動(dòng)數(shù)據(jù)抽取。
抽取的規(guī)則包括定時(shí)抽取、立刻抽取,全量抽取、增量收取等等,甚至還可以設(shè)置覆蓋最后抽取的N天數(shù)據(jù)(Vertica),以及出現(xiàn)異常時(shí)回滾還是繼續(xù)。這些與數(shù)據(jù)倉(cāng)庫(kù)的ETL作業(yè)是一樣的。
那我為什么強(qiáng)調(diào)可重用呢,首先還是其使用的時(shí)間成本很低,可以反復(fù)修改和試錯(cuò),其次是同一個(gè)自助數(shù)據(jù)集可以通過(guò)數(shù)據(jù)權(quán)限跨部門使用,不同的用戶看到不同的數(shù)據(jù)結(jié)果。
有了自助數(shù)據(jù)準(zhǔn)備的能力,企業(yè)構(gòu)建面向業(yè)務(wù)的自助分析平臺(tái)時(shí)就有了更多的選擇,最重要的價(jià)值是數(shù)據(jù)分析工作的需求不僅僅是報(bào)表和可視化,對(duì)數(shù)據(jù)的前期篩選、關(guān)聯(lián)、計(jì)算是必須的,這也是自助分析平臺(tái)可以真正從Office Excel把業(yè)務(wù)人員“搶過(guò)來(lái)”的關(guān)鍵(雖然個(gè)人力挺使用Excel)。
聯(lián)系客服