數(shù)據(jù)目錄解決方案旨在處理關(guān)鍵的數(shù)據(jù)管理問題,對于構(gòu)建了數(shù)據(jù)湖或大數(shù)據(jù)平臺的大型企業(yè)而言,弄清公司擁有哪些數(shù)據(jù)是極具挑戰(zhàn)性的工作。即使組織知道他們擁有什么數(shù)據(jù),也不總是知道哪些數(shù)據(jù)集是可信任的,哪些數(shù)據(jù)集的可靠性較差。在這種情況下,數(shù)據(jù)湖變得更像數(shù)據(jù)沼澤。
數(shù)據(jù)目錄工具可自動發(fā)現(xiàn)整個企業(yè)信息系統(tǒng)中的數(shù)據(jù)源。然后,它使用元數(shù)據(jù)管理功能來組織數(shù)據(jù),顯示不同數(shù)據(jù)之間的關(guān)系,通過搜索并跟蹤數(shù)據(jù)沿襲。許多工具還包括數(shù)據(jù)治理功能并支持用戶自助服務(wù),其中一些還包括詞匯表,以便用戶對術(shù)語有共同的理解。
目前,大多數(shù)數(shù)據(jù)目錄工具具有人工智能(AI)和機(jī)器學(xué)習(xí)(ML)功能。ML通常會提供一個可信評分,以顯示數(shù)據(jù)的可靠性,同時還可以提供一些建議并進(jìn)行基本分析。
一、如何選擇數(shù)據(jù)目錄軟件
如果您正在選擇數(shù)據(jù)目錄工具,請牢記以下提示:
考慮誰將使用數(shù)據(jù)目錄軟件。數(shù)據(jù)科學(xué)家與首席數(shù)據(jù)官(CDO)的需求截然不同,首席數(shù)據(jù)官(CDO)與業(yè)務(wù)分析師和首席財務(wù)官(CFO)的需求截然不同。選擇工具時,請確保軟件或服務(wù)的功能符合用戶的需求。
考慮您的部署需求。許多數(shù)據(jù)目錄工具都可以作為基于云的服務(wù)使用,但是如果您有獨特的安全性或合規(guī)性需求,或者您的數(shù)據(jù)存儲在外部的云和內(nèi)部部署系統(tǒng)中,那么這并非總是最佳選擇。
確保它將支持您的工作流程。數(shù)據(jù)目錄軟件需要與數(shù)據(jù)湖或其他數(shù)據(jù)平臺集成,并且需要考慮與您當(dāng)前的流程相適應(yīng)。如果您購買的工具需要您對日?;顒拥姆绞竭M(jìn)行重大更改,您可能會發(fā)現(xiàn)該工具用途有限或提供的價值有限。
要求演示和詳細(xì)的價格。一些供應(yīng)商提供前期定價,但許多供應(yīng)商不提供。進(jìn)行全面的總擁有成本(TCO)分析,以確保在評估時比較各種參數(shù)以達(dá)到最優(yōu)采購需求。
二、十大數(shù)據(jù)目錄軟件
作為一家純粹的數(shù)據(jù)治理和數(shù)據(jù)目錄供應(yīng)商,Alation聲稱是“業(yè)界領(lǐng)先的數(shù)據(jù)目錄”。它在64個國家/地區(qū)擁有300,000多個訂戶,其客戶包括Finnair,Blackstone,澳大利亞國防部,陶氏化學(xué),Albertsons,百事可樂,Expedia,PNC,美國運通,General Mills等。它獲得了無數(shù)贊譽,包括2020年KMWorld客戶選擇獎,2020年Gartner Peer Insights客戶選擇獎,并在2020年被評為Forrester Wave機(jī)器學(xué)習(xí)數(shù)據(jù)目錄的領(lǐng)導(dǎo)者。
Alation數(shù)據(jù)目錄的主要功能包括行為智能,無縫協(xié)作,引導(dǎo)式導(dǎo)航,數(shù)據(jù)治理功能以及與流行的大數(shù)據(jù)和BI工具以及API和Open Connector SDK的連接。它還為金融,醫(yī)療保健,保險,制造,零售和技術(shù)公司提供量身定制的解決方案。此外,它還有一個龐大的合作伙伴生態(tài)系統(tǒng),其中包括系統(tǒng)集成商,代理商和技術(shù)供應(yīng)商??筛鶕?jù)要求提供定價。該公司提供現(xiàn)場演示,并可以要求進(jìn)行個性化演示。
優(yōu)點
Alation提供了出色的機(jī)器學(xué)習(xí)功能,包括集成到其行為分析引擎中的功能。
企業(yè)還對Alation的協(xié)作功能給予了很高的評價,這對于遠(yuǎn)程辦公的團(tuán)隊特別有用。
該公司是數(shù)據(jù)目錄技術(shù)的早期開拓者之一,并繼續(xù)以技術(shù)領(lǐng)導(dǎo)者的身份脫穎而出。
缺點
一些客戶抱怨Alation的許可條款,并說該工具可能非常昂貴。
當(dāng)該公司推出新版本時,該工具有時會出現(xiàn)故障。
Alation并不總是在數(shù)據(jù)沿襲方面做得最好,但是最近它改進(jìn)了在該領(lǐng)域的功能。
總部位于澳大利亞的Alex Solutions將其產(chǎn)品描述為一種元數(shù)據(jù)管理解決方案,其中包含了數(shù)據(jù)目錄和數(shù)據(jù)治理功能。它主要為金融、電信,零售和公用事業(yè)領(lǐng)域的企業(yè)提供服務(wù),并在澳大利亞、歐洲、美洲和亞洲擁有客戶。Gartner和Forrester已將其評為市場領(lǐng)導(dǎo)者。
Alex提供數(shù)據(jù)目錄,業(yè)務(wù)詞匯表,策略驅(qū)動的數(shù)據(jù)質(zhì)量,智能標(biāo)記,與技術(shù)無關(guān)的元數(shù)據(jù)掃描和工作流功能。它的元數(shù)據(jù)管理功能可用于數(shù)據(jù)清單,使用情況分析,敏感性檢測,數(shù)據(jù)沿襲支持,風(fēng)險管理等。它的機(jī)器學(xué)習(xí)功能非常先進(jìn),并且具有直觀的界面。演示和價格可根據(jù)要求提供。
優(yōu)點
Alex Solutions產(chǎn)品具有廣泛的功能。
客戶說這很容易部署和使用。
亞歷克斯的血統(tǒng)分析尤其值得關(guān)注。
缺點
將Alex產(chǎn)品與數(shù)據(jù)科學(xué)和BI解決方案集成起來并不像使用其他一些數(shù)據(jù)目錄產(chǎn)品那樣容易。
該產(chǎn)品的協(xié)作能力還需要進(jìn)一步改善。
一些客戶表示,他們希望為業(yè)務(wù)用戶提供更好的培訓(xùn)。
Collibra旨在通過其數(shù)據(jù)智能云,平臺,數(shù)據(jù)目錄,數(shù)據(jù)治理,數(shù)據(jù)沿襲和數(shù)據(jù)隱私產(chǎn)品使數(shù)據(jù)有意義。它的客戶包括Adobe,AXA XL,DNB,Equifax,霍尼韋爾,NetApp,阿斯利康,瑞士信貸,戴爾,T-Mobile,摩根大通,Progressive,Cigna,洛克希德·馬丁,Verizon等。Forrester和Gartner都將該公司評為領(lǐng)導(dǎo)者,并且還獲得了《福布斯》,《商業(yè)內(nèi)幕》,Datanami,Battery Ventures等公司的獎項。
Collibra的數(shù)據(jù)目錄產(chǎn)品包括廣泛的本地連接,基于ML的自動化,數(shù)據(jù)評分和嵌入式數(shù)據(jù)治理功能。定價和演示可根據(jù)要求提供。
優(yōu)點
用戶對Collibra的數(shù)據(jù)智能功能和圖形技術(shù)給予了很高的評價。
對于具有復(fù)雜數(shù)據(jù)治理需求和廣泛數(shù)據(jù)源的大型企業(yè)而言,這是一個不錯的選擇。
該公司擁有強大的第三方合作伙伴和支持用戶群的生態(tài)系統(tǒng)。
缺點
當(dāng)用戶抱怨Collibra時,通常是他們發(fā)現(xiàn)最多錯誤的界面。
一些客戶不喜歡公司最近對云產(chǎn)品的重視,因為這可能使遵守安全策略變得困難。
雖然該公司在整體服務(wù)上獲得了良好的評價,但一些客戶報告說一些服務(wù)代表很差。
Data.world是專注于數(shù)據(jù)目錄功能的純供應(yīng)商。它的客戶包括AP,Mirum,WPP,Yonder等。Forrester將其命名為“杰出表現(xiàn)者”,而Gartner則將其稱為“挑戰(zhàn)者”。
作為云技術(shù)的本地產(chǎn)品,Data.world提供上下文數(shù)據(jù)分類,其中包括元數(shù)據(jù),儀表板,分析,代碼,文檔,項目管理和社交協(xié)作功能。它還結(jié)合了知識圖技術(shù)并提供實時集成功能。此外,該公司遵循敏捷開發(fā)流程,不斷發(fā)布更新和功能改進(jìn)。
與許多其他數(shù)據(jù)目錄供應(yīng)商不同,Data.world在其網(wǎng)站上發(fā)布其定價。企業(yè)版產(chǎn)品包括Essentials(每年50,000美元及以上),Standard(每年100,000美元及以上),Premier(每個150,000美元)年及以上)和Premier Plus(自定義定價)。提供演示和免費試用版。
優(yōu)點
該產(chǎn)品的前期定價使您很容易計算此工具的成本,并評估其價值是否值得。
該工具的用戶界面是最易于使用的工具之一。
Data.world是一家致力于提供社會福利的公益性公司,其中包括免費訪問許多數(shù)據(jù)集,支持?jǐn)?shù)據(jù)新聞以及免費提供教育和社區(qū)資源。
缺點
作為較年輕的產(chǎn)品,Data.world的功能集還不成熟。
該公司沒有其他供應(yīng)商那樣多的第三方合作伙伴和集成。
它沒有為美國以外的客戶提供太多支持。
Erwin以前是CA Technologies的一部分,后來被Quest Software收購,他專注于企業(yè)數(shù)據(jù)治理體驗(EDGE)的產(chǎn)品,包括業(yè)務(wù)流程建模,企業(yè)體系結(jié)構(gòu),數(shù)據(jù)建模,數(shù)據(jù)目錄和數(shù)據(jù)文化。它已經(jīng)運營了三十多年,其客戶包括Adecco,Balfour Beatty Construction,CenturyLink,F(xiàn)idelity International,蘇格蘭皇家銀行等。它贏得了無數(shù)贊譽,包括被Gartner任命為Leader以及被Forrester提名為Contender。
Erwin將Data Catalog(DC)作為獨立產(chǎn)品或作為其Data Intelligence套件的一部分提供。Erwin DC的好處包括集中的數(shù)據(jù)治理框架,元數(shù)據(jù)驅(qū)動的方法,加快的項目交付,提高的數(shù)據(jù)質(zhì)量,法規(guī)遵從性和準(zhǔn)確的分析。它包括元數(shù)據(jù)管理,映射管理,參考數(shù)據(jù)管理,生命周期管理,業(yè)務(wù)數(shù)據(jù)概要分析和數(shù)據(jù)集成。某些Erwin產(chǎn)品的價格可在線獲得,但對于Data Intelligence和Data Catalog產(chǎn)品,則需要聯(lián)系代表。可以免費試用。
優(yōu)點
Erwin提供了非常廣泛的數(shù)據(jù)治理功能。
該公司以擅長數(shù)據(jù)建模而聞名,這影響了其數(shù)據(jù)目錄功能。
供應(yīng)商擁有龐大,強大的客戶,合作伙伴和零售商生態(tài)系統(tǒng)。
缺點
產(chǎn)品的初始部署可能很復(fù)雜且耗時。
該產(chǎn)品可能比其他產(chǎn)品更昂貴。
該界面不像其他軟件那樣易于使用。
Google Cloud Data Catalog是Google Cloud數(shù)據(jù)分析產(chǎn)品的一部分,是一項具有數(shù)據(jù)發(fā)現(xiàn)和元數(shù)據(jù)管理功能的完全托管的云服務(wù)。它可在全球23個不同地區(qū)使用。Google還與Collibra,Tableau和Informatica建立了戰(zhàn)略合作伙伴關(guān)系。
該服務(wù)的主要功能包括無服務(wù)器架構(gòu),元數(shù)據(jù)即服務(wù),中央目錄,搜索和發(fā)現(xiàn),模式化元數(shù)據(jù),云DLP集成,本地連接,云身份和訪問管理(IAM)集成和治理功能。它提供了一個多維搜索界面,元數(shù)據(jù)同步和標(biāo)記,易于擴(kuò)展的功能以及與云數(shù)據(jù)丟失防護(hù)(DLP)和其他Google Cloud服務(wù)的集成。
定價可從網(wǎng)站上獲得,但有些復(fù)雜。每月最多可免費存儲1 MiB,超出的每個GiB每月收費100美元。前100萬次API調(diào)用是免費的,之后每10萬次API調(diào)用費用為10美元。新客戶還可以使用Google Cloud的免費試用版。
優(yōu)點
使用Google Cloud Services的組織強調(diào)其便捷的集成功能。
它的可擴(kuò)展性也得到很高的評價。
服務(wù)非常實惠。
缺點
Google服務(wù)沒有大多數(shù)純服務(wù)提供商所提供的功能那么多。
它沒有與其他某些數(shù)據(jù)目錄產(chǎn)品一樣多的數(shù)據(jù)源集成。
由于定價取決于使用情況,因此可能難以根據(jù)需求規(guī)模估算總成本。
由Pentaho,Hitachi Data Systems和Hitachi Insight Group合并而成,Hitachi Vantara出售存儲硬件,融合和超融合基礎(chǔ)設(shè)施,物聯(lián)網(wǎng)(IoT)解決方案,視頻智能,IT運營管理軟件和數(shù)據(jù)保護(hù)軟件以及數(shù)據(jù)管理和分析軟件。其Lumada數(shù)據(jù)目錄軟件是其數(shù)據(jù)管理和分析產(chǎn)品的一部分,Kaiser Permanente,F(xiàn)annie Mae和Johnson Controls等組織都在使用該軟件。Forrester將Lumada Data Catalog評為杰出表現(xiàn)者。
基于Hitachi Vantara購買Waterline Data時獲得的技術(shù),Lumada Data Catalog提供了非常先進(jìn)的機(jī)器學(xué)習(xí)和行為智能功能。它保證了更快的數(shù)據(jù)標(biāo)記,并包括AI驅(qū)動的發(fā)現(xiàn),端到端數(shù)據(jù)沿襲,自助數(shù)據(jù)訪問,敏感數(shù)據(jù)管理和跨部門協(xié)作等功能??筛鶕?jù)要求提供定價和演示。
優(yōu)點
Lumada數(shù)據(jù)目錄具有高度先進(jìn)的ML和行為智能功能。
分析人士說,它的血統(tǒng)分析功能是目前可用的最好的功能之一。
客戶稱贊其界面友好易用。
缺點
它的數(shù)據(jù)治理能力可能需要進(jìn)一步改善。
與某些產(chǎn)品相比,該產(chǎn)品與第三方應(yīng)用程序的連接數(shù)量不多。
它的協(xié)作能力也有改進(jìn)的空間。
Infogix成立于1982年,當(dāng)時是一家名為Unitech Systems的風(fēng)險與合規(guī)軟件供應(yīng)商,現(xiàn)在提供一個名為Data360的數(shù)據(jù)智能平臺,該平臺包括數(shù)據(jù)目錄,數(shù)據(jù)治理,數(shù)據(jù)質(zhì)量和數(shù)據(jù)分析功能。它的客戶包括Total Health Care,Swedbank,Keurig和Johnson&Johnson。Gartner將該公司命名為“挑戰(zhàn)者”,而Forrester則稱其為競爭者。
Data360中的關(guān)鍵數(shù)據(jù)目錄功能包括自動元數(shù)據(jù)管理,基于機(jī)器學(xué)習(xí)的搜索和發(fā)現(xiàn),智能業(yè)務(wù)詞匯表,數(shù)據(jù)沿襲,影響分析等。該公司還提供專業(yè)服務(wù),培訓(xùn)和支持。演示和價格可根據(jù)要求提供。
優(yōu)點
完整的Data360平臺具有廣泛的數(shù)據(jù)智能功能。
該工具在幫助組織量化其業(yè)務(wù)數(shù)據(jù)和管理數(shù)據(jù)資產(chǎn)的價值方面做得非常好。
該軟件非常易于使用。
缺點
某些功能(如分析功能)還需要進(jìn)一步完善。
在復(fù)雜的企業(yè)環(huán)境中,該工具并非總是能很好地處理大數(shù)據(jù)量。
一些客戶抱怨文檔不足。
作為最著名的數(shù)據(jù)目錄供應(yīng)商之一,Informatica提供了一個智能數(shù)據(jù)平臺,該平臺集成了多種基于云的企業(yè)數(shù)據(jù)管理產(chǎn)品。其數(shù)據(jù)目錄客戶包括Avis預(yù)算集團(tuán),AXA XL,禮來公司,洛杉磯汽車,友邦保險新加坡和方濟(jì)各會聯(lián)盟。Gartner連續(xù)五年將公司評為領(lǐng)導(dǎo)者。Forrester將其列為有力競爭者。
Informatica的企業(yè)數(shù)據(jù)目錄提供了利用AI技術(shù)的企業(yè)范圍數(shù)據(jù)發(fā)現(xiàn)功能。它在其業(yè)務(wù)環(huán)境中提供了數(shù)據(jù)的整體視圖。關(guān)鍵功能包括AI驅(qū)動的自動化,數(shù)據(jù)供應(yīng),端到端數(shù)據(jù)沿襲,集成的數(shù)據(jù)質(zhì)量功能和協(xié)作能力。可根據(jù)要求提供定價。Informatica提供了一些工具的免費試用版,但沒有提供數(shù)據(jù)目錄。
優(yōu)點
使用Informatica工具的組織通常會發(fā)現(xiàn)公司的數(shù)據(jù)目錄服務(wù)非常適合他們的需求。
它的元數(shù)據(jù)智能引擎是市場上最好的。
它具有高度的可擴(kuò)展性,使其成為組織創(chuàng)建基于云的數(shù)據(jù)湖的組織的不錯選擇。
缺點
在某些情況下,可能難以部署Informatica的解決方案。
企業(yè)數(shù)據(jù)目錄沒有許多其他數(shù)據(jù)目錄中內(nèi)置的數(shù)據(jù)治理功能。
一些客戶提到了定價和總擁有成本問題。
過去,IBM作為其InfoSphere產(chǎn)品線的一部分提供本地數(shù)據(jù)目錄軟件,但是目前它主要專注于基于云的IBM Watson Knowledge Catalog。使用該服務(wù)的組織包括Danske銀行和Standard Bank Group。Gartner和Forrester均將IBM評為該市場的領(lǐng)導(dǎo)者,該工具還獲得了2020年Gartner Peer Insights客戶選擇獎。
可以通過IBM Cloud Pak for Data將IBM Watson Knowledge Catalog部署在IBM Cloud或私有云上。值得注意的功能包括智能發(fā)現(xiàn)建議,端到端目錄,自動化數(shù)據(jù)治理,數(shù)據(jù)沿襲,質(zhì)量得分和自助服務(wù)。它還包括數(shù)據(jù)質(zhì)量,協(xié)作和合規(guī)性功能。
如果要在IBM Cloud Pak for Data上部署IBM Watson Knowledge Catalog,則需要與公司聯(lián)系以進(jìn)行定價。如果您在IBM Cloud上將其作為服務(wù)購買,則可以選擇三種不同的定價級別:精簡版(免費),標(biāo)準(zhǔn)版(每實例300美元,每容量單位小時0.50美元,每增加一個用戶50美元)和專業(yè)版(7,000美元)每個實例,每個容量單位小時$ 0.40,每個額外用戶$ 300)。
優(yōu)點
該服務(wù)與其他IBM產(chǎn)品和服務(wù)很好地集成在一起。
Cloud Pak for Data部署選項通常非常適合具有非常大且復(fù)雜的生態(tài)系統(tǒng)的企業(yè)。
IBM Cloud部署的前期定價使估算成本變得容易。
缺點
IBM產(chǎn)品的界面不像其他一些可用選項那樣易于使用。
部署可能既困難又耗時。
一些客戶抱怨Cloud Pak for Data定價過高。
三、數(shù)據(jù)目錄軟件比較