SaaS應(yīng)用程序查詢和提取數(shù)據(jù)怎樣實(shí)現(xiàn)
掃描二維碼
隨時隨地手機(jī)看文章
每個SaaS應(yīng)用程序背后的數(shù)據(jù)庫存儲有關(guān)員工、供應(yīng)商、客戶及其他合作伙伴的業(yè)務(wù)信息。SaaS應(yīng)用程序支持諸多工作流程,比如面向銷售和營銷的CRM、面向財(cái)務(wù)的云ERP、面向人力資源的勞動力管理以及其他企業(yè)和部門服務(wù)。如今,許多公司使用眾多SaaS應(yīng)用程序:從Salesforce、Slack、Workday和Atlassian之類的主流產(chǎn)品,到許多小型的SaaS工具,不一而足。
SaaS應(yīng)用程序不會在孤島中運(yùn)行,大多數(shù)企業(yè)需要將它們的功能與私有云或公共云中管理的其他企業(yè)應(yīng)用程序集成起來。
如果跨多個應(yīng)用程序的工作流程需要集成應(yīng)用程序,開發(fā)團(tuán)隊(duì)可以利用SaaS平臺的API來觸發(fā)從一個平臺到另一個平臺的事件。許多應(yīng)用程序和服務(wù)需要集成時,可以選擇Boomi、SnapLogic或MuleSoft之類的企業(yè)集成平臺。如果需要遵循“如果這樣,需要那樣”模式的輕量級集成,IFTTT平臺可以提供有效的集成。如果開發(fā)團(tuán)隊(duì)在開發(fā)連接到多個SaaS和企業(yè)工作流程的新應(yīng)用程序,還應(yīng)探究Appian、OutSystems和PowWow之類的低代碼平臺。
利用SaaS數(shù)據(jù)以滿足不同的業(yè)務(wù)需求
如果你需要將來自SaaS平臺的數(shù)據(jù)與其他數(shù)據(jù)源集成起來怎么辦?可能需要跨SaaS工具集成數(shù)據(jù),出于這幾個原因:
業(yè)務(wù)分析員想使用該數(shù)據(jù)來開發(fā)報告和儀表板。
數(shù)據(jù)科學(xué)團(tuán)隊(duì)想要用于機(jī)器學(xué)習(xí)實(shí)驗(yàn)的數(shù)據(jù)。
業(yè)務(wù)團(tuán)隊(duì)想要集中數(shù)據(jù)以支持工作流程及其他類型的應(yīng)用程序。比如說,營銷團(tuán)隊(duì)常常使用客戶數(shù)據(jù)平臺或主數(shù)據(jù)平臺來集中有關(guān)客戶、產(chǎn)品和其他業(yè)務(wù)實(shí)體的數(shù)據(jù)。
IT團(tuán)隊(duì)?wèi)?yīng)提取備份所需的數(shù)據(jù),或?qū)?shù)據(jù)遷移到其他平臺。
法務(wù)團(tuán)隊(duì)有時需要對基礎(chǔ)數(shù)據(jù)執(zhí)行法律發(fā)現(xiàn)。
數(shù)據(jù)管理員常常想要清理、轉(zhuǎn)換或豐富基礎(chǔ)數(shù)據(jù)。
當(dāng)然,你可以利用SaaS平臺的API來提取數(shù)據(jù),但這可能需要大量的開發(fā)工作來學(xué)習(xí)API、了解SaaS平臺的數(shù)據(jù)模型、為任何新數(shù)據(jù)創(chuàng)建數(shù)據(jù)存儲區(qū)、編寫代碼以加載數(shù)據(jù),并為任何轉(zhuǎn)換開發(fā)邏輯。此外,IT團(tuán)隊(duì)要定義托管該應(yīng)用程序或服務(wù)的云或數(shù)據(jù)中心基礎(chǔ)架構(gòu)。最后,任何旨在按計(jì)劃或按需要運(yùn)行的數(shù)據(jù)集成都需要日常的支持。對于面臨其他更重要的優(yōu)先事項(xiàng)的開發(fā)團(tuán)隊(duì)和IT部門而言,從頭開始開發(fā)集成可能成本高昂。
另一種方法是考慮數(shù)據(jù)集成、數(shù)據(jù)流、ETL(提取轉(zhuǎn)換和加載)或其他數(shù)據(jù)準(zhǔn)備平臺。處理頻繁變化的大量數(shù)據(jù)時,使用數(shù)據(jù)集成平臺可能是最佳方法,因?yàn)檫@種平臺可實(shí)現(xiàn)靈活的提取和轉(zhuǎn)換。然而,在最終用戶訪問和使用信息之前,它們也需要事先開發(fā)集成機(jī)制。
可能需要查詢和管理SaaS數(shù)據(jù)的更輕量級的手段。有時,這種方法對于快速實(shí)驗(yàn)、發(fā)現(xiàn)和構(gòu)建原型很有用。有時,這種方法可以輕松用于運(yùn)營或生產(chǎn)需求,尤其在數(shù)據(jù)量很少且查詢吞吐量不大的情況下。以下是三種選擇。
1. 直接查詢SaaS應(yīng)用程序的BI平臺
如果你的主要需求是報告,那么許多自助式BI和數(shù)據(jù)可視化平臺可以直接連接到更流行的SaaS應(yīng)用程序。
Tableau可以連接到Intuit Quickbook、Google Analytics、LinkedIn Sales Navigator、ServiceNow、Eloqua、Marketo和Salesforce等平臺。
Microsoft Power BI還與Adobe AnalyTIcs、Facebook、GitHub、MailChimp、Stripe、Quick Base和Zendesk等在線服務(wù)集成。
Domo聲稱有1000多個連接件,支持的平臺包括HubSpot、Jira、Instagram、Qualtrics、Shopify、SurveyMonkey、Twitter和Workday等。
至少,這些集成提供了一種查詢和發(fā)現(xiàn)基礎(chǔ)SaaS數(shù)據(jù)源的簡易方法。往好里說,現(xiàn)成的集成足以使最終用戶創(chuàng)建所需的數(shù)據(jù)混合、報告和儀表板。
有幾個方面要考慮。
當(dāng)列有匹配的鍵時,這些平臺可支持連接和數(shù)據(jù)混合。如果在集成數(shù)據(jù)源或?qū)⑵渑c其他數(shù)據(jù)源混合之前需要大量的數(shù)據(jù)轉(zhuǎn)換,它們就變得較難使用。
評估是否通過實(shí)時查詢執(zhí)行SaaS數(shù)據(jù)集成,或者數(shù)據(jù)是提取還是緩存。
如果SaaS應(yīng)用程序含有大量數(shù)據(jù)、與許多其他數(shù)據(jù)源存在復(fù)雜的連接,或者儀表板將被許多用戶同時使用,性能可能是一個因素。
2. 模擬ODBC、JDBC、OData或其他驅(qū)動程序的平臺
如果業(yè)務(wù)需要的不僅僅是報告和儀表板,仍需要輕量級的集成方法,那么一些商業(yè)工具可將SaaS API轉(zhuǎn)換成標(biāo)準(zhǔn)數(shù)據(jù)庫驅(qū)動程序,比如ODBC、JDBC或OData。對于常用SaaS平臺的驅(qū)動程序而言,兩個選擇是Progress DataDirect和CData Driver Technologies。
如果數(shù)據(jù)科學(xué)團(tuán)隊(duì)想要在提取數(shù)據(jù)以供分析之前對SaaS數(shù)據(jù)庫執(zhí)行臨時查詢,驅(qū)動程序方法可能最有用。對于需要實(shí)時查詢SaaS應(yīng)用程序數(shù)據(jù)的應(yīng)用開發(fā)人員來說,這也是不錯的選擇。
開發(fā)和數(shù)據(jù)科學(xué)團(tuán)隊(duì)?wèi)?yīng)調(diào)查該集成的性能,尤其是在需要大量查詢、龐大數(shù)據(jù)集或低延遲的情況下。此外,許多SaaS應(yīng)用程序根據(jù)API使用情況來限制客戶或向客戶收費(fèi),因此如果需要更高的查詢量或數(shù)據(jù)量,這可能是個因素。
3. 可將SaaS數(shù)據(jù)同步到云數(shù)據(jù)庫的輕量級ETL平臺
最后一個方法是將數(shù)據(jù)集成從SaaS應(yīng)用程序搬到貴企業(yè)建立和管理的云數(shù)據(jù)庫中。該策略增添了一些操作復(fù)雜性和成本,如果需要實(shí)時查詢SaaS應(yīng)用程序數(shù)據(jù),可能不是理想的選擇。但它確實(shí)有幾個優(yōu)點(diǎn):
它讓企業(yè)可以更大程度地控制業(yè)務(wù)用戶、數(shù)據(jù)科學(xué)家(包括平民數(shù)據(jù)科學(xué)家)和應(yīng)用開發(fā)人員使用的數(shù)據(jù)庫平臺和數(shù)據(jù)架構(gòu)。平臺和架構(gòu)應(yīng)滿足容量、性能和延遲等方面的要求。
獨(dú)立于SaaS數(shù)據(jù)庫存儲數(shù)據(jù)可提供更大的靈活性,可根據(jù)下游用戶和應(yīng)用程序的要求,靈活地轉(zhuǎn)換、連接、清理或聚合數(shù)據(jù)。
如果面向查詢該數(shù)據(jù)的數(shù)據(jù)安全、數(shù)據(jù)隱私或其他數(shù)據(jù)治理控制措施有別于SaaS應(yīng)用程序中的訪問和權(quán)利控制措施,那么可能需要將數(shù)據(jù)托管在單獨(dú)的數(shù)據(jù)庫中。
獨(dú)立于SaaS平臺托管數(shù)據(jù)對于更高的數(shù)據(jù)量和查詢量需求而言可能更具成本效益。
雖然你可以將該集成與數(shù)據(jù)集成或準(zhǔn)備平臺結(jié)合起來,但是仍有一些SaaS數(shù)據(jù)集成平臺擁有可直接連接到許多SaaS應(yīng)用程序的機(jī)制。如果你的目標(biāo)是將數(shù)據(jù)從SaaS應(yīng)用程序流式傳輸?shù)皆茢?shù)據(jù)庫,Talend旗下的STItch是一款即插即用的解決方案。你可以選擇要復(fù)制的數(shù)據(jù)和復(fù)制頻次,但是它不提供用于轉(zhuǎn)換或過濾數(shù)據(jù)的任何工具。Skyvia提供了一款類似的產(chǎn)品,兩者都有讓開發(fā)團(tuán)隊(duì)可以試一試集成的免費(fèi)版本。谷歌云旗下的Alooma致力于將數(shù)據(jù)轉(zhuǎn)移至Google BigQuery、Amazon Redshift和Snowflake之類的大數(shù)據(jù)平臺,并提供一些數(shù)據(jù)轉(zhuǎn)換功能。
如果貴公司在使用許多SaaS平臺,那么一刀切的策略可能行不通。每條集成路徑都支持不同的SaaS集成,集成的類型必須與預(yù)期的業(yè)務(wù)需求相一致。比較工具并考慮多種選擇是一條優(yōu)選實(shí)踐,數(shù)據(jù)集成需求變化時尤為如此。