在推進組織數位轉型的過程中,也許組織建立了極具支撐性的數位策略、培養了相應的數位文化、同時也豐富了組織的數位能力與人才、且導入相關的科技,不過真正讓領先企業持續領先的,其實是數據,更明確一點說是「數據生態系統管理」。
要真正的理解數據生態系統,我們可以將其拆成四個環節,從數據的獲取、數據的架構、數據的治理、一直到數據的應用。
在這幾年間,只要談到數據,話題往往圍繞在大數據分析、人工智慧、機器學習、或是神經網路等等。 確實,對於很多企業來說,許多高階分析技術可以在商業的各個層面創造龐大價值,但這都必須要建立於數據的有效性、真實性、還有完整度等等要素。 而這所謂的數據的有效性、真實性、以及完整度,則必須要建立於一個健全的數據管理系統,不然各個環節的數據可能散在各地、難以清理、甚至數據本身很有可能根本不具充足的商業價值。
舉一個例子來說,我的團隊於去年年底時,接下了一個協助 FMCG 產業的客戶導入顧客旅程地圖的管理模式,目的是要與他們一同建立起以消費者的需求為核心出發的運 營模式。 當項目起跑第一天,我們就清楚的意識到了這個項目的困難度。不僅組織內部的數據沒有中央管理、團隊更是缺乏所謂的數據管理的好習慣,同時,他們的經銷商以及子公司也都使用徹底不同的系統以及管理方法,彼此更是缺乏溝通。 在這樣子的環境之下,要建立起顧客旅程地圖可以說是非常困難的一大挑戰, 最終我們花了超出預期的時間才成功的將其建立完成,將電商、社群銷售、經銷商、實體店面等渠道的銷售數據與客戶名單串連在一起,並且實時的更新這些數據,並讓各個團隊都能隨時獲取這筆資訊,應用於分析、報告、還有決策等流程。
要真正的理解數據生態系統,我們可以將其拆成四個環節,從數據的獲取、數據的架構、數據的治理、一直到數據的應用。
數據的獲取 Data Sourcing,在獲取數據上,有三個重點是任何要做好數據管理的組織都必須要思考的。 第一個是正確性,BCG 曾經服務過一個國際銀行客戶,而當時參 與項目發展的合夥人Salvatore Cali,在檢視基本的人口數據時發現,在這個國際銀行的客戶名單中,竟有超過 10%的客戶為來自阿富汗的會計師,再進一步的挖掘原因後,他們團隊發現導致這個現象的原因僅是因為在網頁上填寫資料時,阿富汗以及會計師,因為兩個都是 A 開頭的英文字,所以都會出現在第一個,而時常客戶可能為了求方便或是其他原因即隨意選擇了第一個選項。
有趣的是,這其實並非個案,在產業中,稱如此狀況為常態也許也不為過,Tadhg Nagle 所主導的一份研究也發現,僅有 3%的企業,其數據的品質有達到最基本的標準,同一份研究也發現,平均下來,企業所獲取的新數據中,有 47%至少涵蓋著一筆或是以上的重大錯誤。
不過更有趣的是,若撇開是否有發現數據存在著問題,通常在解決數據獲取的正確性的問題上,執行的難易度都是非常簡單的。而在組織上下落實培養一些數據的好習慣即是對於欲發展數位轉型的業者來說至關重要的。
第二個重點即是數據的乾淨與否,頻繁與數據打交道的人一定清楚數據清理是多麼令人重新思考職涯規劃。也許現在我們可以利用 R 或是 Python 快速地寫一些判斷式的 Script 以清理這些數據,抑或是通過 Alteryx 和 Tableau Prep 等數據工具來減少數據清理所花的時間。 然而在取得新的數據時,時常同時也取得了新的問題,而這些問題是原本的 Script 中所沒有顧及到的,那也代表了必須要再為了它而重新清理一次,不難想像這不是一個長期手段。
在數據的獲取品質管理上,最理想的方法是在最初的規劃即考慮到後續的數據問題,並盡可能地在每一階段的執行上,最小化後續數據清理的負擔。同時當然,有效的應用一些相關的數據工具,也能大幅提高數據分析人員的效率,並讓他們能夠將時間分配在更為重要的環節點上(報告、分析、以及決策等)。
第三個重點是數據的整合,簡單來說就是當不同的數據源所產生的數據,如果彼此相關的話,能否整合在一起,讓分析人員能夠擁有一個更加全面的角度?
涅槃經上有記載到,有一個古印度寓言故事充分的體現了當數據沒有整合時會出現的問題,這個叫做盲人摸象的故事上面寫道,「…其觸耳者,言象如箕;其觸頭者,言象如石;其觸鼻者,言象如杵…」。 時常在做策略規劃時,另決策者最害怕的並非錯誤抑或是雜亂的數據,而是容易讓人誤解的數據。 正如同故事中的那五位盲人一樣, 每一個人的觀察都沒有錯,然而最後每一個人的結論皆大錯特錯。
如此狀況在行銷與銷售上非常普遍,畢竟不同於實驗室或是像製造業、物流等較為流程驅動的業務,市場的數據時常非常片面且往往充滿著陷阱。譬如以行銷渠道上的歸屬模式為例,在較為高階的分析方式尚未滲透數位行銷時,我們在決定哪一個渠道的行銷投資產生了最大效益時,時常會以最後一個接觸點來判斷 MROI,最終再基於這一層理解決定下一次的預算分配。 如此水平性的分析方法會忽視了該客戶轉換前,所有經歷過的接觸點,也就是整個顧客旅程,那麼很有可能就導致了災難性的結果。
在獲取數據的環節上導致數據整合出現問題的通常都是第三方工具的關係,許多企業現在正從 All-in-One 的解決方案轉移至 Best-in-Breed 的工具,通過 API 等方式整合不同的數據源,最後再模組化的管理整個數據生態系統。
數據的架構 Data Architecture,時常數據架構與數據治理會混著談,在產業上也沒有一個統一的定義,不過在 OOSGA,我們定義數據架構為 IT 層面等技術上的基礎建設,而數據治理則是工作流程、數據人員、以及管理與溝通的層面。
時常在數據架構上,或稱數據的 IT 基礎建設,是對於發展數位轉型的組織來說在數據上最具挑戰的一個主題。 通常好幾十年的公司其內部的數據管理系統都散在各處,且甚至可能使用徹底不同的工具做管裡,而如此狀況就會導致企業在數據應用上的各種困難。
在這個主題上,這幾年間成長最為快速的趨勢大概就是雲端了,許多企業開始轉移雲端不僅是為了部署成本較低、較好的擴展性、以及安全性,同時,也是因為雲端上各種工具的高易用性以及高彈性的因素(譬如 Kubernetes),能使企業更好的執行數據管理。
數據的治理 Data Governance,也就是撇開 IT 基礎建設不談的數據管理,常常是企業所忽略,但卻是最為重要的層面之一。 在談到數位轉型以及數據的重要性時,我們時常聽到「我們公司沒有這樣子的系統」、「我們的 Legacy IT 太多且太雜了,不太可能做到那樣..」、「要做到如此,那可能就要徹底更新系統」。 其實在很多情況,徹底替換舊有核心系統常常是數位轉型道路上必經的一條路,然而那通常是在數位文化的培養已經到一個階段,且人員也清楚意識到轉型的迫切性與其價值時,再去做的。
與其將問題聚焦於 IT 上,組織真正要思考的反而是如何有效的執行數據治理,而要做好數據治理,有兩個核心原則是組織上下都必須要落實執行的,其分別為好的習慣、 以及好的架構與流程。
第一為好的習慣,數據治理是馬拉松,而非短跑,也就是這並非是一個三個月的項目或是半年的專案,而是組織必須要持續進行、維護、以及更新。 從非常小的習慣,像是檔案名稱、不同檔案的管理方式,到比較重要的習慣,譬如數據需求以及數據政策的落實執行、或是讓負責數據治理的人員都清楚每一筆資料之後會如何被應用,都是一個要做好數據治理的企業必須思考的。
第二個原則為好的架構與流程,好的數據治理是組織上下都必須要落實執行的,而擁有一個有效的架構將可以賦能數據治理流程,甚至是近一步的培養好習慣。 譬如讓每一個與數據治理相關的人員皆能清楚自己的所需管理與負責的環節,同時設立有效的 Metrics 以確保數據品質,如此將能讓每一個管理數據的人員都能更加謹慎,且清楚自己的每一個動作可能帶來的影響。
數據的應用 Data Application,近幾年間,人工智慧、機器學習、以及大數據等關鍵字經常奪走了聚光燈與版面,但是在整個數據應用市場中,商業智慧以及其他的數據分析技術與系統同樣的也在高速成長,驅動各個不同產業的企業成為更加數據驅動的組織。