Dataiku
企業級協作式 AI 與 MLOps 平台
讓 AI 輔助決策成為每個職能角色的日常
Achieve Everyday AI. Extraordinary People.
知名企業 GE、Cisco、NXP、Merck、BNP PARIBAS 皆運用 Dataiku Data Science Studio 搭建起內部資料科學家與各職能專家的合作橋樑,徹底發揮 1 + 1 > 2 優勢,共同創造快速落地的 AI 商業應用
連續兩年獲評 Gartner 資料科學與機器學習平台領導者
Gartner Peer Review 客戶評價近滿分 4.8/ 5
全球超過4萬5千位使用者、超過450家指標企業採用
我們永遠無法找到足夠多的人去滿足商業資料分析需求,所以為何不把既有人才都變成數據專家?
Senior Manager of Self-Service Data Engineering and Analytics at GE Aviation 奇異航空
我們必須確保自己不是在象牙塔內工作,AI 專案只有跟各部門緊密合作之下才會成功,需要確保正在進行的專案是有商業影響力的
Head of Customer Data Science at Aviva 英國金融服務公司
Dataiku 是一個 Collaborative 的資料科學平台,同時在團隊間扮演潤滑劑與膠水,讓所有環節變得更快速的同時,又能把跨團隊不同背景的人匯聚在同一平台
SVP at Global Pharmaceutical Giant 全球製藥業巨頭

Dataiku 平台可以讓每個人在 ML 的工作流程中各司其職,發揮自己長才,提高團隊工作效率
Dataiku 最與眾不同之處
75% 的公司相信自己如果沒有去運用 AI 能力,五年內會跟不上商業時代的變化
但為什麼 87% 的 AI 專案最後都無法產生商業價值,大多還處在 POC 階段、測試階段,無法對商業決策產生任何影響力。就算可以上線,資料模型已經是2-3個月前的,無法即時跟上市場變化?
根據統計,失敗專案有兩大原因,一是專案開始的頭兩週沒有 Business user 參與,二是企業內不是每個人都能理解並有能力運用 AI 去輔助各單位的營運決策,甚至組織內互相不知道有哪些專案正在進行
一個組織若想開始運用資料科學的能力(能用邏輯系統的方式,從大量零散資料中,找到規則脈絡、意義和商業價值的能力),讓 AI 價值可以運用到企業各營運層面,就需要一個系統化的方式,以平衡科技本身的能力與不同背景人才的思維洞見。
Dataiku 的獨特設計,正是解決企業只想找獨角獸技能人才的迷思。
透過同一個平台,Dataiku 可以讓不同 coding 能力程度的人匯聚一起,並有能力用相同語言溝通,可能是針對資料結果給出商業上觀點、或是針對演算法的討論調整,如此一來,不同專長的人才可以貢獻其專才,創造 1+1 大於2的協作效果。
整合 Business 與 IT 背景的人才,激發更多建設性觀點,透過共同利用數據,集中設計、部署與管理商業上的 AI 應用。
資料科學家、資料工程師、軟體工程師、資料架構師,利用 Dataiku 加快整個資料科學流程各環節效率
Dataiku 很尊重 Data Scientists 原本習慣的工作方式,讓那些優先以 coding 為主的人才有足夠的自由與彈性,去自定義編寫腳本,用你最熟悉的方式,更快建立高品質的 Data Pipeline 與模型。
有別於全部都是視覺化元件的平台,Dataiku 同時開放足夠的彈性給資料科學家或工程師,可以從拖拉式的視覺化 recipes 轉成 SQL recipes 去編輯腳本,最大好處是不需要從頭開始去架構整個腳本,加速作業效率,對 coder 來說省時省力。Dataiku 可以協助你:
-
- 簡化資料連結的複雜度與難度,並可依照運算效能需求,選擇要運行的 Recipe Engine (在DSS內或是Run In database、Run on Spark…)
- 保留平常最習慣的 Python、R、Spark 等程式語言、Package 跟 Jupyter Notebook編輯程式等 IDE,讓你不用為了要跟其他不同背景的同事合作而放棄最喜歡的工作方式
- 可重複使用程式碼、資料集或其他資產,提高資料處理的一致性與利用效率,同時讓 Business User 可依此為基礎更進一步利用
➜ 了解更多示範畫面
行銷、財務、品管、營運分析專才,利用 Dataiku 更容易與技術團隊溝通,商業洞察更快被落地
資料唯有用來解決商務的問題時,才會產生其價值。就像是 BI Dashboard 唯有「被使用」才會產生對商業決策的影響力。
你在專業領域內的商業思維+AI 的能力=無限的機會,而 Dataiku 可以協助你:
-
- 擺脫耗時手動 Scripting,運用超過 109 個 Code-free 的資料清整元件工具,輕鬆混合散落各處的資料源、並快速整理成適合用來分析的格式,並可以自動化與重複利用
- 快速建立深度統計分析,例如單變量分析、雙變量分析、假說檢定、曲線擬合、相關分析、主成分分析
- 透過 AutoML 輕鬆升級機器學習的技能,快速建立模型。 Dataiku 支持四種常見的機器學習引擎如 Python, Spark, H2O, TensorFlow,並擁有超過32種核心演算法
- 透過客製化的 Dashboard 與 Apps,有效溝通你的洞見,或直接發佈結果到常用的 BI 工具如 Tableau
➜ 了解更多示範畫面
數據分析主管、首席數據官、安全與合規資安長、自動化營運長,利用 Dataiku 擴增團隊產能與效率
Dataiku 能協助你:
-
- 在同一平台,支持企業跨團隊協作,因為整合企業常見的協作溝通平台,如 Slack, Atlassian Confluence, Microsoft Teams。任何背景,都能輕鬆掌握數據處理到進階分析的每一環節,直搗更重要的商務決策
- 提高整體 AI 專案的投報率,主要透過集中式管理與紀錄每一個專案過程與文件,能更快擴大應用場景,同時確保邊際維護成本不會隨之增加
- 不需要在安全性與稽核追溯上妥協,主要能與現有的 AD 與 Kerberos 基礎設施整合,並透過進階的權限管控、SSO 與 LDAP 整合、logs 紀錄、API 安全連接,大規模管控風險與確保合規性。
- 利用 Dataiku Apps 讓企業內更多使用者能直接與 AI 預測結果互動並輔助決策
➜ 了解更多畫面示範
在四面向看見 Dataiku 帶來的成效
某一國際性的傢俱零售公司,透過 Dataiku 精準鎖定 Email 營銷活動,實現6位數的營收提升
❶ 透過重複利用數據資產,讓一家市值超過百億歐元的電信公司,13人團隊每年省下250個人天,相當於每個專案節省2百萬美金
❷ 某一全球性銀行,透過 Dataiku 每年省下超過一千萬美金,主要因為大幅縮短 AI 專案實際落地上線的時間,從原本幾個月到幾週
❶ 巴黎銀行 BGL BNP Paribas ,在短短8週內建立詐欺偵測的原型,同時不妥協於高標準的資料監管政策
❷ 英國線上時尚零售商 MandM Direct ,透過 Dataiku 幫助資料科學家省下 10% 的維護與監控任務時間
❸ 法國雲端運算公司 OVH 的資料科學家,因為 Dataiku 提高 40% 資料專案完成速度
❶ 聯合利華 Unilever,透過 Dataiku 讓數百位分析師,有能力建立自助式NLP,提高產出效率、品質與精細度
❷ 奇異航空GE Aviation,透過 Dataiku 快速擴增超過2千名使用者,建立近3千個資料專案,同時可讓225+個專案是可以自動化運行
Dataiku 客戶應用案例
NXP 是一家全球性的半導體公司,該公司在 30 多個國家/地區擁有約 29,000 名員工
-
- 使用部門:橫跨研發、生產和物流,因為涉及交易和運營數據的分析
- 需求情境:因採購和生產過程涉及大量實物商品,需要更智慧化的採購流程,以避免供應鏈中斷、產品欺詐等
- 結果:分析不同的數據源以更好地分析成本和供應商,並實現了每個部門的流程優化。Dataiku 中的自然語言處理 (NLP) 可以幫助進行合約分析和發票匹配,以幫助團隊從全球性支出的角度去優化談判和利潤。
➜ 更多 NXP 如何打造內部AI團隊運作模式的經驗分享,請點此查看
我的目標是改變銀行報告的方式。我們聘請了非常優秀的會計師,給了他們 Dataiku,讓他們交出更出色的成果 — 渣打銀行計劃執行 (P2P) 數據策略與交付主管
- 使用部門:財務規劃和分析 (FP&A) 部門,該部門超過 400 多人,每個月產生 5000 多條信息,其中 90% 是可以自動化的。他們透過 Dataiku 改變 FP&A 部門的能力,用更快速度運用數據回答更多問題
- 該部門主要任務:FP&A 致力於研究銀行主要核心財務報表和結構系統的拼圖。他們需要能夠回顧五年前和預估五年後的情況,以識別異常情況和趨勢,進行資產負債表分析,並進行成本分析,以回答有關銀行盈利方式和地點、銀行行為方式、誰應該被雇用,以及他們應該被安置在哪裡等複雜問題
- 面臨的挑戰:
- 現有的分析系統僅限 1000 萬行數據,但他們需要分析 1000 萬到 4 億行數據
- 不是底層基礎設施的問題,因為他們已經擁有強大的計算倉庫,但幾乎沒有人使用它。他們需要找到一種方法來利用現有的生態系統
我們有一個 Data Lake,但如果你想對數據做任何事情,你必須要把它從 Data Lake 取出來,那這樣不合理。如果我們已經有一個能處理 TB 級資料的大型基礎設施,它的成本超過 100 萬美元,卻只使用 3% 的能力,那我們為什麼不找到一個可以善用此強大運算能力的平台呢?
- 實際收穫:
- 在3-4週內,可以在一次操作中完成了 45 億筆的資料。同時 Dataiku 讓該團隊意識到可以做的遠不止這些
- 在使用 Dataiku 的前 9 個月,團隊從 FP&A 相關情境產生大量應用案例
- 因 Dataiku 有很大的靈活性和自由度,下一步是建立系統和方法的準則,如:確保Data pipeline、SLA 和 DataOps 流程有遵循共同的準則。這是 Dataiku 最強大與獨特之處:具有無拘無束的自由,但也具有促進建立結構和系統化流程的功能
- 在2021年,使用 Dataiku 去運行三個主要系統,並刷新銀行所有財務的每日 Tableau 儀表板。他們開發了一個 Data Marketplace,整個組織的人都可以利用 Data Marketplace 插入其他部分以從數據中獲取答案(例如,試圖了解財產成本的分析師可以使用 Data Marketplace 中的資產負債表並插入租賃數據)
- 建立 CoE ,且目前由 16 人組成,但他們將擴大到 30 人,預計未來幾年將達到數百人,以支持不斷增長的需求並繼續提高業務效率
現在有了 Dataiku,就有了一個核心數據集,而且是安全的。我們消除了不同人在不同系統創造不同東西的困境,我們現在擁有一套核心應用程序,能真正靈活的去回答問題和解決問題
➜ 完整案例故事,請點此前往查看
Essilor International 是一家總部位在法國的國際眼科光學公司,負責設計、製造和銷售矯正或保護視力的鏡片。該團隊希望有一個一站式的平台,讓他們能夠探索、分析和創建預測模型,並且每個人都可以使用,從專業專家到機器操作員、數據科學家和 IT 人員,以及介於兩者之間的每個人
Essilor 選擇 Dataiku 來幫助他們有效地處理來自堆焊機的大量數據,因為:
-
- Dataiku 的設置和實施很容易,讓他們能夠快速上手
- 團隊能夠靈活使用代碼或使用點擊式的拖拉可視化界面,以加快工作流程的速度
- 來自堆焊機的數據有多種格式,有些數據集不可靠或不完整,但 Dataiku 讓他們能夠有系統的管理這些變化
- Dataiku 允許他們針對不同情況進行快速測試和迭代,以更快地得出解決方案
➜ 完整案例故事,請點此前往查看
Dataiku 企業方案選擇
- 最多5位使用者
- 20+資料庫連結器,但不支持Teradata, Netezza, Exadata, Hana
- 可透過 in-memory 或 in-database using Spark 運行
- 有限度的自動化,最多2個自動化情境
- 可部署在 Dataiku 的雲上 (SaaS)、你自己的AWS, Azure and GCP Cloud 或on premise
➜ 更多細節,歡迎直接來信討論
Dataiku 客戶見證
企業級「協作式」資料科學與機器學習平台 領導者
促進有系統的建立 AI 專案運作模式、全球累積超過 450 家知名企業認可