DataRobot AI 平台介紹|從 AutoML 到 MLOps 重點功能
DataRobot 是全球第一個創立 AutoML 解決方案的公司。在市面各大 AI 平台中,DataRobot 在最新 2022 第三季 The Forrester Wave 報告中,所精選 15 家 AI 與 ML 平台廠商的前三大領導品牌。
DataRobot 以 AutoML 出發,能隨著台灣企業 AI 成熟度的逐步提升,搭配我們在地的顧問支持服務,滿足不同階段的需求,從一開始的 AutoML 出發到現在更為全面性的企業級AI 平台,致力協助各產業與規模的企業都可快速採用 AI、落實持續性優化的 AI,並轉為實際商業價值。
本文將透過房價預測的應用案例,快速展示 DataRobot 在 AutoML 與 MLOps 上,有別於其他 AI 平台的獨創設計,你可以將相同概念應用在你的應用案例上,思考原本的預測方式,可以如何借力平台,更快實現企業數據變現。
一、支持多元資料型態
以下影片示範是房價預測應用案例,透過 DataRobot 將徹底改變傳統評估房屋價值的方式。
在資料準備階段,DataRobot 可以處理的資料類型除了常見的數值型資料外,也可包含地理坐標、房屋內外部的圖片、以及房仲輸入的文字描述,DataRobot 可以同時使用這些不同資料類型去做自動化機器學習與預測。
在這階段,DataRobot 的其他優勢包含:
- 資料準備流程視覺化
- 自動產出最適特徵
- 集中管理 AI 資產
- 自助式 JDBC 平台
- 連結超過 19 個主流資料庫
➜ 了解更多: DataRobot 在 Data Engineering 能做的事
二、AutoML 自動化機器學習
透過 DataRobot AutoML,你只需選擇要預測的目標,DataRobot 會將所有複雜又耗時的資料科學任務自動化處理,像是建立 Cross- validation 或是 Hold-out 數據集,並尋找 Target Leakage 都可以自動化處理。
接著,DataRobot 會開始同時建立多個模型,這個案例是一次使用 10 個 worker 去比較各種不同開源與專有的演算法,找出最適合這個案例的最佳模型。
整體來說,在建立模型這個階段,DataRobot 可以做到:
- 自動化建立進階模型
- 自動化時間序列
- 集中編輯與管理開源 Notebooks
- 自動化同時保持可編輯的彈性
- 圖片、文字、地理位置、深度學習
➜ 了解更多:DataRobot 在機器學習階段能處理的面向
三、容易理解的 AI 解釋
現在企業追求的不只是要加速找出最佳模型,更關鍵的是「能否解釋為什麼」這是最佳模型?
一般來說,自己開發的機器學習模型,不會包含如何產出預測結果的說明,因此也就很難客觀的去解釋:根據這個模型所做的判斷或決策為什麼值得信賴?
DataRobot 平台內的 Prediction Explanations 就是要解決 Black Box 的通病,能解釋哪些因素對預測的結果影響最大,也就是會知道哪些欄位是重要的、哪些其實是不重要的,這有助於:
- 跟利害關係人更精準的解釋溝通
- 針對未來要收集的資料欄位,也將更聚焦且有用、更直接連貫公司的策略方向
透過 DataRobot 核心技術 Model Blueprint ,可以視覺化的看到所有模型是如何自動產出的、會展示所有建模步驟中使用的演算法與神經網絡,同時包含文件與數據質量報告(Data Quality Handing Report)
此外,透過 Lift Chart 可以衡量模型契合度 Model Fit ,而針對回歸問題,可以透過各種維度去分析殘差。
而想要了解哪些特徵對預測結果的影響是最大的,可以透過 Feature Impact 自動為你排序每個特徵對模型的重要程度。
透過每一筆的預測解釋,可以幫助你清楚判斷每筆預測結果的原因,讓你更有信心利用這個結果去輔助做最後決策。
DataRobot 的可解釋 AI 不只落實在最佳模型的選擇,更貫穿一個 AI 生命週期的所有階段
➜ 了解更多:DataRobot 可解釋原因且容易理解的 Explainable AI
四、MLOps 與 Humble AI
MLOps 是一種原則和做法,在實踐上不限任何一種程式語言、平台、模組。實踐 MLOps 最重要的要素包含:自動化、版本控管、可重現性、治理政策、跨團隊協作、稽核軌跡
隨著資料持續變動,眾多模型也需要持續的訓練與管理,因此,你會使用 DataRobot MLOps 去集中部署、監控、管理模型。
這些模型可以是 DataRobot 內建的模型,或是你外部建立的任何其他模型。
DataRobot 的 MLOps 提供單一環境,適用所有已經正式上線的模型,即時監控服務的健康度、分析準確度、趨勢、了解資料漂移與特徵漂移,以便在模型惡化之前去採取必要的優化措施。
此外,你可以啟動 DataRobot 的 Humility 功能,可以加強你對已部署模型的信任,這確保模型進行預測時,人類的判斷一直都有參與其中。
例如:如果 DataRobot 做出不確定的預測時,可以向你發送警報提醒,或是將預測值改成更合理的值,讓你可以即時採取行動。
➜ 了解更多:DataRobot 的 MLOps 詳細設計 或下載 MLOps 101 入門指南
五、持續學習改進的 AI
當你的模型上線後,你也可以使用 DataRobot 的挑戰者模型 Challenger Model ,透過持續性的模型競爭機制,和線上正在運行的模型競爭,成為更厲害的模型,成為新的冠軍模型,目的是因應外部環境的快速變化。
你可以使用 DataRobot 內建模型或外部建立的模型來建立挑戰者模型,並使用正式環境的歷史數據進行預測,去看挑戰者模型在正式環境中的表現如何。
在通過嚴格監管的審批流程後,如果挑戰者模型比現在的冠軍模型表現更好,有更好的性能,就可以在正式環境「不停機」的情況下,無縫替換成挑戰者模型。
DataRobot MLOps 可以為你的 AI 應用提供持續性學習,以確保你的模型始終可以滿足不斷變化的外部環境條件、確保模型保有一定的準確度
六、計算投入機器學習的 ROI
透過 Use Case Value Tracker 可以幫助你規劃、監控、了解,AI 應用程序在正式環境中已經實現價值,畢竟,若AI 無法帶來商業價值,就只是實驗性質的 AI
➜ 了解更多:下載 2022 企業取得 AI 成功的 10 個關鍵
七、關於 DataRobot
DataRobot 成立於 2012 年,由一群在 Kaggle 上的 Grandmaster 打造而成,團隊將業界公認的大師經驗,內建入平台中,並根據市場最新的開源機器學習框架,不斷新增與測試,以保持最優化的狀態,是全球第一個建立 AutoML 解決方案的公司。
在最新的 2022 第三季 The Forrester Wave 報告中,共有 15 家精選的 AI 與 ML 平台廠商,DataRobot 在前三大領導品牌,是目前市面上值得信賴的 AI 平台。
DataRobot 全球客戶已遍及2千大企業,橫跨金融、保險、高科技製造,醫療、零售等產業的領先者,皆透過 DataRobot 自動並加速企業的數據變現之路。