Blog
/
AI
DataRobot AI 平台介紹|從 AutoML 到 MLOps 重點功能
AI
DataRobot

DataRobot AI 平台介紹|從 AutoML 到 MLOps 重點功能

March 28, 2024

DataRobot 是全球第一個創立 AutoML 解決方案的公司。在市面各大 AI 平台中,DataRobot 在最新 2022 第三季 The Forrester Wave 報告中,所精選 15 家 AI 與 ML 平台廠商的前三大領導品牌。

DataRobot 以 AutoML 出發,能隨著台灣企業 AI 成熟度的逐步提升,搭配我們在地的顧問支持服務,滿足不同階段的需求,從一開始的 AutoML 出發到現在更為全面性的企業級AI 平台,致力協助各產業與規模的企業都可快速採用 AI、落實持續性優化的 AI,並轉為實際商業價值。

本文將透過房價預測的應用案例,快速展示 DataRobot 在 AutoML 與 MLOps 上,有別於其他 AI 平台的獨創設計,你可以將相同概念應用在你的應用案例上,思考原本的預測方式,可以如何借力平台,更快實現企業數據變現。

一、支持多元資料型態

以下影片示範是房價預測應用案例,透過 DataRobot 將徹底改變傳統評估房屋價值的方式。

在資料準備階段,DataRobot 可以處理的資料類型除了常見的數值型資料外,也可包含地理坐標、房屋內外部的圖片、以及房仲輸入的文字描述,DataRobot 可以同時使用這些不同資料類型去做自動化機器學習與預測。

在這階段,DataRobot 的其他優勢包含:

    • 資料準備流程視覺化
    • 自動產出最適特徵
    • 集中管理 AI 資產
    • 自助式 JDBC 平台
    • 連結超過 19 個主流資料庫

➜ 了解更多: DataRobot 在 Data Engineering 能做的事

二、AutoML 自動化機器學習

透過 DataRobot AutoML,你只需選擇要預測的目標,DataRobot 會將所有複雜又耗時的資料科學任務自動化處理,像是建立 Cross- validation 或是 Hold-out 數據集,並尋找 Target Leakage 都可以自動化處理。

接著,DataRobot 會開始同時建立多個模型,這個案例是一次使用 10 個 worker 去比較各種不同開源與專有的演算法,找出最適合這個案例的最佳模型。

整體來說,在建立模型這個階段,DataRobot 可以做到:

    • 自動化建立進階模型
    • 自動化時間序列
    • 集中編輯與管理開源 Notebooks
    • 自動化同時保持可編輯的彈性
    • 圖片、文字、地理位置、深度學習

➜ 了解更多:DataRobot 在機器學習階段能處理的面向

三、容易理解的 AI 解釋

現在企業追求的不只是要加速找出最佳模型,更關鍵的是「能否解釋為什麼」這是最佳模型?

一般來說,自己開發的機器學習模型,不會包含如何產出預測結果的說明,因此也就很難客觀的去解釋:根據這個模型所做的判斷或決策為什麼值得信賴?

DataRobot 平台內的 Prediction Explanations 就是要解決 Black Box 的通病,能解釋哪些因素對預測的結果影響最大,也就是會知道哪些欄位是重要的、哪些其實是不重要的,這有助於:

  • 跟利害關係人更精準的解釋溝通
  • 針對未來要收集的資料欄位,也將更聚焦且有用、更直接連貫公司的策略方向

透過 DataRobot 核心技術 Model Blueprint ,可以視覺化的看到所有模型是如何自動產出的、會展示所有建模步驟中使用的演算法與神經網絡,同時包含文件與數據質量報告(Data Quality Handing Report)

此外,透過 Lift Chart 可以衡量模型契合度 Model Fit ,而針對回歸問題,可以透過各種維度去分析殘差。

而想要了解哪些特徵對預測結果的影響是最大的,可以透過 Feature Impact 自動為你排序每個特徵對模型的重要程度。

透過每一筆的預測解釋,可以幫助你清楚判斷每筆預測結果的原因,讓你更有信心利用這個結果去輔助做最後決策。

DataRobot 的可解釋 AI 不只落實在最佳模型的選擇,更貫穿一個 AI 生命週期的所有階段

➜ 了解更多:DataRobot 可解釋原因且容易理解的 Explainable AI

四、MLOps 與 Humble AI

MLOps 是一種原則和做法,在實踐上不限任何一種程式語言、平台、模組。實踐 MLOps 最重要的要素包含:自動化、版本控管、可重現性、治理政策、跨團隊協作、稽核軌跡

隨著資料持續變動,眾多模型也需要持續的訓練與管理,因此,你會使用 DataRobot MLOps 去集中部署、監控、管理模型。

這些模型可以是 DataRobot 內建的模型,或是你外部建立的任何其他模型。

DataRobot 的 MLOps 提供單一環境,適用所有已經正式上線的模型,即時監控服務的健康度、分析準確度、趨勢、了解資料漂移與特徵漂移,以便在模型惡化之前去採取必要的優化措施。

此外,你可以啟動 DataRobot 的 Humility 功能,可以加強你對已部署模型的信任,這確保模型進行預測時,人類的判斷一直都有參與其中。

例如:如果 DataRobot 做出不確定的預測時,可以向你發送警報提醒,或是將預測值改成更合理的值,讓你可以即時採取行動。

➜ 了解更多:DataRobot 的 MLOps 詳細設計 或下載 MLOps 101 入門指南

DataRobot 企業級AI平台全圖

五、持續學習改進的 AI

當你的模型上線後,你也可以使用 DataRobot 的挑戰者模型 Challenger Model ,透過持續性的模型競爭機制,和線上正在運行的模型競爭,成為更厲害的模型,成為新的冠軍模型,目的是因應外部環境的快速變化。

你可以使用 DataRobot 內建模型或外部建立的模型來建立挑戰者模型,並使用正式環境的歷史數據進行預測,去看挑戰者模型在正式環境中的表現如何。

在通過嚴格監管的審批流程後,如果挑戰者模型比現在的冠軍模型表現更好,有更好的性能,就可以在正式環境「不停機」的情況下,無縫替換成挑戰者模型。

DataRobot MLOps 可以為你的 AI 應用提供持續性學習,以確保你的模型始終可以滿足不斷變化的外部環境條件、確保模型保有一定的準確度

六、計算投入機器學習的 ROI

透過 Use Case Value Tracker 可以幫助你規劃、監控、了解,AI 應用程序在正式環境中已經實現價值,畢竟,若AI 無法帶來商業價值,就只是實驗性質的 AI

DataRobot 估算ROI的方式 Use Cases Value Tracker

➜ 了解更多:下載 2022 企業取得 AI 成功的 10 個關鍵

七、關於 DataRobot

DataRobot 成立於 2012 年,由一群在 Kaggle 上的 Grandmaster 打造而成,團隊將業界公認的大師經驗,內建入平台中,並根據市場最新的開源機器學習框架,不斷新增與測試,以保持最優化的狀態,是全球第一個建立 AutoML 解決方案的公司。

在最新的 2022 第三季 The Forrester Wave 報告中,共有 15 家精選的 AI 與 ML 平台廠商,DataRobot 在前三大領導品牌,是目前市面上值得信賴的 AI 平台。

DataRobot 全球客戶已遍及2千大企業,橫跨金融、保險、高科技製造,醫療、零售等產業的領先者,皆透過 DataRobot 自動並加速企業的數據變現之路。

DataRobot 在2022 Q3 The Forrester Wave 領導者

需要評估協助?與 AI 顧問聯繫 直接來信

推薦閱讀評比報告 精選15家 AI 平台 前往了解

Stay Informed with Our Newsletter

Get a summary of what we’ve shipped during the last month, behind the scenes updates, and team picks.

Thank you! Your subscription has been received!
Oops! Something went wrong. Please try again.
By submitting your email address, you agree to receive PGi’s monthly newsletter. You can always withdraw your consent.

Related Blog