Blog
/
Automation
Smart OCR 是什麼?什麼情況最適合使用?
Automation
ABBYY

Smart OCR 是什麼?什麼情況最適合使用?

13/1/2021

在2020年,原本還在觀望RPA是什麼的企業,已經開始大動作採取行動,陸續加入採用RPA的行列。

PGi樺鼎也在一年內,透過6場 認識RPA與UiPath介紹活動,接觸近350家企業後,發現在RPA應用上,詢問度最高的,是企業內最最常見的Invoice與發票、訂單處理、單據資訊勾稽等需要辨識內容後才能下一步處理的文件流程。

只要有邏輯性的流程脈絡,都是 RPA 可以發揮的地方。但要能因應各類型的文件格式、並精準擷取內容,就需要另外利用能自動辨識學習的AI-powered OCR才能做的徹底了。

此篇將帶你了解:什麼樣的情況最需要 Smart OCR 的加入?

一、先釐清 OCR 跟 Smart OCR 的最大差異

OCR,全名是「光學字元辨識 Optical Character Recognition 」,是一個已經很常見的技術,主要就是將圖片上的文字資料進行辨識,並擷取出來讓你可以再做編輯使用。

例如:在通訊軟體Line上,如果有人傳了一張圖片給你,圖片上有文字,你可以直接在圖片右上角按下「A」的標符,就可直接將文字擷取出來,原本在圖片上的文字被擷取出來可再編輯利用分享出去,這就是利用OCR的技術,是很日常的應用。

那,Smart OCR 又是什麼?

最大差異是,可以做到更細膩的處理,用Smart OCR的目的,最主要不是要把圖片上的所有文字擷取出來,而是希望去擷取「特定欄位」或「特定位置」的資訊,再進一步透過RPA流程機器人輸入到對應的系統或表單中。

所以,衡量準確度的重點也不同

  • 一般 OCR 關注的:同一張圖片,擷取出來的文字有多少%是正確、多少%是錯誤的,例如:100個字到底正確幾個字?
  • Smart OCR 關注的:能正確抓到特定欄位、特定位置上的資訊的正確率是多少

二、了解要處理的文件是什麼類型

依照文件內容可否被直接選取,分為

  • 文字式文件 (可選取裡面的文字)
  • 圖片式文件 (整張圖片、內容不可選取):一定要透過OCR技術才能把圖片內的文字擷取出來。

依照文件的格式架構,分為

  • 結構式:都是固定的格式架構,例如:問卷調查表
  • 半結構式:一部分結構是固定的,一部分是變動的,例如:上半部是固定的,下半部的表格內還有小表格、欄位內的資訊跨欄等狀況,複雜度較高。常見例如:訂單、發票、提貨單等。這是企業最常遇到、最棘手的文件處理類型,這也是Smart OCR最主要要解決的類型。
  • 非結構式:信件、合約,若要擷取真正有意義的資訊,就要搭配NLP深度理解文件的內容。

三、設計一個最佳的Smart OCR 智慧文件辨識處理流程

若企業情況符合以下,就適合更進一步考慮利用Smart OCR搭配RPA流程機器人,改善企業內的文件處理流程效率。

    1. 希望要自動化處理的文件是對財務結果面、客戶信賴感具有影響力的、不能有人工出錯的風險、講求處理效率(例如:Top 20 重點客戶的大量訂單、申貸文件處理)
    2. 文件本身是屬於圖片式文件 (整張圖片、內容不可選取) 與 半結構式文件
    3. 每一次的處理量很多、每年處理的次數也很高(量大、頻率高的標準,由企業自行定義)

一般智慧文件辨識流程會分為兩階段:設計階段&執行階段

(1) 在設計階段:
  • 建立文件定義:包含文件類型、鎖定哪些特定欄位
  • 建立文件分類器:當有新的文件產生時,可以透過分類器先做分類
  • 建立資料擷取模型:針對各種不同的文件,設計相對應的資料擷取模型

以上設計階段,可以很複雜繁瑣、但也可以利用機器學習方式讓事情變得更簡單智慧。

(2) 執行階段:
  • 文件載入:可以透過不同管道自動載入,不管是透過掃瞄器進來的電子檔案、或Email內的夾帶附檔,都可以透過前一階段建立的文件分類器&資料擷取模型,快速分類文件與擷取特定欄位內的資料。
  • 若擷取出來的品質好,可以直接跳過人工驗證,用自動化方式輸入到對應的系統內。
  • 也可透過一些條件的設定,讓某些辨識結果沒有那麼好的文件,進入人工驗證的關卡,做辨識結果的修正,並把這些修正結果,回饋到原本建立的分類器與擷取模型,透過機器學習的機制,持續修正文件分類器與資料擷取模型的準確度。

四、智慧型的文件處理流程自動化 AI-Powered OCR+RPA

現在,在「OCR軟體與智慧文件處理軟體」領域內,能做到具有AI能力、能自主辨識所有文件類型的智慧型文件處理( Intelligent Document Processing) OCR軟體 在全球不到20家。

目前,我們PGi樺鼎,已經實測過,現在位居全球領導地位的「資料擷取與文件處理企業級平台」與「UiPath」的整合應用。這就是「智慧文件辨識2.0解決方案」

這個解決方案,在辨識這段,具有強大的AI文件分類、資料擷取、與驗證能力,因為整合了自然語言處理(NLP)、 機器學習(ML)與OCR等技術,才有能力去處理傳統OCR做不到的事,像是:

  • 各種格式的文件類型  (特別是非結構化資料 e.g. Invoice、發票、報支、水電帳單等)
  • 不同儲存型式  (e.g. 圖檔、PDF、Email附件)
  • 和各類文件內容 (e.g. 文字、手寫、Barcode)

最終達到業界認可的OCR辨識準確度最高、能支援超過200種語言的智慧文件辨識解決方案

簡單來說,這個「有認知辨別能力的智慧文件辨識2.0」解法,是文件處理自動化的最高成熟度展現
  1. 就是傳統的OCR技術搭配運用「機器學習」技術,才有能力應對讀取各類型文件,進而精準擷取,解決大量資料耗時輸入的問題。
  2. 再結合RPA機器人流程自動化,最終實現具有AI能力,即有認知辨別能力的智慧文件辨識2.0!

▶ 預約詢問 專門針對各種類型文件的 Smart OCR +UiPath RPA 「智慧文件辨識2.0解決方案」

五、線上RPA概念入門

如果還不是很明白RPA是什麼、UiPath的流程機器人到底怎麼運作,推薦用1小時快速掌握RPA是什麼、為什麼RPA現在這麼熱門、怎麼納入應用日常工作流?

► 立即申請觀看影片:RPA概念入門+什麼是UiPath

回到RPA資源列表

趨勢、教學、應用案例

前往了解

想直接深入討論?

歡迎直接來信

預約討論

相關文章