智慧文件辨識2.0應用,AI+RPA 發票/文件處理自動化
疫情趨緩後,相信很多企業已經開始看到另一波關於「企業數位轉型」的議題,很多企業主也又再次興起這個想要徹底變革的念頭,但同時又覺得這議題依舊太大,最後又再次行動癱瘓、不知從何下手?
其實,數位轉型議題可以先從最容易開始的「數位優化」開始,你可以不需大刀闊斧的改變整個商業模式,而是先從「營運流程面的自動化」開始,你就正式走在邁向數位轉型的漫漫長路上了。
特別是在這個加重凸顯「人力資源極其珍貴」的時期下,怎麼善用人力資源的擺放位置、人力資源利用效率?
很多準備導入UiPath流程機器人的企業客戶,都是從繁冗低效率的流程改善開始他們的數位轉型變革管理之路,
特別是從今天要分享的「文件處理流程自動化」開始,以下將帶你快速檢視自家企業正處在哪個數位優化成熟階段?以及什麼樣的解決方案組合最適合你。
一、為什麼數位優化要優先重視文件處理流程?
一家企業能否有效率的管理文件,跟其營運效率有高度相關,包含時間、人力資源、成本、資料安全等關鍵問題。
每家公司的各營運單位都會涉及「文件處理」,包含:有固定結構的文件( 例如 問卷調查表、客訴表等)、半結構式文件、非結構式文件
特別是跟財務有高度相關的文件 (e.g. 採購訂單、提貨單、發票、費用預算等) 以及跟商務資訊相關的重要文件 (e.g. Email、合約、會議記錄、內控文件、規章制度等)
這裡要談的不是企業文件管理系統,而是要談用什麼方式收集整合文件、擷取這些文件上的內容,再放到特定的管理系統內。
這三大類型的文件,從一家企業如何處理「半結構式文件&非結構式文件」的方式,即可看出其營運效率的程度、其數位優化的程度。
例如:其文件內的資訊處理方式是人工擷取、還是自動擷取的? 人與系統工具之間的工作分配比例? 不同系統間的數據如何移動與整合?
這關乎的不只是運作上的效率(省時省力),同時也是資料的正確性,及其後續連帶的資料分析或財務面的風險管理。
二、文件處理流程的三階段成熟度表現
現在辦公室自動化盛行,如何自動化完成大量文件收集整理、再將內容輸入到對應系統內是辦公室自動化很重要的一環。
依照企業營運流程自動化的程度,一般會有三階段成熟度的表現,不同階段需要的是不同的解決方案,以下可檢視公司位在目前正處在哪一階段:
1. 從紙本文件變成電子檔案 (掃描器+OCR)
這階段還不能談所謂的「數位優化」,因為還在最基本的「紙本文件數位化」。這階段目標是把紙張上的內容變成數位文字,才能有後續的重新編輯、取用、搜尋等電腦上作業的動作。
若還在此階段,現階段主要利用的技術就是OCR光學字元辨識這項技術,將搜描後的圖片檔案轉成可編輯的文字檔案,而這個技術早在1960年代就已經出現了,也就是現在OCR軟體已經很容易取得、且應用也非常普及,就連通訊軟體Line都有內建OCR文字辨識功能,可以讓圖片轉成文字。
2. 電子檔案到內容擷取、進入系統(OCR+人工處理)
當大多數的文件已經是電子檔案的形式,且透過OCR技術轉成可編輯、可選取的元件型檔案後,接著你需要把這些電子檔案上的文字、數字等資料,輸入到某個系統或彙整在Excel表上等。
80%的企業都在這階段,用「人力」的方式,坐在電腦前,識別要在文件上的哪個地方擷取(複製)電子文件上的內容,再輸入(貼上)到某個系統或匯總表中。
以採購到付款(P2P)、訂單到收現(O2C) 的流程為例,都涉及到電子文件檔內容的擷取、輸入ERP系統、核准與驗證等動作。特別是製造產業、有上下游供應關係的行業領域,當配合的廠商很多時,每月可能會有數十萬筆以上的Invoice、訂單要處理。
現在絕大多數企業的處理方式,還是需以人力手動方式,一筆筆將資訊輸入系統,過程既耗時又有風險,因為會有人為輸入錯誤的可能,且一但錯誤發生,後續的帳單和供應商付款也會跟著出錯或延宕。
這是第二階段的文件處理流程成熟度,其實「流程自動化」的成熟度還很低,因為員工「浪費」在重新輸入、剪下和貼上訂單資料到各種系統中的「時間總數」,依舊很可觀。
3. 電子檔案到內容擷取、進入系統(OCR+RPA)
這是第二階段的進化版,也就是讓「RPA流程軟體機器人」上場發揮價值的地方。
上述員工做的事:打開每個電子文件檔案、選取複製需要的資訊、登入系統、輸入/貼上資訊等重複性動作,都可交由「RPA流程機器人」來執行。
RPA就像是電腦裡的小精靈,可以自動幫你執行例行工作中最瑣碎、最耗時、一直重複、生產率最低的事情。
RPA是一種「營運流程自動化技術」,未來5年內,全球80%的企業,不分產業,都會優先採用的技術。
現在,任何人都有能力「設計自己專屬的軟體流程機器人」,就像擁有一位絕對聽從命令的私人助理,幫你高效、精準完成那些無聊又重複的流程。
看到這裡你可能會疑惑?
為什麼 RPA 流程機器人也可以把圖片 PDF 檔上的文字擷取下來?
因為 RPA 流程機器人也內建 OCR 功能啊!
以 RPA市場上銷售第一品牌的 UiPath 為例,就內建了2種OCR引擎讓使用者自己選擇,包含:
- Google OCR (使用開源的Tesseract OCR Engine)
- Microsoft OCR (使用MODI OCR Engine)
- 需要另外安裝的
- Google Cloud OCR (需要Google Cloud API Key)
- Microsoft Cloud OCR (Microsoft Computer Vision API)
以下示範三種最基本的 UiPath 流程機器人可以做到的文件資訊擷取
- 擷取整張圖片型式的PDF檔內的文字資訊:只要使用兩個Activity像是「Find Image」、「Get OCR Text 」
- 擷取可選取文字型式的PDF檔內的資訊:使用「Find Element」、「Get Text 」兩個基本的Activity即可
- 擷取一份同時包含可被選取文字+圖片內有文字的PDF檔案:原本就可被選取的文字部分用「Read PDF Text」這個Activity來執行,圖片內有文字的部分就用「Read PDF with OCR」來處理
▶ 延伸參考:UiPath 內所有與 OCR 相關的Activities
以下影片示範一個「處理財務流程的RPA流程機器人」
自動化擷取發票上的必要資訊、並輸入到系統內,主要動作包含:
- 監控一個資料夾,當有任何一個新的Invoice PDF被丟進資料夾
- UiPath流程機器人會打開Invoice PDF
- 擷取我們預先指定他要擷取的必要資訊
- 接著UiPath流程機器人會打開、登入SAP
- 把剛剛擷取的資訊key-in SAP
- 最後UiPath流程機器人發Email通知負責這個流程的人,告訴負責人他完成任務了
三、進階難題:電子檔案文件格式太多樣
上面範例看起來似乎一切完美。
但如果正在閱讀此篇文章的你,是在有上下游供應關係的行業領域,合作廠商很多,例如高科技製造業,那麼每個月可能會有數十萬筆以上的Invoice、訂單要處理,且每家廠商的文件格式都不太一樣,該怎麼辦?
傳統 OCR 引擎的限制
傳統的OCR引擎,無法閱讀半結構化、非結構化資料,所以需要手動建立表格範本(e.g.客戶訂單表格範本),但同類型文件的版型只要有一點不一樣,就可能導致資料擷取的結果不一致,最後反而花更多時間在排解問題或驗證上。
有內建傳統OCR引擎的RPA流程機器人也會受到一些限制,像是:
- 讀取文件時,文件顯示比例需要固定
- 不同文件類型(如PDF、圖檔)需使用不同方式處理
- 較複雜文件內容(如表格)需使用正規表達式(RegExp)擷取內容
- 同類型文件的版型只要有一點不一樣,就需要設計新的機器人程式處理
有沒有更聰明的方式?OCR引擎能否自己有學習能力?學會自己辨識不同文件的格式?
這就是智慧文件辨識2.0的概念。
如果OCR本身是有AI能力的 (透過機器學習技術,而擁有自主辨別能力以應對不同情況),那麼內建AI-powered OCR的RPA流程機器人,就能在遇到各式各樣的發票、採購訂單、合約等半結構化、非結構化的文件時,繼續執行任務了。
(因為RPA流程機器人是典型的說一動做一動的數位助手,如果沒有預先教他要讀取特定文件的哪個部位,他是不會動作的)
如果OCR引擎本身有了學習能力,就不再需要把不同格式的文件,一個個建立範本,然後再指定RPA流程機器人在不同文件範本上的區塊去擷取需要的資訊
這種不夠聰明的工作方式,不是我們該忍受的。
這就是為什麼「AI-powered OCR+RPA」的概念必須被廣泛知道的原因。
四、智慧型的文件處理流程自動化 (AI-powerd OCR+RPA)
現在,在「OCR軟體與智慧文件處理軟體」領域內,能做到具有AI能力、能自主辨識所有文件類型的智慧型文件處理( Intelligent Document Processing) OCR軟體 在全球不到20家。
目前,我們PGi樺鼎,已經實測過,現在位居全球領導地位的「資料擷取與文件處理企業級平台」與「UiPath」的整合應用。這就是「智慧文件辨識2.0解決方案」
這個解決方案,在辨識這段,具有強大的AI文件分類、資料擷取、與驗證能力,因為整合了自然語言處理(NLP)、 機器學習(ML)與OCR等技術,才有能力去處理傳統OCR做不到的事,像是:
- 各種格式的文件類型 (特別是非結構化資料 e.g. Invoice、發票、報支、水電帳單等)
- 不同儲存型式 (e.g. 圖檔、PDF、Email附件)
- 和各類文件內容 (e.g. 文字、手寫、Barcode)
最終達到業界認可的OCR辨識準確度最高、能支援超過200種語言的智慧文件辨識解決方案。
簡單來說,這個「有認知辨別能力的智慧文件辨識2.0」解法,是文件處理自動化的最高成熟度展現
- 就是傳統的OCR技術搭配運用「機器學習」技術,才有能力應對讀取各類型文件,進而精準擷取,解決大量資料耗時輸入的問題。
- 再結合RPA機器人流程自動化,最終實現具有AI能力,即有認知辨別能力的智慧文件辨識2.0!
➜ 預約申請 專門針對各種類型發票做智慧辨識的 Smart OCR +UiPath RPA 的「智慧文件辨識2.0解決方案」
五、線上 RPA 概念入門
如果還不是很明白 RPA 是什麼、UiPath 的流程機器人到底怎麼運作,推薦用1小時快速掌握RPA是什麼、為什麼RPA現在這麼熱門、怎麼納入應用日常工作流? ➜ 建議觀看:RPA 概念入門+什麼是 UiPath
六、實測過通用性最高的「智慧文件辨識2.0」解法
如果已經很清楚 RPA是什麼、UiPath 流程機器人的運作邏輯,很想要趕快解決每個月有數十萬筆以上的Invoice 且訂單格式都不一樣的繁冗文件流程,
那就很推薦你參加以下的「進階應用分享」,打造最輕鬆、自動化程度最高的文件處理流程