有道雲筆記上線OCR功能:輕鬆識別圖片/PDF中文字(支援漢字)
IT之家5月17日消息,繼上線語音速記功能後,網易旗下產品有道雲筆記又上線了另一實用的功能——文檔OCR(即文字識別)。據悉,新上線的OCR功能在原有的掃描功能進行了升級,能夠説明使用者輕鬆識別圖片、PDF等掃描文檔中的文字,並將其轉化成可編輯的文檔。
如果你還不瞭解新功能OCR究竟能為你做什麼,那你一定遇到過以下這些情況,而OCR功能就是對這些“癥結”的那款“靈丹妙藥”:
· 工作或者科研學習中,要應對大量的紙質檔、書刊雜誌、PDF格式的電子資料,很難對這些格式的資料進行編輯和整理
· 讀書時,看到不錯的文章段落想要做書摘筆記,但又懶得去打字或是手抄整理
· 在微信、微博等內容平臺看到有價值的圖片內容會隨手保存mark,或是用截屏把手機頁面內容保存到相冊,但這些圖片資訊散亂在手機各處,很難進行歸納、整理和檢索
以上難題,只需要5秒就能搞定!
那麼,如何用OCR識別功能將紙質資料、圖片和PDF檔,轉換為可以自由編輯的文本格式呢?
「紙質文檔」OCR識別
把紙書、合同等紙質檔、甚至牆體海報,轉換成可編輯的文本格式,只需三步:
step1:智慧掃描
將有道雲筆記升級為最新版後,點擊加號按鈕,新建一篇“文檔掃描”。
接下來就是見證實力的時刻,掃描過程中無需任何人工作業,軟體可以自動、精准識別掃描圖像的邊框,去除掃描區域以外的多餘背景,並且矯正偏斜,穩!准!狠!地將資料掃描進來。
如果對自動掃描結果不夠滿意,還可以選擇手動調節模式進行微調。
在掃描過程中,請儘量將文字擺正,儘量剔除圖片中無關的部分,這樣可以大大提高文字識別的準確度啊~
step2:掃描圖片濾鏡美化
掃描後的圖片會自動調節亮度和對比度,可以便捷的設置為增強或黑白模式,讓圖片更清晰。
step3:OCR識別,提取圖片內文字
在進行OCR之前,請先將掃描文檔進行同步保存。選擇需要進行文字識別的圖片後,點擊底部的“識別”按鈕,就能將這張掃描圖片內的文字識別出來並轉換成一篇文字筆記。
識別出的文本會直接保存到有道雲筆記內,多平臺同步,你可以在手機版、PC端、網頁端等任意平臺的有道雲筆記內進行修改、編輯、整理。
在掃描圖片足夠清晰的情況下,文本識別的準確率可以達到95%以上。
原圖片
識別文字
「圖片」OCR識別
如何將那些“鎖在”圖片裡的文字提取出來?我們用一張hin長(包含了2000多字內容)的微博長圖來為大家演示圖片OCR的用法和文字識別效果。
首先,進入有道雲筆記,選擇“上傳圖片”,將要識別處理的圖片同步保存到有道雲筆記。
然後,在頁面底部找到“更多”按鈕,點擊“文本識別OCR”,就可以看到長圖內的文字被完美識別出來了!
雖然網路圖片的解析度不是很高,並且單張圖片文字內容較多,但是文字識別效果一點不含糊。
圖片 ←→ 識別文本
「PDF文檔」OCR識別
除掃描文檔、圖片外,有道雲筆記(限會員)還可以PDF文本識別服務,PDF輕鬆轉Word!
將PDF文檔上傳到有道雲筆記,並完成同步後,點擊底部的“OCR”按鈕,經過幾秒的等待後(視PDF文檔大小而定),就可以看到PDF內的文字被識別出來,輕鬆轉化為可以自由編輯的筆記格式。
PDF文檔
識別文本
目前雙欄佈局PDF文檔的文本識別支援度較差,暫時建議選擇一欄佈局的PDF文檔進行OCR識別。
另外,你還可以通過有道雲筆記微信公眾號使用圖片OCR功能!只要在微信對話方塊內把圖片發給雲筆記,就能為你將圖片識別成文字。就像這樣↓