有道雲筆記上線OCR功能：輕鬆識別圖片/PDF中文字（支援漢字）

IT之家5月17日消息，繼上線語音速記功能後，網易旗下產品有道雲筆記又上線了另一實用的功能——文檔OCR(即文字識別)。據悉，新上線的OCR功能在原有的掃描功能進行了升級，能夠説明使用者輕鬆識別圖片、PDF等掃描文檔中的文字，並將其轉化成可編輯的文檔。

如果你還不瞭解新功能OCR究竟能為你做什麼，那你一定遇到過以下這些情況，而OCR功能就是對這些“癥結”的那款“靈丹妙藥”：

· 工作或者科研學習中，要應對大量的紙質檔、書刊雜誌、PDF格式的電子資料，很難對這些格式的資料進行編輯和整理

· 讀書時，看到不錯的文章段落想要做書摘筆記，但又懶得去打字或是手抄整理

· 在微信、微博等內容平臺看到有價值的圖片內容會隨手保存mark，或是用截屏把手機頁面內容保存到相冊，但這些圖片資訊散亂在手機各處，很難進行歸納、整理和檢索

以上難題，只需要5秒就能搞定！

那麼，如何用OCR識別功能將紙質資料、圖片和PDF檔，轉換為可以自由編輯的文本格式呢？

「紙質文檔」OCR識別

把紙書、合同等紙質檔、甚至牆體海報，轉換成可編輯的文本格式，只需三步：

step1：智慧掃描

將有道雲筆記升級為最新版後，點擊加號按鈕，新建一篇“文檔掃描”。

接下來就是見證實力的時刻，掃描過程中無需任何人工作業，軟體可以自動、精准識別掃描圖像的邊框，去除掃描區域以外的多餘背景，並且矯正偏斜，穩！准！狠！地將資料掃描進來。

如果對自動掃描結果不夠滿意，還可以選擇手動調節模式進行微調。

在掃描過程中，請儘量將文字擺正，儘量剔除圖片中無關的部分，這樣可以大大提高文字識別的準確度啊~

step2：掃描圖片濾鏡美化

掃描後的圖片會自動調節亮度和對比度，可以便捷的設置為增強或黑白模式，讓圖片更清晰。

step3：OCR識別，提取圖片內文字

在進行OCR之前，請先將掃描文檔進行同步保存。選擇需要進行文字識別的圖片後，點擊底部的“識別”按鈕，就能將這張掃描圖片內的文字識別出來並轉換成一篇文字筆記。

識別出的文本會直接保存到有道雲筆記內，多平臺同步，你可以在手機版、PC端、網頁端等任意平臺的有道雲筆記內進行修改、編輯、整理。

在掃描圖片足夠清晰的情況下，文本識別的準確率可以達到95%以上。

原圖片

識別文字

「圖片」OCR識別

如何將那些“鎖在”圖片裡的文字提取出來？我們用一張hin長（包含了2000多字內容）的微博長圖來為大家演示圖片OCR的用法和文字識別效果。

首先，進入有道雲筆記，選擇“上傳圖片”，將要識別處理的圖片同步保存到有道雲筆記。

然後，在頁面底部找到“更多”按鈕，點擊“文本識別OCR”，就可以看到長圖內的文字被完美識別出來了！

雖然網路圖片的解析度不是很高，並且單張圖片文字內容較多，但是文字識別效果一點不含糊。

圖片 ←→ 識別文本

「PDF文檔」OCR識別

除掃描文檔、圖片外，有道雲筆記（限會員）還可以PDF文本識別服務，PDF輕鬆轉Word！

將PDF文檔上傳到有道雲筆記，並完成同步後，點擊底部的“OCR”按鈕，經過幾秒的等待後（視PDF文檔大小而定），就可以看到PDF內的文字被識別出來，輕鬆轉化為可以自由編輯的筆記格式。

PDF文檔

識別文本

目前雙欄佈局PDF文檔的文本識別支援度較差，暫時建議選擇一欄佈局的PDF文檔進行OCR識別。

另外，你還可以通過有道雲筆記微信公眾號使用圖片OCR功能！只要在微信對話方塊內把圖片發給雲筆記，就能為你將圖片識別成文字。就像這樣↓