那些不錯的小眾軟件 篇二:一個不斷趨近完美的ocr軟件——白描

本內容來源於@什麼值得買APP,觀點僅代表作者本人 |作者:拉德布魯赫信徒


1 引言

關於白描這個軟件的使用,可能從它剛出來就開始了。一開始,白描只有手機端的軟件,但是在那個ocr軟件較少的年代,其簡潔的界面,簡單易用的體驗,瞬間就get到了我的痛點。與當時很多軟件不同的是,它在識別之後可以自行選擇自己需要的文字,可以複製到剪貼板或者直接導出為txt文件。

但是,在後來不斷變換的使用場景中,白描的劣勢就逐步凸顯出來了。由於其只支持移動端,在pc端需要識別的時候,還得截圖並且分享到手機讓它來進行識別,再把識別的結果再次粘貼回電腦,一來二去,也就慢慢把其使用場景限定到了移動端使用。

期間,pc端也不斷冒出很多優秀的ocr軟件,如天若ocr、panda ocr等等優秀的國產軟件。但是缺點在於,對於設備的支持並不全,這一類軟件通常使用場景限定於pc端,而且通常限制了每日的識別次數(雖然每天可能用不到那麼多,但是有時候翻閱電子版pdf或者文獻的時候就難免會超出次數限制),這個就比較雞肋了,我可以用不到,但你不可以沒有。

到後來隨着paddle ocr模型和各大廠商的ocr方案的盛行,各種各樣的產品也逐漸豐富了起來,但是大多都是內嵌在自家app中的。比如說百度網盤或者微信這種的,你想要識別一張圖片,就必須打開這個軟件,找到ocr功能的專區,拖入圖片,進行識別。雖然說不限次數了,但是這種體驗完全稱不上完美。

橫向來說,雖然很多國產的ocr軟件開始支持離線模型,如cnocr或者paddleocr,但是在下載的時候還得一併下載對應的模型,然後還得再設置好對應的路徑,無形中增加了太多的使用成本。

為了解決接口次數的限制,如天若ocr這類軟件已經開放了自定義的接口,如可以去百度購買一定的次數包,根據自己的需求來進行調用。但是,隨着ocr這項技術的發展,識別的場景已經不僅限於識別圖片中的文字,很多時候需要識別表格的時候,單一購買百度的ocr接口是不能滿足需求的,還得再行購買識別表格的次數包,這也增加了太多的使用成本,還得不定期關注次數包的使用情形(雖然買一次能用很久,但是想到還要為了維護這個而耗費精力覺得實在優點不值當)。

在近期,突然看到了白描支持pc端了,不僅僅支持windows,就連mac os都支持了,這不就直接實現了軟件層面的all in one了嘛!只需要一個軟件,不管在任何設備上都可以擁有相同的使用體驗。而且,這個會員只需要30元,一杯奶茶錢,終身無限次的識別圖片以及表格,而且所有平台只需要購買這一個會員就可以了(筆者在剛推出會員的時候就已經購買了),這就是花小錢辦大事了。

2 使用介紹

2.1 功能簡介

這部分由於偷懶就不想自己截圖了,直接把官網的圖搬運過來了,大家見諒。

生成掃描件

這一部分功能主要是可以生成一個清晰的掃描件,而且可以自動切分邊界,也是實現了掃描全能王的核心功能。

文字識別

對於這一部分而言,識別準確率一直都是處於非常高的水平,無需擔心。筆者認為比較好的一點在於,這個可以自行選擇自己需要識別的部分,僅選取這一部分所識別出來的文字。

表格識別

這一部分也是筆者最近用的比較多的功能,而且也是很多其他同類軟件所缺失的部分,經過識別可以直接導出excel文件,對於財務人員以及日常接觸很多表格文件的朋友也算是福音了。

快捷方式識別

這一部分的使用場景主要就是在手機上,能夠將圖片直接通過快捷方式進行識別,都無需先打開軟件再選中圖片。

翻譯

這個功能其實日常也是非常實用。筆者當初論文寫作的時候,由於對日文一竅不通,但是相關文獻只有日文的比較多,通過這個軟件識別後直接將日文轉換為中文,就變成了可以閱讀的文獻了。

掃描邊界

這一點算是掃描全能王的核心功能了,實現的是只識別所需要的區域,從而排除背景環境的影響。

批量識別

有了這個功能,白描就正式成為了一個相對覆蓋全場景的ocr軟件了,既可以識別單圖,也可以批量識別很多圖片。比起那些只支持單一功能的ocr軟件,這一點算是做的非常到位了。

校對

這一點,絕對能夠力壓很多同類產品了,可以對識別結果進行同步校對,保證輸出結果的高度準確性。

同步識別

這一點在pc端推出之後,已經沒有其存在的意義了。在此不贅述。

2.2 電腦端實際使用體驗

正常界面

可以看到,這個軟件的電腦端支持的不僅僅包括表格識別、文字識別,甚至還包括了公式識別。

設置界面

設置界面除了提供快速截圖識別的快捷鍵設置外,還提供了多種選項可以選擇,這一點基本覆蓋了天若ocr的使用場景。

文字識別測試:

文字識別

圖片文字的識別還是非常準確的,基本沒有錯誤,除了支持導出到剪貼板外,還支持導出為txt文件和docx格式word文檔。

表格識別測試:

這裡用值得買公司的高管信息進行測試

測試用圖

識別結果1

識別結果2

導出excel後,可以看到,除了第一列干擾信息過多導致的原因外,基本的格式還是保留的較為完整的。

公式識別:

這裡用微積分的公式進行測試

微積分公式

識別結果3

可以看出,對公式的識別結果還是較為完美的。

忘了說的一點在於,這個不但支持導入圖片進行識別,也可以在截圖之後粘貼進行識別。

3 總結

筆者之前也有折騰過paddleocr的識別,也想過去折騰百度新出的pp-structure表格識別,但是在某一天發現這個軟件之後,發現好像完全沒有折騰的必要了。

因此,在國慶的最後一天,為大家推薦一下這個軟件。好的軟件,總是需要收費,才能保證其功能的不斷完善,相對於折騰所耗費的時間,倒不妨花小錢辦大事了。

希望大家在國慶後的工作生活中,此軟件能夠助力學習工作,實現效率的提升。

本文無利益相關,買這個會員少說也是五六年前的事情了,只是單純覺得這款軟件不錯才加以推薦。

作者聲明本文無利益相關,歡迎值友理性交流,和諧討論~