本內容來源於@什麼值得買APP,觀點僅代表作者本人 |作者:拉德布魯赫信徒
1 引言
關於白描這個軟體的使用,可能從它剛出來就開始了。一開始,白描只有手機端的軟體,但是在那個ocr軟體較少的年代,其簡潔的界面,簡單易用的體驗,瞬間就get到了我的痛點。與當時很多軟體不同的是,它在識別之後可以自行選擇自己需要的文字,可以複製到剪貼板或者直接導出為txt文件。
但是,在後來不斷變換的使用場景中,白描的劣勢就逐步凸顯出來了。由於其只支持移動端,在pc端需要識別的時候,還得截圖並且分享到手機讓它來進行識別,再把識別的結果再次粘貼回電腦,一來二去,也就慢慢把其使用場景限定到了移動端使用。
期間,pc端也不斷冒出很多優秀的ocr軟體,如天若ocr、panda ocr等等優秀的國產軟體。但是缺點在於,對於設備的支持並不全,這一類軟體通常使用場景限定於pc端,而且通常限制了每日的識別次數(雖然每天可能用不到那麼多,但是有時候翻閱電子版pdf或者文獻的時候就難免會超出次數限制),這個就比較雞肋了,我可以用不到,但你不可以沒有。
到後來隨著paddle ocr模型和各大廠商的ocr方案的盛行,各種各樣的產品也逐漸豐富了起來,但是大多都是內嵌在自家app中的。比如說百度網盤或者微信這種的,你想要識別一張圖片,就必須打開這個軟體,找到ocr功能的專區,拖入圖片,進行識別。雖然說不限次數了,但是這種體驗完全稱不上完美。
橫向來說,雖然很多國產的ocr軟體開始支持離線模型,如cnocr或者paddleocr,但是在下載的時候還得一併下載對應的模型,然後還得再設置好對應的路徑,無形中增加了太多的使用成本。
為了解決介面次數的限制,如天若ocr這類軟體已經開放了自定義的介面,如可以去百度購買一定的次數包,根據自己的需求來進行調用。但是,隨著ocr這項技術的發展,識別的場景已經不僅限於識別圖片中的文字,很多時候需要識別表格的時候,單一購買百度的ocr介面是不能滿足需求的,還得再行購買識別表格的次數包,這也增加了太多的使用成本,還得不定期關注次數包的使用情形(雖然買一次能用很久,但是想到還要為了維護這個而耗費精力覺得實在優點不值當)。
在近期,突然看到了白描支持pc端了,不僅僅支持windows,就連mac os都支持了,這不就直接實現了軟體層面的all in one了嘛!只需要一個軟體,不管在任何設備上都可以擁有相同的使用體驗。而且,這個會員只需要30元,一杯奶茶錢,終身無限次的識別圖片以及表格,而且所有平台只需要購買這一個會員就可以了(筆者在剛推出會員的時候就已經購買了),這就是花小錢辦大事了。
2 使用介紹
2.1 功能簡介
這部分由於偷懶就不想自己截圖了,直接把官網的圖搬運過來了,大家見諒。
生成掃描件
這一部分功能主要是可以生成一個清晰的掃描件,而且可以自動切分邊界,也是實現了掃描全能王的核心功能。
文字識別
對於這一部分而言,識別準確率一直都是處於非常高的水平,無需擔心。筆者認為比較好的一點在於,這個可以自行選擇自己需要識別的部分,僅選取這一部分所識別出來的文字。
表格識別
這一部分也是筆者最近用的比較多的功能,而且也是很多其他同類軟體所缺失的部分,經過識別可以直接導出excel文件,對於財務人員以及日常接觸很多表格文件的朋友也算是福音了。
快捷方式識別
這一部分的使用場景主要就是在手機上,能夠將圖片直接通過快捷方式進行識別,都無需先打開軟體再選中圖片。
翻譯
這個功能其實日常也是非常實用。筆者當初論文寫作的時候,由於對日文一竅不通,但是相關文獻只有日文的比較多,通過這個軟體識別後直接將日文轉換為中文,就變成了可以閱讀的文獻了。
掃描邊界
這一點算是掃描全能王的核心功能了,實現的是只識別所需要的區域,從而排除背景環境的影響。
批量識別
有了這個功能,白描就正式成為了一個相對覆蓋全場景的ocr軟體了,既可以識別單圖,也可以批量識別很多圖片。比起那些只支持單一功能的ocr軟體,這一點算是做的非常到位了。
校對
這一點,絕對能夠力壓很多同類產品了,可以對識別結果進行同步校對,保證輸出結果的高度準確性。
同步識別
這一點在pc端推出之後,已經沒有其存在的意義了。在此不贅述。
2.2 電腦端實際使用體驗
正常界面
可以看到,這個軟體的電腦端支持的不僅僅包括表格識別、文字識別,甚至還包括了公式識別。
設置界面
設置界面除了提供快速截圖識別的快捷鍵設置外,還提供了多種選項可以選擇,這一點基本覆蓋了天若ocr的使用場景。
文字識別測試:
文字識別
圖片文字的識別還是非常準確的,基本沒有錯誤,除了支持導出到剪貼板外,還支持導出為txt文件和docx格式word文檔。
表格識別測試:
這裡用值得買公司的高管信息進行測試
測試用圖
識別結果1
識別結果2
導出excel後,可以看到,除了第一列干擾信息過多導致的原因外,基本的格式還是保留的較為完整的。
公式識別:
這裡用微積分的公式進行測試
微積分公式
識別結果3
可以看出,對公式的識別結果還是較為完美的。
忘了說的一點在於,這個不但支持導入圖片進行識別,也可以在截圖之後粘貼進行識別。
3 總結
筆者之前也有折騰過paddleocr的識別,也想過去折騰百度新出的pp-structure表格識別,但是在某一天發現這個軟體之後,發現好像完全沒有折騰的必要了。
因此,在國慶的最後一天,為大家推薦一下這個軟體。好的軟體,總是需要收費,才能保證其功能的不斷完善,相對於折騰所耗費的時間,倒不妨花小錢辦大事了。
希望大家在國慶後的工作生活中,此軟體能夠助力學習工作,實現效率的提升。
本文無利益相關,買這個會員少說也是五六年前的事情了,只是單純覺得這款軟體不錯才加以推薦。
作者聲明本文無利益相關,歡迎值友理性交流,和諧討論~