當前位置:遊戲中心平台 - 熱門遊戲 - 怎樣提高掃描儀的OCR識別率

怎樣提高掃描儀的OCR識別率

 掃描儀是壹種捕獲影像的裝置,作為壹種光機電壹體化的電腦外設產品,掃描儀是繼鼠標和鍵盤之後的第三大計算機輸入設備,它可將影像轉換為計算機可以顯示、編輯、存儲和輸出的數字格式,是功能很強的壹種輸入設備。下面是我收集整理的怎樣提高掃描儀的OCR識別率,歡迎閱讀與收藏。

怎樣提高掃描儀的OCR識別率1

 1、處理原稿掃描圖像,使之清晰可“辨。

 在其它因素都滿足的前提下,對壹般的印刷稿、打印稿(包括清晰的針打稿)等質量較好的文稿進行識別,其識別率壹般可達到98%以上。而對報紙、復印件等不太清晰的文稿進行識別,無論哪種OCR都難以達到較高的識別率。對那些原稿不太清晰的,要註意識別前對圖像加以處理,除去其上的汙跡。並註意將偏斜的版面“改斜歸正,通常OCR軟件均有此功能,且壹般都設有自動糾偏和手動糾偏。;

 2、分辨率應選擇適宜。

 壹般選擇300dpi較合適,分辨率選小了會使識別率降低,選得太大了並不能有效提高識別率,還會大幅度加長文件長度,浪費處理時間。有的掃描軟件設備上有壹項“OCR掃描,幹脆將分辨率鎖定為300dpi,這是很有道理的。;

 3、調整好亮度值和對比度值。

 這條非常關鍵,對識別率的影響很大。亮度值的調整是在識別前,先看看掃描得到的圖像中文字質量如何,如果文字線條凹凸不平,甚至有斷線,說明亮度值太大了,應減小亮度值;當文字線條很黑很粗,甚至擠成了黑疙瘩,分不清筆劃時,則說明亮度值太小了,應增加亮度值;對比度的調節要視原稿確定,筆者常根據預掃時圖像清晰度確定。;

 4、利用OCR的自學習功能。

 有時OCR對某些字總是難以識別,比如OCR開始對“的和“二等字總是搞錯,這時可以利用OCR軟件的自學習功能,“引導它正確識別壹次(有些不同的字體各需壹次),它以後就對這些字“熟識了。具體操作極易,上機看壹下菜單即可明白。另外,若原稿全是英文或其中中文很少,最好用附贈的英文OCR軟件。還有,現在已有壹些很好的文字校對軟件,其中壹般都設置了OCR校對,利用這些軟件先行處理壹下所得文本文件,則可大大減輕人工校對負擔。

 掃描儀維修保養技巧大全

 掃描儀作為圖像輸入設備,已經普及到千家萬戶,那麽在使用當中怎樣正確地去維護保養也是值得註意的問題。今天,編者就為大家介紹壹下掃描儀日常維護保養要註意的地方。

 1、不要隨意熱插拔數據傳輸線。壹般家用掃描儀都是EPP接口,在掃描儀通電後,如果隨意熱插拔接口的數據傳輸線,會損壞掃描儀或計算機的接口,更換起來就比較麻煩了,盡管妳試了壹下沒有出現問題也請不要這樣做。

 2、不要經常插拔電源線與掃描儀的接頭。這樣經常插拔電源線與掃描儀的接頭,會造成連接處的接觸不良,導致電路不通,維修起來也是十分麻煩。正確的電源切斷應該是拔掉電源插座上的直插式電源變換器。

 3、不要中途切斷電源。由於鏡組在工作時運動速度比較慢,當掃描壹幅圖像後,它需要壹部分時間從底部歸位,所以大家在正常供電的情況下不要中途切斷電源,等到掃描儀的鏡組完全歸位後,再切斷電源。現在有壹些掃描儀為了防止運輸中的震動,還對鏡組部分添加了鎖扣,可見鏡組的歸位對鏡組的保護有多麽的重要。

 4、放置物品時要壹次定位準確。有些型號的掃描儀是可以掃描小型立體物品的,在使用這類掃描儀時應當註意:放置物品時要壹次定位準確,不要隨便移動以免刮傷玻璃,更不要在掃描的過程之中移動物品。

 5、不要在掃描儀上面放置物品。因為辦公或家庭空間的限制,而掃描儀又比較占地方,所以有些用戶常將壹些物品放在掃描儀上面,時間長了,掃描儀的塑料遮板因中空受壓將會導致變形,影響使用。

 6、長久不用時請切斷電源。壹些掃描儀並沒有在不使用時完全切斷電源開關的設計,當長久不用時,掃描儀的燈管依然是亮著的,由於掃描儀燈管也是消耗品,所以建議用戶在長久不用時切斷電源。

 7、建議不要在靠窗的位置使用掃描儀。由於掃描儀在工作中會產生靜電,時間長了會吸附灰塵進入機體內部影響鏡組的工作,所以盡量不要在靠窗或容易吸附灰塵的位置使用掃描儀,另外要保持掃描儀使用環境的濕度,減少浮塵對掃描儀的影響。

 8、機械部分的保養。掃描儀長久使用後,要拆開蓋子,用浸有縫紉機油的棉布擦拭鏡組兩條軌道上的油垢,擦凈後,再將適量的`縫紉機油滴在傳動齒輪組及皮帶兩端的軸承上面,最後裝機測試,妳會發現噪音小了很多。

 掃描儀故障解決方法

 掃描儀是壹種被廣泛應用於計算機的輸入設備。作為光電、機械壹體化的高科技產品,它是我們常用的辦公設備,可它壹旦出現故障就會令我們束手無策,有些故障需要專業人員維修,也有許多故障是自己就可以排除的。下面就向大家介紹壹些常見故障的排除方法:

 掃描儀的拆卸

 在維護和檢修時往往需要拆卸掃描儀,因此首先為大家介紹掃描儀拆卸的基本方法:

 1、首先拆除玻璃平臺,用十字旋具伸入圓孔中擰下螺釘,即可向上取下頂蓋和玻璃平臺。打開掃描儀後,即可看到步進電動機、傳動帶、掃描頭和電路板等部件。有些掃描儀的上下兩部分不是用螺釘而是用塑料卡扣銜接,拆卸時用平口小旋具插到縫隙中撬開塑料卡扣,即可分離上下兩部分,撬塑料卡扣時動作要輕,不要損壞塑料部件。

 2、拔下數據軟排線。掃描儀內部壹般有兩塊電路板,—塊固定在掃描頭後側,另—塊安裝在掃描儀後側,兩塊電路板通過數據軟排線相連接。取下掃描頭之前需先取下數據軟排線。數據軟排線卡在電路板上的排線卡槽中,取下軟排線時需先將排線卡槽兩側的卡銷向外撥,而後即可很輕松地向外抽出軟排線。

 3、拆卸掃描頭。掃描頭大多穿在圓形金屬桿(導軌)上,由傳動帶帶動沿掃描儀縱向運動,只需將圓形金屬桿從底座上的塑料卡座中取下,使掃描頭脫離傳動帶,即可向上取下掃描頭和圓形金屬桿,而後將圓形金屬桿從掃描頭上抽出。

 4、取下燈管。燈管位於掃描頭頂部,沿掃描頭橫向放置,卡在掃描頭兩側的塑料卡座上,其供電電源插頭插在掃描頭後側的電路板上。只需取下電路板上燈管的供電電源插頭,即可從掃描頭上取下燈管。最細的燈管只有火柴棍粗細,拆卸、放置時需特別小心。

 5、拆除電路板。擰下兩粒螺釘即可取下掃描頭上的電路板,在電路板正面就能看到雙列直插封裝的CCD器件。由於CCD器件需正對掃描光路中光學透鏡,安裝還原不當會影響掃描質量,建議不要隨便拆下掃描頭上的電路板。

怎樣提高掃描儀的OCR識別率2

 1、處理原稿掃描圖像,使之清晰可"辨"。在其它因素都滿足的前提下,對壹般的印刷稿,打印稿(包括清晰的針打稿)等質量較好的文稿進行識別,其識別率壹般可達到98%以上。而對報紙,復印件等不太清晰的文稿進行識別,無論哪種OCR都難以達到較高的識別率。對那些原稿不太清晰的,要註意識別前對圖像加以處理,除去其上的汙跡。並註意將偏斜的版面"改斜歸正",OCR壹般都設有自動糾偏和手動糾偏,作版面分析和傾斜校正。

 以尚書OCR為例,其版面分析把文稿分為橫排正文、豎排正文、表格和圖形圖像四種類型。在版面上按住鼠標左鍵沿對角線拖出壹塊矩形區域,並選擇相應的類型。尚書OCR只對前三種類型作文字識別,對第四種類型和劃定區域以外不作識別。尚書OCR允許文稿有細微的傾斜,但傾斜得太厲害了就要作傾斜校正。校正的方法是,按住鼠標右鍵拖出直線使之平行於傾斜的文本,這樣,識別軟件會自動地將文本放正。標準版的尚書OCR提供了自動的版面分析和傾斜校正,但筆者發現,它對復雜的版面的分析往往不太準確,需要再作人工的矯正。

 2、分辨率應選擇適宜。壹般選擇300dpi較合適,分辨率選小了會使識別率降低,選得太大了並不能有效提高識別率,還會大幅度加長文件長度,浪費處理時間。有的掃描軟件設備上有壹項"OCR掃描",幹脆將分辨率鎖定為300dpi,這是很有道理的。

 3、調整好亮度值和對比度值。這條非常關鍵,對識別率的影響很大。選擇合適的掃描分辨率:不求最“高”,只求最“佳”。

 亮度值的調整是在識別前,先看看掃描得到的圖像中文字質量如何,如果文字線條凹凸不平,甚至有斷線,說明亮度值太大了,應減小亮度值;當文字線條很黑很粗,甚至擠成了黑疙瘩,分不清筆劃時,則說明亮度值太小了,應增加亮度值;對比度的調節要視原稿確定。

 根據經驗,普通五號印刷體采用250~300dpi比較合適;若字號比較大(四號以上),用150~200dpi就足夠了;如果是六號或七號字,就要考慮使用400~600dpi了。當然,這也不是絕對的,如果印刷字跡比較模糊,或者筆劃較多的識別文本,應適當提高掃描的分辨率。提供壹個公式供參考:文件長度(字節)=(水平尺寸×垂直尺寸×掃描分辨率)/8。

 4、利用OCR的自學習功能。有時OCR對某些字總是難以識別,比如OCR開始對"的"和"二"等字總是搞錯,這時可以利用OCR軟件的自學習功能,"引導"它正確識別壹次(有些不同的字體各需壹次),它以後就對這些字"熟識"了。具體操作極易,上機看壹下菜單即可明白。另外,若原稿全是英文或其中中文很少,最好用附贈的英文OCR軟件。還有,現在已有壹些很好的文字校對軟件,其中壹般都設置了OCR校對,利用這些軟件先行處理壹下所得文本文件,則可大大減輕人工校對負擔。

  • 上一篇:寫盡人生的十首詩詞
  • 下一篇:怪物X聯盟2四龍王全解 必閃流暗黑強襲攻略
  • copyright 2024遊戲中心平台