TWI463415B - 以物件為基礎之光學字元辨識之預處理演算法 - Google Patents
以物件為基礎之光學字元辨識之預處理演算法 Download PDFInfo
- Publication number
- TWI463415B TWI463415B TW099106501A TW99106501A TWI463415B TW I463415 B TWI463415 B TW I463415B TW 099106501 A TW099106501 A TW 099106501A TW 99106501 A TW99106501 A TW 99106501A TW I463415 B TWI463415 B TW I463415B
- Authority
- TW
- Taiwan
- Prior art keywords
- block
- max
- pixels
- value
- pixel
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Description
本申請案主張2009年3月6日申請之美國臨時專利申請案第61/157,904號之優先權利,該案之全文以引用的方式併入本文中。
用於光學字元辨識(「OCR」)之軟體及專用設備已可商業化購得,但仍需專用硬體。例如,圖1顯示一包含專用名片影像擷取相機110(由一區塊110指示)之OCR系統100。相機110經組態用於擷取一所關注物件(例如,名片)之一影像且產生影像資料115(由一箭頭指示)。在現有系統中,相機110通常為處於一標準電腦外部且專門用於擷取所期望影像(例如,名片影像)之附加設備。為使影像擷取條件(諸如共軛距離及照明)最佳化,相機110通常包含硬體以用於將名片固持在離相機一特定距離及角度處。相機110亦可為一箱形設置,其包含用於饋送名片之一狹槽及一內部光源及影像擷取裝置。其後將影像資料115饋送至一電腦120,該電腦120包含安裝於其上之OCR軟體。電腦120其後對影像資料115執行OCR處理且提供一輸出125。輸出125為例如一擷取影像及使用OCR軟體自該影像提取之資料(諸如名片擁有者之姓名及聯繫人資訊,其經組織為可饋送至可用聯繫人管理應用中之一格式)的一顯示。
咸知消費者可能認為附加設備(諸如圖1中所顯示)麻煩、昂貴且不受歡迎。
本發明揭示一種預處理一物件之一失焦影像的方法,該方法包含:應用一以物件為基礎之清晰濾光器於該失焦影像上以產生一較清晰影像;及使用逐區塊量化來量化該較清晰影像。
本發明揭示一種用於由印刷於一物件上之文數字資訊產生經解碼之文字資料的系統,該系統包含一相機,該相機獲得該文數字資訊之影像資料。該系統亦包含一預處理器,該預處理器(a)對該影像資料執行逐區塊量化以形成經調節之影像資料,且(b)對該經調節之影像資料執行光學字元辨識以產生該經解碼之文字資料。
結合下文簡短描述之圖式參照下述實施方式,可瞭解本發明。應注意為繪示之清楚性,圖式中之某些元件可不按比例繪製。
雖然有可商業化購得之專用名片OCR設備、硬體及軟體,但其等通常利用屬一專用掃描器及/或一「近聚焦(close-focused)」專用相機形式之專用硬體。如本文中所使用,術語「近聚焦」意指一相機經調整使得相對接近該相機之物件係處於最佳聚焦處。在一網路攝影機或膝上型相機之情況下,此意指該相機經調整以聚焦於遠離該相機約15釐米至25釐米之一物件上,與此類相機通常聚焦之典型65釐米距離(例如,適於視訊會議之擷取一桌上型電腦或膝上型電腦之使用者的影像)相對。某些此類相機包含一名片夾以確保將一名片在離相機一最佳距離處保持穩定
以用於OCR輸入資料擷取。但近聚焦相機(當可用時)係作為習知網路攝影機之較差替代方式。例如,其等之特性近聚焦意指視訊會議典型範圍內之物件將為離焦。因此,期望不必對名片OCR使用專用設備。
由於將相機包含於行動通信裝置中,膝上型電腦及獨立電腦系統(諸如網路攝影機)變得更加普遍,故本文意識到使用已存在之膝上型相機或網路攝影機來對名片執行OCR可為有利的。以此方式,使用者可自其等之現有網路攝影機、膝上型相機及具有整合式相機之其他設備中得到額外功能,而無需支付額外硬體。
已知OCR一般利用一清晰影像(即,提供高對比度、經成像字母及數字中明確定義之線及空間的一影像)而最佳地運作。當正成像物件處於相對應於一典型光學系統之最佳焦點的一共軛距離處時,該光學系統提供一清晰影像。使一物件於最佳焦點處成像之此類系統具有高空間頻率(相對應於小影像細節)相對高之一調變轉移函數,因此提供一清晰影像。然而,膝上型電腦及網路攝影機通常利用經最佳化用於視訊會議應用(例如,用於定位於約65釐米之共軛距離處的物件)之一固定焦距,且因此不會在近範圍內產生一清晰影像,如名片OCR所需。當使用一當前可購得之膝上型相機或網路攝影機以使一名片在近範圍(例如,15釐米與25釐米之間的一共軛距離)內成像使得該名片實質上填充該相機之視域時,其產生在高空間頻率處具有低調變轉移函數之一失焦影像,該失焦影像不利於
OCR。當將名片放置於65釐米或更大之一共軛距離(即,網路攝影機或膝上型相機之一正常設計焦距)處時,所擷取影像成聚焦,但名片在該影像內之放大倍率如此小使得線與空間之清晰度降低,且該影像亦不利於OCR。
此處所描述之演算法對來自一網路攝影機或膝上型相機之一未經處理失焦影像執行預處理,藉此使用一內建網路攝影機或膝上型相機而使名片OCR具有合理精確性。經預處理之影像資料被饋送至執行實際OCR之外部軟體。
在一實施例中,本文中所描述之一預處理演算法利用現有膝上型相機及網路攝影機且利用現有OCR軟體而運作,以相對於利用未經預處理之一影像所達成之結果而提供較高精確性之OCR結果。
圖2中繪示根據一實施例之利用以物件為基礎的預處理之一OCR系統的一實例。圖2顯示包含一網路攝影機或膝上型相機210之一電腦系統200。電腦系統200可為(例如)具一網路攝影機之一桌上型系統、具一整合式相機之一膝上型系統或具一整合式相機及用於預處理與OCR之足夠處理能力的任何裝置。相機210擷取一名片之一影像且將影像資料215(由一箭頭指示)提供至電腦系統200內之一處理器220以用於預處理及OCR。影像資料215可為(例如)由相機210擷取之未經處理影像。相機210可視需要地包含例如用於清晰或邊緣增強之處理能力。處理器220經組態以對影像資料215執行一預處理常式且執行OCR以產生輸出資料225(由一箭頭指示)。輸出資料225(例如)經饋送至聯繫人
管理軟體或一外部裝置中。另外,相機210可經再次最佳化為一較近固定焦點位置,該固定焦點位置為視訊會議提供足夠高之影像品質,同時有利於OCR任務。或者,相機210亦可藉由使用專用波前相位修改而具有延伸景像深度(「EDoF」)能力,諸如Cathey等人在美國專利第5,748,371號中所揭示,該案之全文以引用的方式併入本文中。在設計視訊會議與OCR應用之間的取捨時,加入EDoF能力提供給系統設計者較多靈活性。
現在結合圖2參照圖3,圖3係顯示一處理方法300之一流程圖,在一實施例中可藉由圖2之電腦系統200而執行該處理方法300。處理方法300開始於步驟310以擷取一名片之一影像。在電腦系統200中,步驟310係藉由網路攝影機或膝上型相機210而執行。在步驟320中,預處理步驟310中所產生之影像資料315(由一箭頭指示)。預處理步驟320調節影像資料315以增強OCR結果之精確性。在步驟330中,對影像資料325(由一箭頭指示)執行OCR,藉此產生經解碼之文字資料335(亦由一箭頭指示)。方法300在步驟330後可視為已完成,或者方法300繼續至一選用的後處理步驟340,該後處理步驟340可包含例如藉由聯繫人管理軟體而分析經解碼之文字資料335。
現在結合圖3轉向圖4,圖4繪示預處理步驟320之一例示性實施例的其他細節。如圖4中所顯示,預處理步驟320包含步驟410中之應用一以物件為基礎(「OB」)之濾光器至影像資料315。與一般清晰濾光器相反,OB濾光器以對物
件特定之一方式使影像資料清晰。在本實例中,待成像物件係一名片中之字元。其他物件(諸如但不限於生物樣本中之條碼、生物統計模式或螢光球(fluorescent bead))亦可用作目標物件。步驟410提供經濾光之影像資料415。在步驟420中,對經濾光之影像資料應用適應性量化,產生輸出資料325(亦見圖3)。
圖5及圖6繪示子步驟410及420之一例示性實施例的其他步驟。具體而言,步驟410對影像資料315應用一OB濾光器,其中該OB濾光器(例如)已根據方法500(圖5)而最佳化以用於特定類別之正成像物件。步驟420包括對由步驟410產生之經濾光之影像資料415應用一適應性逐區塊量化,如圖6中進一步詳細說明。
圖5中繪示用於建構OB濾光器之一例示性方法500。方法500開始於步驟510,步驟510辨識一目標物件。例如,在本案例中,已知目標物件將包含名片中存在之文數字字元。其後在步驟520中,建立一物件資料組。在名片實例中,步驟520收集包含(例如)通常見於一名片上之文數字符號的資料,該等資料在字號(例如6pt至14pt)、字形(例如,常規、加粗、傾斜)及字型(例如,Arial及Times New Roman)之範圍內。在步驟530中,一相機(例如,一網路攝影機或膝上型相機,諸如相機210)係用於獲取一組聚焦影像(例如,「期望組」)。例如,步驟530包含將該相機焦點調整為近聚焦使得所期望組可利用OCR軟體解碼而無需任何預處理。此處應注意對於相機之常見目的用途,近聚焦
該相機並不實際,因為一近聚焦相機無法在大於65釐米之目的用途共軛距離處產生高品質影像。應瞭解本文中所參照之相機為數位相機,其等提供各個影像為一像素圖框,其中各個像素係由來自一光學影像之數位化光強度資訊組成。該數位化光強度資訊可稱為具有選自一組「灰階等級」之值的「影像資料」。然而灰階等級通常表示自黑色(例如,灰階值為0)轉變至白色(例如,灰階值為255,使用8位元之精確度)之光強度,本文中亦預期此等等級可代表數位化色彩資訊之可能性。
繼續參照圖5,方法500繼續至步驟540以利用網路攝影機或膝上型相機獲取物件資料組之一組失焦影像(亦即「偵測組」)作為其預設聚焦位置(亦即目的用途共軛距離大於65釐米)。最後,在步驟550中,基於分析期望資料組及偵測資料組而建構一OB濾光器。該OB濾光器可(例如)使用一約束最小平方(「CLS」)濾光器設計技術(諸如Scott E.Umbaugh,CRC Press,Taylor and Francis Group,Boca Raton,FL,2005之「電腦成像:數位元影像分析與處理(Computer Imaging:Digital Image Analysis and Processing)」中所描述)而建構。所得OB濾光器係在圖4之步驟410中用作以物件為基礎之濾光器。
在一實施例中,例如,在相機210之一初始校正期間由一製造商僅執行方法500一次。所得OB濾光器之參數其後可儲存於相機210之一非揮發性記憶體中以便隨後使用。
現在結合圖4參照圖6及圖7,其等繪示根據一實施例之
步驟420之其他細節。舉例而言,對經濾光之影像資料415應用一適應性逐區塊量化程序以將經濾光之影像資料轉換為一三元(例如,三階)影像。換言之,對經濾光之影像內插一因數β(其中β為一內插因數)以達成二元超解析度。β可為(例如)一使用者設定之變量或可為一預定工廠設定。本文意識到當本實施例係基於一三元量化時,一二元(例如,二階)量化可滿足特定應用。
如圖6中所顯示,適應性逐區塊量化應用步驟420開始於輸入經濾光之影像資料415。經濾光之影像資料415經引導至步驟610,其中影像資料415係定義為一系列n×m區塊(由dnm(i,j))表示各個此類區塊,一支援N×M區塊(由DNM(i,j)表示)圍繞各個dnm(i,j),兩類區塊均圍繞像素(i,j),其中i與j為指數變量。如圖7中所顯示,n與m為圍繞像素(i,j)730之方框720以像素計之高度與寬度,而N與M為圍繞像素(i,j)之較大支援方框710以像素計之高度與寬度;因此N>n且M>m。雖然圖7顯示支援方框710(DNM(i,j))及n×m區塊720(dnm(i,j))圍繞像素(i,j)730且以其為中心,但此類圍繞並非必須且並非在所有情況下均可行(例如,當像素(i,j)730足夠接近一影像之一邊緣,而方框710或方框720將延伸超過該邊緣時)。各個區塊DNM(i,j)之特性係用於提供特定影像內容以適應性地處理各個區塊dnm(i,j),如現將予以描述者。
步驟610後接著步驟620,其中一最小像素灰階值minI=min(DNM(i,j))及一最大像素灰階值maxI=max(DNM(i,j))係定
義為該影像資料在一N×M區塊內之最小灰階值及最大灰階值。又,灰階變量intI及midI係定義為intI=(maxI-minI)及midI=(maxI+minI)×(0.5)。為完成步驟620,定義一灰階區間I為I=[minI,maXI]。
步驟620後接著決策630,決策630比較一差分灰階臨限值dThresh與(maxI-minI)。dThresh可為(例如)一使用者設定之變量或可為一預定工廠設定。若(maxI-minI)<dThresh,則區塊dnm(i,j)相對應於一均勻區域。一種考量此關係之方法在於支援區塊DNM(i,j)中之像素值之間的對比度判定dnm(i,j)像素是否應該分別量化或可作為一群組而一起設定為一高灰階值或一低灰階值。若DNM(i,j)具有低對比度,則(maxI-minI)<dThresh,因此所有dnm(i,j)可作為一群組而簡單地設定為一高灰階值或一低灰階值。在此情況下,步驟420進行至比較midI與一聯合灰階臨限值UThresh之另一決策640。UThresh可為(例如)一使用者設定之變量或可為一預定工廠設定。若midI<UThresh,則在步驟642中將dnm(i,j)影像資料量化為一最低灰階等級(例如,0)。若midI>UThresh,則在步驟644中將dnm(i,j)影像資料量化為一最高灰階等級(例如255)。
或者,若決策630之答案為「否」,則在步驟650中根據區域分析量化區塊dnm(i,j),如圖8中詳細描述。一種考量此關係之方法在於當支援區塊DNM(i,j)中有足夠對比度時,應分別評估及量化dnm(i,j)像素。
現在參照圖8,步驟650開始於步驟810,其中選擇區間I
之百分比α且由I'=[minI',maxI']表示,其中最小區間值minI'及最大區間值maxI'係定義為:minI'=midI-(intI×α×0.5)/100及maxI'=midI+(intI×α×0.5)/100。
繼續至步驟820,對於區間I'中之各個值,可定義兩個類別為高於一灰階臨限值t或低於一灰階臨限值t。即,兩個類別為class1=(區塊DNM(i,j)中之值)<t及class2=(區塊DNM(i,j)中之值)t。
另一種表示此等類別之方法為:class1=[minI',t],class2=[t,maxI']。
為完成步驟820,選擇一值t*為一臨限值,t*使一絕對數量值[std(class 1)-std(class 2)]最小化,其中std( )表示已熟知之標準差公式。可以各種方法判定t*,諸如藉由計算所有可能t值(例如,已知t必須在I'內)之class1、class2及[std(class 1)-std(class 2)]或者經由使用搜尋演算法。
定義另一變量midWidth;midWidth可為(例如)一使用者設定之變量或可為一預定工廠設定。步驟830其後定義三個獨特灰階區域(假定灰階等級為自0至255):
灰階區域1:[0,t*-midWidth)
灰階區域2:[t*-midWidth,t*+midWidth]
灰階區域3:(t*+midWidth,255]
決策840使用此三個區域而判定各個像素區塊dnm(i,j)之
灰階區域,且步驟650取決於各個此類像素之灰階值落在哪個區域而進行一不同動作。例如,若在步驟840中發現dnm(i,j)中之一像素落在區域1中,則步驟850將該像素值重設為最低灰階等級(例如,0)。若在步驟840中發現此像素落在區域3中,則步驟860將該像素值重設為最高灰階等級(例如,255)。若在步驟840中發現像素落在區域3中,則步驟870將該像素值重設為一中間預定義等級,該中間預定義等級可為(例如)一使用者設定之變量或可為一預定工廠設定。在步驟850、步驟860及步驟870之任何一者後,步驟650進行至決策880以判定是否仍需處理dnm(i,j)中之任何更多像素。若需要,則步驟650回到步驟840以處理更多像素;若不需要,則完成步驟650且回到步驟660(圖6)。
因此,步驟840至步驟880將區塊dnm(i,j)中之各個像素資料量化為如下三個值之一者:最低灰階值、一中間灰階值或最高灰階值。
返回參照圖6,當步驟650(圖8)完成時,步驟420回到步驟660,其中對於待分析之經過濾之影像資料中是否留有更多n×m區塊作出決策。若決策660之答案為「是」,則步驟420回到步驟610,其中選擇另一區塊。若決策660之答案為「否」,則外送結果至OCR處理作為經調節之影像資料325。
雖然本發明中所描述之實例係關於由一網路攝影機或膝上型相機所擷取之影像的預處理以供隨後之OCR處理,但
熟習此項技術者應瞭解本文中所描述及主張之流程可應用於除OCR外之各種任務的影像資料之預處理。預處理演算法自身不同於一標準清晰及雜訊減少濾光器,因為清晰濾光器係以物件為基礎,且步驟420中所執行之適應性量化演算法使用局部影像資料內容之影像統計量,因此量化自身適應於可變背景及/或字體對比。演算法可用於其他以任務為基礎之成像系統應用,該等應用可受益於擷取影像之預調節以增強任務效能。例如,上文所描述之預處理演算法可併入於一以人物為基礎之成像系統中,其中成像光學器件、預處理及影像信號處理係經共同最佳化以用於處理手頭之特定任務。將本文中所描述之方法應用於此等影像因此可視為落在所揭示實施例之範疇內。因此應注意以上描述中含有之標的物或附圖中顯示之標的物應解釋為闡釋性而非限制性意味。
100‧‧‧OCR系統
110‧‧‧相機
115‧‧‧影像資料
120‧‧‧電腦
125‧‧‧輸出
200‧‧‧電腦系統
210‧‧‧網路攝影機/膝上型相機
215‧‧‧影像資料
220‧‧‧處理器
225‧‧‧輸出資料
300‧‧‧處理方法
315‧‧‧影像資料
325‧‧‧影像資料
335‧‧‧經解碼之文字資料
415‧‧‧經濾光之影像資料
500‧‧‧方法
710‧‧‧支援方框
720‧‧‧方框
730‧‧‧像素(i,j)
圖1係繪示一先前技術名片OCR系統之一方塊圖。
圖2係繪示根據一實施例之包含預處理之一名片OCR系統的一方塊圖。
圖3係繪示一種根據一實施例之用於執行OCR之方法的一流程圖,該方法使用圖2之名片OCR系統。
圖4係繪示圖3所示之一預處理步驟的進一步細節之一流程圖。
圖5係繪示根據本發明之用於圖4之預處理步驟的一以物件為基礎之濾光器的細節之一流程圖。
圖6顯示根據一實施例之用於量化一影像之一內插程序,該內插程序使用一逐區塊適應性量化。
圖7係繪示根據一實施例之用於圖6之量化程序的區塊辨識之一流程圖。
圖8係顯示根據一實施例之用於圖6之量化程序的一區域分析步驟之一流程圖。
200‧‧‧電腦系統
210‧‧‧網路攝影機/膝上型相機
215‧‧‧影像資料
220‧‧‧處理器
225‧‧‧輸出資料
Claims (10)
- 一種預處理一物件之一失焦影像的方法,該方法包括:定義灰階臨限值dThresh與UThresh為在具有一最高灰階等級及一最低灰階等級之一灰階內的值;使用一處理器將一以物件為基礎之清晰濾光器應用於該失焦影像上以產生一較清晰影像;使用該處理器,藉由以下步驟,使用逐區塊量化來量化該較清晰影像:將該較清晰影像劃分為一系列n×m區塊,其中各個n×m區塊係高度為n個像素且寬度為m個像素之一影像資料像素區塊;定義一支援N×M區塊,其相對應於各個n×m區塊,其中各個N×M區塊係高度為N個像素且寬度為M個像素之一影像資料像素區塊,N>n且M>m,且該N×M區塊圍繞該n×m區塊;且對於各個特定n×m區塊:定義maxI為相對應於該特定n×m區塊之該支援N×M區塊內的一最大像素灰階值,定義minI為相對應於該特定n×m區塊之該支援N×M區塊內的一最小像素灰階值,對於該N×M區塊中之所有像素(i,j),定義
若(maxI-minI)<dThresh且meanI>UThresh,則將該特定n×m區塊內之所有像素設定為該最高灰階等級,及若(maxI-minI)<dThresh且meanI UThresh,則將該特定n×m區塊內之所有像素設定為該最低灰階等級。 - 如請求項1之方法,其進一步包括:定義一百分比α;定義若干值之一區間I'=[minI',maxI'];其中minI'=(maxI+minI)×(0.5)-((maxI-minI)×α×0.5)/100,且其中maxI'=(maxI+minI)×(0.5)+((maxI-minI)×α×0.5)/100;及判定該區間I'內之一臨限值t*,該臨限值t*使一數量[std(class 1)-std(class 2)]最小化,其中class 1包含N×M區塊內落在區間[minI',t*]中之像素值,且class 2包含N×M區塊內落在區間[t*,maxI']中之像素值。
- 如請求項2之方法,其進一步包括:定義一參數midWidth;將該特定n×m區塊中值小於(t*-midWidth)之所有像素量化為該最低灰階值;將該特定n×m區塊中值大於(t*+midWidth)之所有像素量化為該最高灰階值;及將該特定n×m區塊中值大於(t*-midWidth)但小於(t*+midWidth)之所有像素量化為一中間灰階值。
- 如請求項1之方法,其中應用該以物件為基礎之清晰濾光器包括: 獲取該物件之一組聚焦影像;獲取該物件之一組失焦影像;及基於該組聚焦影像及該組失焦影像利用一約束最小平方(CLS)濾光器設計技術而建構該以物件為基礎之清晰濾光器。
- 一種用於由印刷於一物件上之文數字資訊產生經解碼之文字資料的系統,該系統包括:一相機,其獲得該文數字資訊之影像資料;及一預處理器,其藉由以下步驟而(a)對該影像資料執行逐區塊量化以形成經調節之影像資料:將該影像資料劃分為一系列n×m區塊,其中各個n×m區塊係高度為n個像素且寬度為m個像素之一影像資料像素區塊;定義一支援N×M區塊,其相對應於各個n×m區塊,其中各個N×M區塊係高度為N個像素且寬度為M個像素之一影像資料像素區塊,N>n且M>m,且該N×M區塊圍繞該n×m區塊;且對於各個特定n×m區塊:定義maxI為相對應於該特定n×m區塊之該支援N×M區塊內的一最大像素灰階值,定義minI為相對應於該特定n×m區塊之該支援N×M區塊內的一最小像素灰階值,對於該N×M區塊中之所有像素(i,j),定義
若(maxI-minI)<dThresh且meanI>UThresh,則將該特定n×m區塊內之所有像素設定為該最高灰階等級,及若(maxI-minI)<dThresh且meanI UThresh,則將該特定n×m區塊內之所有像素設定為該最低灰階等級,及(b)對該經調節之影像資料執行光學字元辨識以產生該經解碼之文字資料。 - 如請求項5之系統,其中該預處理器在執行該逐區塊量化前對該影像資料執行以物件為基礎之濾光。
- 如請求項6之系統,其中該預處理器利用一約束最小平方(CLS)濾光器設計技術由一組聚焦影像及一組失焦影像而產生一濾光器以執行該以物件為基礎之濾光。
- 如請求項5之系統,其中該相機係一網路攝影機及一膝上型相機之一者,且該預處理器係一膝上型電腦及一桌上型電腦之一者。
- 如請求項6之系統,其中該預處理器利用聯繫人管理軟體而處理該經解碼之文字。
- 如請求項5之系統,其中該預處理器係藉由如下操作而執行該逐區塊量化:利用一百分比α以定義若干值之一區間I'=[minI',maxI'];其中minI'=(maxI+minI)×(0.5)-((maxI-minI)×α×0.5)/100,且其中maxI'=(maxI+minI)×(0.5)+((maxI-minI)×α×0.5)/100; 判定該區間I'內之一臨限值t*,該臨限值t*使一數量[std(class 1)-std(class 2)]最小化,其中class 1包含N×M區塊內落在區間[minI',t*]中之像素值,且class 2包含N×M區塊內落在區間[t*,maxI']中之像素值;及利用一參數midWidth以:將該特定n×m區塊中值小於(t*-midWidth)之所有像素量化為該最低灰階值,將該特定n×m區塊中值大於(t*+midWidth)之所有像素量化為該最高灰階值,及將該特定n×m區塊中值大於(t*-midWidth)但小於(t*+midWidth)之所有像素量化為一中間灰階值。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US15790409P | 2009-03-06 | 2009-03-06 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201104586A TW201104586A (en) | 2011-02-01 |
| TWI463415B true TWI463415B (zh) | 2014-12-01 |
Family
ID=42237209
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW099106501A TWI463415B (zh) | 2009-03-06 | 2010-03-05 | 以物件為基礎之光學字元辨識之預處理演算法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US8457423B2 (zh) |
| CN (1) | CN102422308B (zh) |
| TW (1) | TWI463415B (zh) |
| WO (1) | WO2010102289A1 (zh) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8485430B2 (en) | 2011-12-06 | 2013-07-16 | Honeywell International, Inc. | Hand held bar code readers or mobile computers with cloud computing services |
| US9558386B2 (en) | 2012-05-15 | 2017-01-31 | Honeywell International, Inc. | Encoded information reading terminal configured to pre-process images |
| US9064254B2 (en) | 2012-05-17 | 2015-06-23 | Honeywell International Inc. | Cloud-based system for reading of decodable indicia |
| US9092683B2 (en) | 2012-07-10 | 2015-07-28 | Honeywell International Inc. | Cloud-based system for processing of decodable indicia |
| US9311549B2 (en) * | 2012-08-17 | 2016-04-12 | Evernote Corporation | Using surfaces with printed patterns for identification of imaging and data processing activities |
| RU2634195C1 (ru) * | 2016-12-06 | 2017-10-24 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) |
| US10542255B2 (en) * | 2017-09-28 | 2020-01-21 | Google Llc | Image processing for compression |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5333212A (en) * | 1991-03-04 | 1994-07-26 | Storm Technology | Image compression technique with regionally selective compression ratio |
| TW548572B (en) * | 1998-06-30 | 2003-08-21 | Sony Corp | Image processing apparatus, image processing method and storage medium |
| TW565803B (en) * | 1999-02-26 | 2003-12-11 | Hewlett Packard Co | System and method for accurately recognizing text font in a document processing system |
| TW200627047A (en) * | 2005-01-26 | 2006-08-01 | Omnivision Tech Inc | Automatic focus for image sensors |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3275010B2 (ja) | 1995-02-03 | 2002-04-15 | ザ・リジェンツ・オブ・ザ・ユニバーシティ・オブ・コロラド | 拡大された被写界深度を有する光学システム |
| US6389162B2 (en) * | 1996-02-15 | 2002-05-14 | Canon Kabushiki Kaisha | Image processing apparatus and method and medium |
| US6351566B1 (en) * | 2000-03-02 | 2002-02-26 | International Business Machines | Method for image binarization |
| US6678423B1 (en) * | 2000-03-13 | 2004-01-13 | International Business Machines Corporation | Shift and/or merge of transformed data along two axes |
| JP2005269379A (ja) * | 2004-03-19 | 2005-09-29 | Ricoh Co Ltd | 画像処理システム、画像処理方法、および画像処理プログラム |
| US7551773B2 (en) * | 2004-08-05 | 2009-06-23 | Hewlett-Packard Development Company, L.P. | Encoding image data using mask lookup table and decoding such encoded image data |
| US8208729B2 (en) * | 2006-03-30 | 2012-06-26 | Loquitur, Inc. | Capturing and presenting text using video image capture for optical character recognition |
| JP2007304864A (ja) * | 2006-05-11 | 2007-11-22 | Fuji Xerox Co Ltd | 文字認識処理システムおよび文字認識処理プログラム |
| US7532767B2 (en) * | 2006-05-31 | 2009-05-12 | Xerox Corporation | Removing ringing and blocking artifacts from JPEG compressed document images |
| US8155444B2 (en) * | 2007-01-15 | 2012-04-10 | Microsoft Corporation | Image text to character information conversion |
-
2010
- 2010-03-05 TW TW099106501A patent/TWI463415B/zh active
- 2010-03-08 WO PCT/US2010/026535 patent/WO2010102289A1/en not_active Ceased
- 2010-03-08 CN CN201080019810.1A patent/CN102422308B/zh active Active
-
2011
- 2011-09-06 US US13/226,155 patent/US8457423B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5333212A (en) * | 1991-03-04 | 1994-07-26 | Storm Technology | Image compression technique with regionally selective compression ratio |
| TW548572B (en) * | 1998-06-30 | 2003-08-21 | Sony Corp | Image processing apparatus, image processing method and storage medium |
| TW565803B (en) * | 1999-02-26 | 2003-12-11 | Hewlett Packard Co | System and method for accurately recognizing text font in a document processing system |
| TW200627047A (en) * | 2005-01-26 | 2006-08-01 | Omnivision Tech Inc | Automatic focus for image sensors |
Also Published As
| Publication number | Publication date |
|---|---|
| CN102422308B (zh) | 2015-03-25 |
| TW201104586A (en) | 2011-02-01 |
| CN102422308A (zh) | 2012-04-18 |
| US20120063690A1 (en) | 2012-03-15 |
| WO2010102289A1 (en) | 2010-09-10 |
| US8457423B2 (en) | 2013-06-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI463415B (zh) | 以物件為基礎之光學字元辨識之預處理演算法 | |
| US11062176B2 (en) | Object detection and image cropping using a multi-detector approach | |
| CN110060309B (zh) | 用于符号读取的局部色调映射 | |
| US8335402B1 (en) | Method and system for detecting and recognizing text in images | |
| US7242816B2 (en) | Group average filter algorithm for digital image processing | |
| US9396377B2 (en) | Barcode recognition using data-driven classifier | |
| KR100945809B1 (ko) | 이미지의 이진화 | |
| US11295417B2 (en) | Enhancing the legibility of images using monochromatic light sources | |
| US8594446B2 (en) | Method for enhancing a digitized document | |
| JP5555672B2 (ja) | 画像処理装置 | |
| Tsai et al. | Digital forensics of microscopic images for printed source identification | |
| JP3906221B2 (ja) | 画像処理方法及び画像処理装置 | |
| EP1339020A1 (en) | Entropy filter, and area extracting method using the filter | |
| Konya et al. | Adaptive methods for robust document image understanding | |
| CN107911609A (zh) | 图像处理方法、装置、计算机可读存储介质和电子设备 | |
| CN108596874B (zh) | 图像清晰判定方法、装置,以及计算机设备、产品 | |
| Kim et al. | Blur patch classification approach to single-image depth estimation | |
| Sun et al. | Automatic region of interest extraction in underwater plankton darkfield images | |
| JP3759349B2 (ja) | 画像解析装置と画像解析方法 | |
| EP2811733B1 (en) | Method for dynamic background reduction | |
| Eldem et al. | Dynamic Calculation and Characterization of Threshold Value in Optical Character Recognition | |
| Eid et al. | On the analysis of wavelet-based approaches for print mottle artifacts | |
| Rajashekar et al. | Performance evaluation of mail-scanning cameras |