基于高光譜圖像技術(shù)的隱形字快速識(shí)別研究
[導(dǎo)讀] 著名作家、詩(shī)人、評(píng)論家、政論家、學(xué)者高爾基曾利用牛奶在白紙上寫字,待白紙風(fēng)干后,字跡也隨之消失,從而達(dá)到隱形傳遞消息的目的。那怎樣恢復(fù)白紙上的字跡呢?根據(jù)史書記載,將白紙用火烤一下,字跡就會(huì)慢慢的變得清晰起來(lái),這是因?yàn)榕D讨泻械鞍踪|(zhì),而蛋白質(zhì)在60攝氏度左右變性,凝固,顯現(xiàn)出來(lái),而紙的燃點(diǎn)達(dá)到130度以上,因此用火烤一下可以使牛奶字跡清晰。但是用飽和鹽水、眼液、淀粉水在白紙上寫字,待白紙風(fēng)干后,字跡消失了,然而利用火烤的方法卻無(wú)法將白紙上的字跡識(shí)別出來(lái)。因此需要借助其他辦法來(lái)快速識(shí)別任何液體書寫的隱形字跡。
將牛奶、飽和鹽水、眼液分別在白色A4紙上寫上字,待溶液曬干后利用短波紅外相機(jī)(1000nm-2500nm)對(duì)其分別進(jìn)行測(cè)試,獲取其在短波紅外波段的高光譜圖像和光譜信息。SWIR短波紅外相機(jī)光譜分辨率為8-10nm,像素為384x288,波段數(shù)為288個(gè)。測(cè)試設(shè)備及SWIR短波紅外相機(jī)如圖1所示。
圖1 測(cè)試設(shè)備及SWIR短波紅外相機(jī)
對(duì)獲取的高光譜圖像數(shù)據(jù)進(jìn)行黑白幀校正得到圖像的光譜反射率數(shù)據(jù),同時(shí)對(duì)反射率數(shù)據(jù)進(jìn)行壞點(diǎn)(NAN)進(jìn)行修復(fù),剔除掉異常值,從而得到牛奶、飽和鹽水、眼液及背景(白紙)的光譜反射率數(shù)據(jù),如圖2所示。從圖2可知,干牛奶與未干牛奶,其在白紙上寫的字跡光譜反射率差異較大;當(dāng)牛奶曬干后,字跡的光譜反射率與白紙十分相似,變化規(guī)律也趨向一致,對(duì)光譜進(jìn)行放大分析可知,牛奶字跡的光譜反射率總體上高于白紙的光譜反射率。對(duì)于飽和鹽水字跡而言,干飽和鹽水字跡與未干飽和鹽水字跡在光譜反射率上差異較為明顯,特別是在水汽吸收帶1420 nm和1910 nm附近差異更為顯著;當(dāng)飽和鹽水曬干后,飽和鹽水字跡的光譜反射率與白紙的光譜反射率變化趨勢(shì)一致,但是白紙的光譜反射率高于飽和鹽水字跡的光譜反射率。運(yùn)用眼液在白紙上寫上字,待眼液曬干后,去牛奶字跡、鹽水字跡一樣,肉眼無(wú)法識(shí)別出是什么字,利用短波紅外相機(jī)測(cè)試其光譜反射率發(fā)現(xiàn),眼液曬干后,其字跡的光譜反射率與白紙的光譜反射率變化趨勢(shì)依然一致,但是眼液字跡的光譜反射率高于白紙的光譜反射率。
圖2 牛奶、飽和鹽水、眼液及背景(白紙)的光譜反射率
由于高光譜遙感數(shù)據(jù)波段多,波段間存在很大相關(guān)性,為了克服維數(shù)災(zāi)難,利用最小噪聲分離變換進(jìn)行波段選擇,達(dá)到優(yōu)化數(shù)據(jù),去除噪聲和數(shù)據(jù)降維的目的。
最小噪聲分離變換( MNF)是對(duì)主成分變換( PCA) 的一種改進(jìn)方法。PCA 是一種線性變換,變換后各主成分分量彼此之間互不相關(guān),隨著主成分的增加該分量包含的信息量減小,第一主成分包含的信息量最大,第二主成分與第一主成分無(wú)關(guān)且在剩余成分中包含的信息量最大,依此類推。但PCA對(duì)噪聲比較敏感,在變換后的主成分分量中,信息量大的信噪比不一定高,當(dāng)某個(gè)信息量大的主成分中包含的噪聲的方差大于信號(hào)的方差時(shí),該主成分分量形成的圖像質(zhì)量就差。針對(duì) PCA 變換的不足,Green 和 Berman 提出最小噪聲分離變換( MNF),它不但能判定圖像數(shù)據(jù)內(nèi)在的維數(shù)( 波段數(shù)) ,分離數(shù)據(jù)中的噪聲,而且能減少隨后處理中的計(jì)算需求量。MNF 變換是基于圖像質(zhì)量的線性變換,變換結(jié)果的成分按照信噪比從大到小排列。經(jīng)過(guò)MNF變換大部分噪聲集中在特征小的分量中。而不像 PCA變換按照方差由大到小排列,從而克服了噪聲對(duì)影像質(zhì)量的影響。
圖3列舉了牛奶隱形字原圖(手機(jī)拍攝)、MNF變換前5個(gè)成分。從圖中可知原圖看不到任何字跡模樣,但經(jīng)過(guò)MNF變換后,第1、2、3、4成分能較好地識(shí)別出隱形字跡,其中第2成分隱形字跡識(shí)別效果最佳。第1成分中隱形字較亮的部分是因?yàn)榕D躺形赐耆L(fēng)干,第2成分隱形字較亮、較暗的部分同樣是因?yàn)榕D躺形赐瓿娠L(fēng)干,導(dǎo)致MNF變換中其信息較為顯著,如圖2可知干牛奶區(qū)域和未干牛奶區(qū)域的光譜反射率曲線差異較為顯著。第3、4、5成分隱形字的灰度不完全一致,也是因?yàn)榕D涛赐耆L(fēng)干的原因。
圖3 牛奶隱形字原圖及MNF前5個(gè)成分
圖4列舉了飽和鹽水隱形字原圖(手機(jī)拍攝)、MNF變換前5個(gè)成分。從圖中可知原圖看不到字跡模樣,但經(jīng)過(guò)MNF變換后,第1、3成分能較好地識(shí)別出隱形字跡,其中第1成分隱形字跡識(shí)別效果最佳。第2、4、5以及往后的成分均無(wú)法識(shí)別出飽和鹽水的字跡。第1成分中隱形字較亮的部分和第3成分隱形字較暗部分是因?yàn)榕D躺形赐耆L(fēng)干的原因,從圖2可知干飽和鹽水區(qū)域和未飽和鹽水區(qū)域的光譜反射率曲線差異較為顯著。
圖4飽和鹽水隱形字原圖及MNF前5個(gè)成分
圖5列舉了眼液隱形字原圖(手機(jī)拍攝)、MNF變換前5個(gè)成分。從原圖中依然無(wú)法看到隱形字跡,但經(jīng)過(guò)MNF變換后,第1成分能較好地識(shí)別出隱形字跡,第2、3、4、5以及往后的成分均無(wú)法識(shí)別眼液書寫的字跡。
圖5眼液隱形字原圖及MNF前5個(gè)成分
針對(duì)高光譜數(shù)據(jù)信息量豐富,但數(shù)據(jù)冗余且包含噪聲的特點(diǎn),本文基于最小噪聲分離變換算法有效地對(duì)不同液體書寫的隱形字高光譜圖像進(jìn)行降維處理,分離了圖像中的有效信息和噪聲,減小了后期處理的數(shù)據(jù)量,提高了數(shù)據(jù)處理效率。通過(guò)對(duì)隱形字高光譜數(shù)據(jù)進(jìn)行最小噪聲分離變換,從而清晰地識(shí)別出了隱形字體,實(shí)驗(yàn)結(jié)果對(duì)于文物考古、刑偵領(lǐng)域識(shí)別隱形字跡提供了參考和借鑒。
地址:無(wú)錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關(guān)村大街19號(hào)
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號(hào)盛方科技園B座三層?xùn)|區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號(hào)四川國(guó)際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn