字級:
小字級
中字級
大字級

影像辨識在農業上的應用

資料來源:國立臺灣大學生物機電工程學系/鄭學鴻、葉冠廷、郭彥甫

前言

台灣近年來面臨少子化及人口老化,造成從事農業人口短缺與生產力不足等問題,加上經濟活動全球化,台灣的農產業需與世界各國進行競爭,然而台灣自然環境的諸多限制導致農業生產成本偏高以致難以和各國競爭。因此,為了提升台灣農產業的競爭力,與確保台灣糧食生產,運用新科技進行農產業改革勢在必行。

影像辨識是人工智慧(Artificial Intelligence,AI)下的一個分支。這項技術近幾年來在各領域都掀起了一股智慧化的風潮,例如特斯拉的自動駕駛系統就運用了大量影像辨識技術。而在農業上,有許多的工作可以透過影像辨識的技術來幫忙,例如:分析植株健康狀況、確認雞隻活力等,這類工作往往都是耗時耗力的。如果導入AI技術的輔助,便能很大程度的減少農民的勞力負擔。以下就近幾年來在農、林、漁、牧業上的影像辨識技術應用進行介紹。

番茄生病了怎麼辦? 談植株病害辨識

番茄在108年全台產量約十萬四千公噸,年產值三十八億八千萬台幣[1],是台灣重要的經濟作物之一。但在番茄種植產業中最害怕的除了天災以外便是病蟲害的侵襲了,在合適的氣溫、濕度下,病原菌可以在幾天內快速傳播、感染數公頃的田地,進而造成大量的農業損失。因此,快速的辨識出番茄植株染病類型,並對症下藥是十分重要的。

以往疾病辨識仰賴植病專家或是有經驗的農民進行判斷,但在病害大爆發時會造成十分龐大的人力負擔,因此利用影像辨識與深度學習(Deep Learning)技術,使用一卷積神經網路(Convolutional Neural Network,CNN [2])模型:Navigator-Teacher-Scrutinizer Network[3],學習各種番茄病害的特徵。在良好的訓練後,此模型即可幫助農民進行番茄植株疾病辨識,並且搭配即時通訊軟體或是智慧手機APP,得以讓農民隨時隨地診斷植株疾病種類與推薦用藥等資訊,以求能用最快速度對症下藥並降低農損(如圖一)。

 class='img_caption'圖一

年輪不只可以知道年紀還能知道身分! 談樹種辨識

因特殊的地理、氣候環境,台灣具有十分豐富的林相,並擁有極高經濟價值。在台灣山林及高經濟價值的吸引下,盜採事件層出不窮,對台灣珍貴的山林實為一大傷害,因此自1990年代起政府開始實施禁伐,保護台灣山林。但仍有不肖業者利用一般民眾及裁定機構如海關等無法正確辨認樹種的機會,將具有經濟價值之樹種流入黑市,藉此獲利。

傳統鑑定樹種方式為專業人員使用樹種橫切片後以番紅試劑染色並使用電子顯微鏡觀察,此方法可信但卻耗時、效率低且辨識工具一般民眾難以取得。因此若能夠使用影像辨識技術來輔助前線執法人員進行樹種辨識,勢必能大幅降低樹種辨識專業人員在觀察樹種橫切片的人力需求。使用卷積神經網路模型:MobileNet[4],在良好的訓練後,模型可以自動抓取木材橫切面影像中各樹種間獨一無二的特徵,例如維管束排列方式、維管束大小等作為辨識樹種的依據(圖二)。尤其透過模型的輕量化,每一張樹種橫切面影像能在1秒內得出辨識結果,大大提高辨識效率。

 class='img_caption'圖二

三秒知道你抓的是甚麼魚!! 談魚種辨識

魚是海洋中重要資源,但因過去各國未節制之捕撈以及氣候變遷,這項重要資源正面臨耗盡匱乏的問題。因此為了永續漁業資源,各國皆對於漁獲管理有嚴格的規定,其中魚種、魚體長是漁獲管理中重要的兩項參考依據。傳統的魚種、魚體長以駐船觀察員人工進行測量進行,在漁船、港口作業不便之外,也有耗時且人力短缺等問題。近年運用影像辨識與AI等技術開發電子觀察員系統,希望可以提供更加便捷、客觀、省人力之測量記錄方法。

電子觀察員可以利用卷積神經網路,自動偵測漁獲管理現場影片中的每一幀影像的魚體位置,並且將偵測出的魚體進行即時的種類辨識以及魚體長計算並記錄成漁獲資料統計表,希望藉由此種方法可以解決駐船觀察員人力不足的問題,以及確保漁獲資源記錄的客觀性(如圖三)。

 class='img_caption'圖三

小雞健康嗎? 談雞隻追蹤

雞肉在華人的飲食上佔有重要的地位,根據行政院農委會農業統計年報的資料顯示2018年雞肉產品年產值約438億元,占畜牧業總產值近26%[1]。臺灣在地的養雞業者多以人工巡視的方式進行雞隻監測,對於雞隻數量龐大的商業雞舍而言,此方式耗時耗力且仰賴飼主經驗。特別是在雞隻的疾病管理上,常因誤判雞隻的活動力而錯失最佳投藥時機,導致業者的利益損失。因此,透過影像辨識等技術協助業者進行雞隻活動力監測,便能有效減少損失。

透過在雞舍棚頂搭設攝影機並配合在物件偵測上有優異表現的模型:更快速區域生成卷積神經網路(Faster R-CNN [5]),讓機器自動抓取影像中的雞隻位置以及判斷行為狀態(如圖四)。接著比較時刻影像間的雞隻位置便可以得到個別雞隻的活動路徑,透過分析雞隻的活動路徑與飲食狀況,如果有活動力低下或是異常的雞隻便能及時發現。

 class='img_caption'圖四

影像辨識技術

你眼中的我是怎樣? 談AI眼中的影像

機器借助影像擷取設備(相機、掃描器、攝錄影機等)的幫助,將真實世界中的色彩及光影轉換成可以儲存的影像資訊,才能看見這個世界。一張數位影像是由大量的像素(Pixel)所組成,例如一張尺寸為1920×1080的影像,即是在影像的寬邊上有1920個像素,在長邊有1080個像素,整張影像共有1920×1080這麼多的像素(如圖五)。彩色影像中的每一像素皆會記錄紅(Red)、綠(Green)、藍(Blue)三原色各別的成分值,其數值範圍為0-255,數值越小表示該顏色強度越小,反之則越大。我們所看到的顏色便是此三原色依照其數值混合的結果,例如:一像素是紅色255+綠色255+藍色0,那這像素顯示出來的顏色便是黃色。

影像在我們眼裡看起來七彩繽紛,然而,影像中有形有色的物體對於機器來說只是大量像素與其記載的Red-Green-Blue數值。機器只會忠誠地顯示出每個像素,並不知道影像中所隱含的意義。

 class='img_caption'圖五

大家來找碴? 談AI對傳統影像辨識的優勢

在了解影像對於機器來說只是由大量數字所組成的原始資訊後,那機器到底是如何”辨識”出影像中的物體呢?對於傳統影像辨識方法來說,我們需要利用人類辨識物體的經驗,例如:觀察輪廓、顏色、大小等物體特徵,並將這些經驗轉換成程式演算法(Algorithm,或稱規則),讓機器可以”被動地”依循我們設計的規則去讀懂這些由數字組成的影像(如圖六)。但也因為這些規則是固定且不靈活的,因此當傳統影像辨識遇到擁有較複雜背景、特殊光影的影像時,其辨識成功率會大大下降。

 class='img_caption'圖六

近年來大放異彩的深度學習方法,運用在影像辨識上有令人驚嘆的成果,成功克服傳統影像辨識所遇到的困難。與傳統影像辨識相比,深度學習方法運用多層的卷積層(Convolutional Layer)進行特徵抽取,能夠讓電腦如人類般”主動地”去學習影像中所含的各種特徵,抽取到影像中較細微的輪廓、顏色等特徵資訊。也因為這優勢使得深度學習方法可以順利在複雜背景中辨識出目標物,這也解決了傳統影像辨識在處理較複雜影像十分疲弱的問題。

以物件偵測模型Faster R-CNN為例,在深度神經網路中,先利用卷積神經網路直接對原始影像進行特徵抽取,之後利用區域候選網路(RPN [5])偵測出影像中目標物體的位置,最後利用全連接層以及歸一化指數(Softmax [6])函數進行目標物分類(如圖七)。在此方法下對於複雜背景影像的辨識結果,是在傳統影像處理以及影像辨識技術下難以達到的。也因此近年來在各領域,包括農業領域皆颳起了深度學習的風潮,許多以往傳統無法處理的問題皆能使用深度學習方法順利解決。在本文上半部所提到運用在各種農業領域的AI也是屬於深度學習這個分支的AI。

小結

在這國際化的社會中,來自世界各地的競爭十分激烈,能跟上世界的脈動將台灣農業轉型升級是十分重要的。近來AI大浪席捲全球各大領域,其中的影像辨識技術更是能解決許多在農業上耗時耗力問題的關鍵技術。本文簡單介紹了幾項影像辨識技術運用在現今農業領域的實例給各讀者認識,也希望台灣在通往智慧農業這條路上能順利,並在國際嶄露頭角。

參考資料

1. 農業統計資料查詢. https://agrstat.coa.gov.tw/sdweb/public/inquiry/InquireAdvance.aspx.

2. Krizhevsky, A., I. Sutskever, and G.E. Hinton. Imagenet classification with deep convolutional neural networks. in Advances in neural information processing systems. 2012.

3. Yang, Z., et al. Learning to navigate for fine-grained classification. in Proceedings of the European Conference on Computer Vision (ECCV). 2018.

4. Howard, A.G., et al., Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv preprint arXiv:1704.04861, 2017.

5. Ren, S., et al. Faster r-cnn: Towards real-time object detection with region proposal networks. in Advances in neural information processing systems. 2015.

6. Goodfellow, I., Y. Bengio, and A. Courville, Deep learning. 2016: MIT press.

TOP