:::
第 096 期【2018-08-15】
【師生研究】

結合 AI 概念,資工系學生專題再推出語音導引及圖形辨識應用

資工系學生專題利用樹莓派設計一個「進階雲端智能物品圖像辨識系統」,結合相機模組與喇叭,以語音導引方式,將架設在定點的相機模組,以紅外線人體感測器啟動,拍下要辨識的物品,再透過無線網路,將該物品圖像上傳到Google Cloud Vision API辨識資料庫,再將回傳的物品辨識結果,進行英漢翻譯及發音,即能聽取並了解物品圖像資訊。讓家中兒童能在無家長陪同情況下,即可反覆練習,大幅提升自我學習成效,其記憶也將更加深刻。

資工專題


學生發想概念來自現今網路、教學素材普及化,使用者越來越多,但便利性卻不足。因為即便傳統圖卡上有圖卡說明,但不見得每位兒童都能輕鬆辨識,例如:家中的傳統圖卡無法自動發出聲音告知你它是什麼。這類圖卡都須家長陪同教學,才有辦法知道它是什麼、怎麼念,但家長不是隨時都有時間,在兒童需要解惑時,通常無法得到學習上的幫助,不但無便利性,也無法更有效的學習。

這個系統運作流程,先利用樹莓派攝影機(Raspberry Pi Camera)做為系統的取像裝置,取得物體影像,而後傳遞影像置雲端,以Google Vision API進行物體影像辨識,若辨識成功,則將辨識結果文字傳回樹莓派,再進行文字語言轉換,然後進行文字轉標的語音,而後以樹莓派進行語音撥放,由藍牙喇叭輸出語音。若物體影像辨識失敗,則將其此物體影像之特徵及人為辨識之正確結果,存入訓練影像之特徵資料庫中,在訓練階段取得由亂數隨機選出且不重複的影像樣本,再透過一連串的演算法計算其特徵向量(Feature Vector),接著將此特徵採用支持向量機來計算出其決策函數(Decision Function)

在比對辨識時,經由前處理分割出影像中數個目標區塊影像,之後如同訓練階段的處理,直到取得特徵向量後,將此特徵向量以訓練階段所得到的特徵模組(決策函數)進行物體種類的預測(Predict),即可得到辨識結果。若辨識結果不正確,也可以透過簡單的方式將辨識錯誤的物體影像視為訓練樣本加入到特徵資料庫中並重新計算決策函數。
cron web_use_log