:::
結合 AI 概念,資工系學生專題再推出語音導引及圖形辨識應用
第 096 期【2018-08-15】
【師生研究】
結合 AI 概念,資工系學生專題再推出語音導引及圖形辨識應用
資工系學生專題利用樹莓派設計一個「進階雲端智能物品圖像辨識系統」,結合相機模組與喇叭,以語音導引方式,將架設在定點的相機模組,以紅外線人體感測器啟動,拍下要辨識的物品,再透過無線網路,將該物品圖像上傳到Google Cloud Vision API辨識資料庫,再將回傳的物品辨識結果,進行英漢翻譯及發音,即能聽取並了解物品圖像資訊。讓家中兒童能在無家長陪同情況下,即可反覆練習,大幅提升自我學習成效,其記憶也將更加深刻。
學生發想概念來自現今網路、教學素材普及化,使用者越來越多,但便利性卻不足。因為即便傳統圖卡上有圖卡說明,但不見得每位兒童都能輕鬆辨識,例如:家中的傳統圖卡無法自動發出聲音告知你它是什麼。這類圖卡都須家長陪同教學,才有辦法知道它是什麼、怎麼念,但家長不是隨時都有時間,在兒童需要解惑時,通常無法得到學習上的幫助,不但無便利性,也無法更有效的學習。
這個系統運作流程,先利用樹莓派攝影機(Raspberry Pi Camera)做為系統的取像裝置,取得物體影像,而後傳遞影像置雲端,以Google Vision API進行物體影像辨識,若辨識成功,則將辨識結果文字傳回樹莓派,再進行文字語言轉換,然後進行文字轉標的語音,而後以樹莓派進行語音撥放,由藍牙喇叭輸出語音。若物體影像辨識失敗,則將其此物體影像之特徵及人為辨識之正確結果,存入訓練影像之特徵資料庫中,在訓練階段取得由亂數隨機選出且不重複的影像樣本,再透過一連串的演算法計算其特徵向量(Feature Vector),接著將此特徵採用支持向量機來計算出其決策函數(Decision Function)。