Seeing AI怎么使用?Seeing AI有哪些功能?微軟新推出的Seeing AI是什么?Seeing AI是專(zhuān)為有視覺(jué)障礙的伙伴而研發(fā)的,那么Seeing AI怎么使用呢?Seeing AI有哪些功能?想知道的伙伴跟著小編一起來(lái)看看吧!
Seeing AI怎么使用 Seeing AI有哪些功能
Seeing AI 支持人物、短文、文本、條形碼以及場(chǎng)景的識(shí)別,用戶只需要拿住 iPhone 設(shè)備在四周移動(dòng),應(yīng)用會(huì)通過(guò)神經(jīng)網(wǎng)絡(luò)技術(shù),將這些信息轉(zhuǎn)化為語(yǔ)音,讓用戶可以「聽(tīng)到」周?chē)沫h(huán)境情況,從而為視力缺陷者進(jìn)行服務(wù),Seeing AI 大大方便了視力障礙者的日常生活。
人物及周?chē)h(huán)境的掃描
對(duì)人物的識(shí)別是微軟利用圖像識(shí)別工具提供更深入的圖片解釋。識(shí)別人物之后,Seeing AI 不僅可以判斷此人的性別以及大概的年齡,甚至可以對(duì)此人的外貌以及面部表情進(jìn)行表述?纯聪聢D Seeing AI 對(duì)小哥的描述:一位滿頭黑發(fā)表情自然的男士,識(shí)別結(jié)果還是很準(zhǔn)確的。
此外,使用 Seeing AI 對(duì)周?chē)h(huán)境進(jìn)行掃描,還能了解到周?chē)卸嗌偃,這些人所在的位置以及與你的距離,當(dāng)然還可知道這些人的面部表情。Seeing AI 還有一個(gè)新奇之處,你可以教 Seeing AI 去識(shí)別某個(gè)特定的人物。進(jìn)入「臉部識(shí)別」功能,對(duì)某個(gè)人物的臉部進(jìn)行三次拍攝,并做相應(yīng)的姓名標(biāo)注即可完成該人物信息的錄入,當(dāng)你再次識(shí)別此人時(shí),Seeing AI 就會(huì)說(shuō)出他的名字。
短文內(nèi)容的自動(dòng)識(shí)別
短文識(shí)別功能簡(jiǎn)單來(lái)講就是哪里看不清拍哪里,這個(gè)功能結(jié)合了圖像識(shí)別技術(shù)與自然語(yǔ)言處理技術(shù),將文本信息轉(zhuǎn)化為語(yǔ)音信息。這一功能可以幫助視障人士獲得對(duì)圖像的準(zhǔn)確描述,還可能幫助那些需要圖像信息卻無(wú)法直接看到圖像的人——比如正在開(kāi)車(chē)的司機(jī)。
在測(cè)試的過(guò)程中小編發(fā)現(xiàn),在 Seeing AI 在「朗讀」文本的過(guò)程中,如果攝像頭捕捉到了更加清晰的文本圖像,那么 Seeing AI 會(huì)從頭開(kāi)始「翻譯」這段文本。經(jīng)過(guò)測(cè)試會(huì)發(fā)現(xiàn) Seeing AI 識(shí)別效果很好,在識(shí)別讀出內(nèi)容的過(guò)程中幾乎沒(méi)有錯(cuò)誤。但在語(yǔ)言系統(tǒng)方面有些遺憾,應(yīng)用目前只可以識(shí)別英文和阿拉伯?dāng)?shù)字,并不支持中文及其他語(yǔ)言的識(shí)別。
文件和條形碼的探測(cè)
文件識(shí)別的操作相對(duì)復(fù)雜一些,將攝像頭對(duì)準(zhǔn)文本,Seeing AI 會(huì)引導(dǎo)你的手機(jī)放置,直到所選取的文本周?chē)霈F(xiàn)邊緣,聽(tīng)到「Hold steady」的聲音,然后拍攝進(jìn)行文本識(shí)別。在文本識(shí)別之后,還可以使用 VoiceOver 功能對(duì)文本進(jìn)行操作。
將手機(jī)攝像頭對(duì)準(zhǔn)條形碼則可以對(duì)其進(jìn)行識(shí)別,在掃碼的一瞬間會(huì)聽(tīng)到嗶嗶的聲音,條形碼檢測(cè)成功后,Seeing AI 會(huì)說(shuō)出產(chǎn)品的名稱。如果你想了解更多有關(guān)產(chǎn)品的信息,則可選擇點(diǎn)擊右下角的按鈕進(jìn)行詳細(xì)的了解。
復(fù)雜場(chǎng)景的描述
場(chǎng)景的識(shí)別是讓計(jì)算機(jī)用更加人性化的方式去描述圖像,Seeing AI 會(huì)對(duì)識(shí)別的場(chǎng)景進(jìn)行詳細(xì)的描述。比如下圖,Seeing AI 不僅會(huì)告訴你這是一臺(tái)筆記本電腦,它還會(huì)告訴你這臺(tái)電腦是以打開(kāi)的狀態(tài)放置在桌上這樣詳細(xì)的描述。不過(guò)場(chǎng)景識(shí)別的功能目前還處于測(cè)試階段,所以場(chǎng)景識(shí)別的結(jié)果并不總是正確的,相信微軟之后會(huì)完善這個(gè)功能。
小結(jié)
Seeing AI 實(shí)現(xiàn)了「語(yǔ)音世界的魔法」,利用手機(jī)攝像頭將文字、人物、商品、場(chǎng)景等信息轉(zhuǎn)化為語(yǔ)音,讓更多的弱視群體盡可能的「獨(dú)立」,有助于為視障人士營(yíng)造更公平的環(huán)境,與正常生活縮小差距。Seeing AI 的出現(xiàn)會(huì)在一定程度上讓更多的人利用人工智能技術(shù)來(lái)造福人類(lèi)。
Seeing AI 的部分應(yīng)用可在離線狀態(tài)下使用,但是在語(yǔ)音方面暫時(shí)只支持英文系統(tǒng),對(duì)該應(yīng)用感興趣的小伙伴可以前去美區(qū) App Store 下載體驗(yàn)。