我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
Facebook 推出了一個(gè)名為 SoundSpaces 的新的開(kāi)源工具,專(zhuān)為所謂的 "嵌入式 AI "而設計。該工具旨在通過(guò)允許機器人分析環(huán)境聲音,幫助他們更有效地找到自己的方向。
音頻對導航很有用。例如,如果用戶(hù)要求假想的機器人家庭助理取回正在響鈴的智能手機,則將聲音追蹤到其來(lái)源可能比目視檢查設備可能位于的每個(gè)房間要快得多。
SoundSpaces 是一個(gè)主要基于 3D 環(huán)境聲學(xué)模擬的音頻渲染信息集。該信息集設計用于 Facebook 的開(kāi)放供應模擬平臺 AI Habitat,它提供了一個(gè)軟件程序傳感器,使其可以在掃描的真實(shí)世界環(huán)境中插入聲源的模擬。
SoundSpaces 提供了一系列音頻文件,AI 開(kāi)發(fā)者可以用這些文件在模擬中訓練聲音感知的 AI 模型。Facebook 方面表示,這些音頻文件不是簡(jiǎn)單的錄音,而是 "幾何聲學(xué)模擬"。這些模擬包括關(guān)于波浪如何從墻壁等表面反射的信息、它們如何與不同的材料相互作用、以及一些其他數據,開(kāi)發(fā)人員可以使用這些數據來(lái)創(chuàng )建聽(tīng)起來(lái)很真實(shí)的模擬,以訓練 AI 模型。
Facebook 研究科學(xué)家 Kristen Grauman 和 Dhruv Batra 在博客中寫(xiě)道,"據我們所知,這是第一次嘗試訓練既能看到又能聽(tīng)到的深度強化學(xué)習代理,以映射新環(huán)境并定位發(fā)聲目標。通過(guò)這種方法,我們在導航方面實(shí)現了比使用單模態(tài)同行更快的訓練和更高的準確性。"
此外,Facebook 方面還表示,他們已經(jīng)開(kāi)源了一個(gè)名為“Semantic MapNet”的工具,開(kāi)發(fā)人員可以用來(lái)為模型提供某種空間內存以改善導航的軟件模塊。
?。?a href="http://www.cki5.com/website/">邯鄲網(wǎng)站制作)
小米應用商店發(fā)布消息稱(chēng) 持續開(kāi)展“APP 侵害用戶(hù)權益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線(xiàn) 加速數字技術(shù)在實(shí)體經(jīng)濟中的落地和應用 11:34:49
樂(lè )視回應還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車(chē)擴展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區分公司 09:53:13