人類似乎着迷於讓機器玩遊戲,早在 1770 年就有發明家發明了國際象棋遊戲機,名為「土耳其機器人」,他們聲稱這台機器可以擊敗任何一名遊戲玩家(其實這是一個人工智能騙局);1997 年 IBM 的超級計算機深藍在比賽中擊敗卡斯巴羅夫,成為第一個在標準比賽時限內擊敗國際象棋世界冠軍的電腦系統;之後由 DeepMind 哈薩比斯領銜的團隊開發了 AlphaGo,這是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的智能體。為什麼眾多研究者對生物體的信息傳輸和感知方式感興趣?坦率地講,這是因為生物體優於當今的計算技術,今天的計算技術似乎正在迅速達到極限。商品傳感器產生的數據太多,計算機無法理解,這些計算機在試圖理解它們時消耗了太多的能量。然而在生物界,不起眼的蚊子,它的大腦僅由大約 200000 個神經元組成,但它的飛行控制和避障能力卻遠遠優於人類構造的任何東西;在能耗方面,蜜蜂的大腦有 100 萬個神經元,功耗卻只有 0.1mW;人類大腦只需消耗約 20 W 的能量就能夠滿足日常工作,行動等。但對於機器來說,以 GPT-3 為例,單次訓練的能耗就相當於 126 個丹麥家庭一年的能源消耗。這就是生物智能,與傳統人工智能之間一個很大的差別。截止目前,哪怕是最先進的超級計算機,其複雜程度也無法與大腦媲美。計算機是線性的,主要依靠高速中樞,在中央處理器和存儲芯片之間實現數據的傳輸。相比之下,大腦則處於全方位的互聯狀態,其密度和多樣性均是現代計算機的數十億倍。近年來,計算機微型化使得傳統計算性能得到大幅提升,但存儲器與中央處理器之間數據的傳輸會消耗大量能源,產生多餘熱量,這一瓶頸限制了計算機的進一步改進。近年來,受大腦神經系統的啟發,神經形態計算成為人工智能領域的一個重要研究方向,近日,來自澳大利亞西悉尼大學國際神經形態系統中心(ICNS)的研究者構造了一個神經形態機器人來玩桌上足球。首先 ICNS 構建了一個可以玩彈球機(pinball)的小型機器人 demo,該機器人可以將三個小球保持在桌子上,演示效果與人類玩家大致相同。令人驚訝的是,與常見的深度學習系統中有數十萬或數百萬個人工神經元不同,這種微小的神經形態僅使用兩個人工神經元就可以解釋和作用於基於事件的成像器的輸入。
在彈球遊戲上取得了不錯的效果之後,該團隊認為需要一項更複雜和要求更高的任務來進一步推動神經形態研究,因此將目光轉向了桌上足球。桌上足球所有動作都發生在二維空間中,只需要八個電機來控制桌子上的小人物即可,但這實現起來比想象的要困難得多。多年來,人們曾多次嘗試構建機器人桌上足球,都取得了不同程度的成功,但都沒有使用神經形態傳感器。一般來講,使用神經形態傳感器跟蹤球很容易,然而,桌上足球是一種更具動態性的遊戲,尤其是當涉及人類玩家時,每個人都有不同的策略,他們的動作並不總是合乎邏輯或者必要的。有些研究者嘗試使用非神經形態解決方案(例如深度學習)來玩桌上足球,然而深度學習神經網絡的處理方式(通常在 GPU 上)不太適合此類任務,因為 GPU 不是一次只處理一幀,而是處理批量圖像。在桌上足球中,玩家不關心球過去在哪裡,甚至都不關心球現在在哪裡;他們真正關心的是球接下來會在哪裡。其次,研究者發現深度學習方法對問題的微小變化極為敏感,攝像頭的輕微晃動、球員向不同方向拉動時球檯的輕微傾斜,甚至照明條件的變化都會導致深度學習球跟蹤器的性能崩潰。ICNS 的研究着眼於更簡單、更快的神經形態網絡,這些算法處理來自相機的每個事件(在神經形態計算中也稱為脈衝),並使用它們來更新球位置估計。該神經形態網絡沒有使用大量的神經元層,而是使用 16 個小型模式識別網絡,每個網絡 18 x 18 像素,因此在遊戲中的任何時候都只需考慮 364 個像素,這使得該網絡非常快速且很準確。速度是至關重要的,因為事件驅動算法需要跟上相機產生的時間敏感數據,每個事件只需要一些小而簡單的計算。雖然這個系統不會對經驗豐富的球員構成太大的威脅,但該網絡跟蹤已經可以阻擋對方的球,而進球得分仍是一項正在進行的工作。
原則上,深度學習可以執行類似的操作,但它需要查看整個圖像,並對網絡的每一層執行更多數量級的計算。這不僅比該系統使用的數據多得多,而且還有效地將事件驅動(event-driven)的輸出轉換回幀。
目前,ICNS 的算法基於記錄的事件數據離線訓練,使用了一種遺傳最優解算法,既可以學習球的外觀,也可以很好地估計它接下來的位置。該算法學習如何從數據本身中識別球,而不是通過任何編碼。此外,算法還從球的實際移動方式中學習,而不是基於對球的移動預期,這一點很關鍵。下一步,ICNS 將把基於離線訓練的學習遷移到實時在線學習,讓網絡在遊戲進行中不斷學習和適應。這或許有助於系統對其訓練所在的特定桌子的靈敏度。這種事件驅動算法是使用脈衝神經形態硬件(neuromorphic hardware)工作的算法的中間步驟。目前已有一些受大腦啟發的處理器,包括英特爾的類腦芯片 Loihi、世界首家神經形態處理器商業生產商 BrainChip 的 Akida,它們將信息編碼為脈衝序列,並與基於事件的傳感器自然契合。一旦有了穩定的脈衝算法,神經形態計算就將取得更多進展。最後,ICNS 團隊表示,在設計機器人玩桌上足球時,他們專注於降低成本並開源整個項目。原文鏈接:https://spectrum.ieee.org/robotic-foosball-table
©THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報道:content@jiqizhixin.com