新機器視覺 - 一文讀懂什麼是卡爾曼濾波－鑽石舞台

點擊下方卡片，關注「新機器視覺」公眾號

重磅乾貨，第一時間送達

導文

卡爾曼濾波是無人駕駛中最基本的算法之一，在傳感器融合與定位中幾乎無處不在，本文原文來自 BZARG 大神的文章《How a Kalman filter works, in pictures》，後 engineerlixl 大神進行了翻譯。由於寫得太好了，沒經過作者同意後和大家一起分享。

什麼是卡爾曼濾波？

卡爾曼濾波（Kalman filtering）一種利用線性系統狀態方程，通過系統輸入輸出觀測數據，對系統狀態進行最優估計的算法。由於觀測數據中包括系統中的噪聲和干擾的影響，所以最優估計也可看作是濾波過程。

數據濾波是去除噪聲還原真實數據的一種數據處理技術，Kalman濾波在測量方差已知的情況下能夠從一系列存在測量噪聲的數據中，估計動態系統的狀態。由於，它便於計算機編程實現, 並能夠對現場採集的數據進行實時的更新和處理，Kalman濾波是目前應用最為廣泛的濾波方法, 在通信, 導航, 制導與控制等多領域得到了較好的應用。

它具有占用內存小的優點（除了前一個狀態量外，不需要保留其它歷史數據），並且速度很快，很適合應用於實時問題和嵌入式系統。

我們能用卡爾曼濾波做什麼？

用玩具舉例：你開發了一個可以在樹林裡到處跑的小機器人，這個機器人需要知道它所在的確切位置才能導航。

我們可以說機器人有一個狀態 Xk ，表示位置和速度：

注意這個狀態只是關於這個系統基本屬性的一堆數字，它可以是任何其它的東西。在這個例子中是位置和速度，它也可以是一個容器中液體的總量，汽車發動機的溫度，用戶手指在觸摸板上的位置坐標，或者任何你需要跟蹤的信號。

這個機器人帶有GPS，精度大約為10米，還算不錯，但是，它需要將自己的位置精確到10米以內。樹林裡有很多溝壑和懸崖，如果機器人走錯了一步，就有可能掉下懸崖，所以只有GPS是不夠的。

　　或許我們知道一些機器人如何運動的信息：例如，機器人知道發送給電機的指令，知道自己是否在朝一個方向移動並且沒有人干預，在下一個狀態，機器人很可能朝着相同的方向移動。當然，機器人對自己的運動是一無所知的：它可能受到風吹的影響，輪子方向偏了一點，或者遇到不平的地面而翻倒。所以，輪子轉過的長度並不能精確表示機器人實際行走的距離，預測也不是很完美。

GPS 傳感器告訴了我們一些狀態信息，我們的預測告訴了我們機器人會怎樣運動，但都只是間接的，並且伴隨着一些不確定和不準確性。但是，如果使用所有對我們可用的信息，我們能得到一個比任何依據自身估計更好的結果嗎？回答當然是YES，這就是卡爾曼濾波的用處。

卡爾曼濾波是如何看到你的問題的

下面我們繼續以只有位置和速度這兩個狀態的簡單例子做解釋。

我們並不知道實際的位置和速度，它們之間有很多種可能正確的組合，但其中一些的可能性要大於其它部分：

卡爾曼濾波假設兩個變量（位置和速度，在這個例子中）都是隨機的，並且服從高斯分布。每個變量都有一個均值 μ，表示隨機分布的中心（最可能的狀態），以及方差 σ^2 ，表示不確定性。

在上圖中，位置和速度是不相關的，這意味着由其中一個變量的狀態無法推測出另一個變量可能的值。下面的例子更有趣：位置和速度是相關的，觀測特定位置的可能性取決於當前的速度:

這種情況是有可能發生的，例如，我們基於舊的位置來估計新位置。如果速度過高，我們可能已經移動很遠了。如果緩慢移動，則距離不會很遠。跟蹤這種關係是非常重要的，因為它帶給我們更多的信息：其中一個測量值告訴了我們其它變量可能的值，這就是卡爾曼濾波的目的，儘可能地在包含不確定性的測量數據中提取更多信息！

這種相關性用協方差矩陣來表示，簡而言之，矩陣中的每個元素 ∑ij 表示第 i 個和第 j 個狀態變量之間的相關度。（你可能已經猜到協方差矩陣是一個對稱矩陣，這意味着可以任意交換 i 和 j）。協方差矩陣通常用「∑」來表示，其中的元素則表示為「∑ij」。

使用矩陣來描述問題

我們基於高斯分布來建立狀態變量，所以在時刻 k 需要兩個信息：最佳估計 Xk（即均值，其它地方常用 μ 表示），以及協方差矩陣 Pk 。

我們需要根據當前狀態（k-1 時刻）來預測下一狀態（k 時刻）。記住，我們並不知道對下一狀態的所有預測中哪個是「真實」的，但我們的預測函數並不在乎。它對所有的可能性進行預測，並給出新的高斯分布。

我們可以用矩陣 Fk 來表示這個預測過程：

它將我們原始估計中的每個點都移動到了一個新的預測位置，如果原始估計是正確的話，這個新的預測位置就是系統下一步會移動到的位置。那我們又如何用矩陣來預測下一個時刻的位置和速度呢？下面用一個基本的運動學公式來表示：

現在，我們有了一個預測矩陣來表示下一時刻的狀態，但是，我們仍然不知道怎麼更新協方差矩陣。此時，我們需要引入另一個公式，如果我們將分布中的每個點都乘以矩陣 A，那麼它的協方差矩陣 ∑ 會怎樣變化呢？很簡單，下面給出公式：

結合方程（3）和（4）得到：

外部控制量

我們並沒有捕捉到一切信息，可能存在外部因素會對系統進行控制，帶來一些與系統自身狀態沒有相關性的改變。

以火車的運動狀態模型為例，火車司機可能會操縱油門，讓火車加速。相同地，在我們機器人這個例子中，導航軟件可能會發出一個指令讓輪子轉向或者停止。如果知道這些額外的信息，我們可以用一個向量 Uk 來表示，將它加到我們的預測方程中做修正。

假設由於油門的設置或控制命令，我們知道了期望的加速度a，根據基本的運動學方程可以得到：

Bk 稱為控制矩陣，Uk 稱為控制向量（對於沒有外部控制的簡單系統來說，這部分可以忽略）。讓我們再思考一下，如果我們的預測並不是100%準確的，該怎麼辦呢？

外部干擾

如果這些狀態量是基於系統自身的屬性或者已知的外部控制作用來變化的，則不會出現什麼問題。但是，如果存在未知的干擾呢？例如，假設我們跟蹤一個四旋翼飛行器，它可能會受到風的干擾，如果我們跟蹤一個輪式機器人，輪子可能會打滑，或者路面上的小坡會讓它減速。這樣的話我們就不能繼續對這些狀態進行跟蹤，如果沒有把這些外部干擾考慮在內，我們的預測就會出現偏差。

在每次預測之後，我們可以添加一些新的不確定性來建立這種與「外界」（即我們沒有跟蹤的干擾）之間的不確定性模型：