視覺SLAM十四講第五講

阿新 • • 發佈：2020-10-15

第五章相機與影象

主要目標

理解針孔相機的模型、內參與徑向畸變引數。
理解一個空間點是如何投影到相機成像平面的。
掌握 OpenCV 的影象儲存與表達方式。
學會基本的攝像頭標定方法。
在計算機中，一張照片由很多個畫素組成，每個畫素記錄了色彩或亮度的資訊。三維世界中的一個物體反射或發出的光線，穿過相機光心後，投影在相機的成像平面上。相機的感光器件接收到光線後，產生測量值，就得到了畫素，形成了我們見到的照片。
一、相機模型
1）針孔相機模型

設 O-x-y-z 為相機座標系，習慣上我們讓z 軸指向相機前方，x 向右，y 向下（此圖我們應該站在左側看右側）。O 為攝像機的光心，也是針孔模型中的針孔。現實世界的空間點 P，經過小孔 O 投影之後，落在物理成像平面 O′ - x′ -y′ 上，成像點為 P′。設 P 的座標為 [X, Y, Z]T，P′ 為 [X′, Y ′, Z′]T，並且設物理成像平面到小孔的距離為f（焦距）。那麼，根據三角形相似關係，有：

其中負號表示成的像是倒立的。不過，實際相機得到的影象並不是倒像（否則相機的使用會非常不方便）。為了讓模型更符合實際，我們可以等價地把成像平面對稱地放到相機前方，和三維空間點一起放在攝像機座標系的同一側，這樣做可以把公式中的負號去掉，使式子更加簡潔：

把 X′, Y ′ 放到等式左側，整理得：

為了描述感測器將感受到的光線轉換成影象畫素的過程，我們設在物理成像平面上固定著一個畫素平面 o-u-v。我們在畫素平面得到了 P′ 的畫素座標：[u, v]T。
畫素座標系通常的定義方式是：原點 o′ 位於影象的左上角，u 軸向右與 x 軸平行，v 軸向下與 y 軸平行。畫素座標系與成像平面之間，相差了一個縮放和一個原點的平移。我們設畫素座標在u 軸上縮放了 α 倍，在 v 上縮放了 β 倍。同時，原點平移了 [cx, cy]T。那麼，P′ 的座標與畫素座標[u, v]T 的關係為：

把 αf 合併成 fx，把 βf 合併成 fy，得：

其中，f 的單位為米，α, β 的單位為畫素/米，所以 fx, fy 和 cx, cy 的單位為畫素。

我們把中間的量組成的矩陣稱為相機的內參數矩陣（Camera Intrinsics）K。通常認為，相機的內參在出廠之後是固定的，不會在使用過程中發生變化。
由於相機在運動，所以 P 的相機座標應該是它的世界座標（記為 Pw）根據相機的當前位姿變換到相機座標系下的結果。相機的位姿由它的旋轉矩陣 R 和平移向量 t 來描述。那麼有：

它描述了 P 的世界座標到畫素座標的投影關係。其中，相機的位姿 R, t 又稱為相機的外引數（Camera Extrinsics）。相比於不變的內參，外參會隨著相機運動發生改變，同時也是 SLAM 中待估計的目標，代表著機器人的軌跡。

我們可以把一個世界座標點先轉換到相機座標系，再除掉它最後一維的數值（即該點距離相機成像平面的深度），這相當於把最後一維進行歸一化處理，得到點 P 在相機歸一化平面上的投影：

歸一化座標可看成相機前方z = 1 處的平面上的一個點，這個 z = 1 平面也稱為歸一化平面。歸一化座標再左乘內參就得到了畫素座標，所以我們可以把畫素座標 [u, v]T 看成對歸一化平面上的點進行量化測量的結果。
2）畸變
由透鏡形狀引起的畸變（Distortion，也叫失真）稱為徑向畸變。它們主要分為兩大類：桶形畸變和枕形畸變。
除了透鏡的形狀會引入徑向畸變外，在相機的組裝過程中由於不能使透鏡和成像面嚴格平行也會引入切向畸變。
3）單目相機成像過程
1.首先，世界座標系下有一個固定的點 P，世界座標為 Pw。
2.由於相機在運動，它的運動由 R, t 或變換矩陣 T ∈ SE(3) 描述。P 的相機座標為 P˜c =RPw + t。
3.這時的 P˜c 的分量為 X, Y, Z，把它們投影到歸一化平面 Z = 1 上，得到 P 的歸一化座標：Pc = [X/Z, Y /Z, 1]T。
4.有畸變時，根據畸變引數計算 Pc 發生畸變後的座標。
5.最後，P 的歸一化座標經過內參後，對應到它的畫素座標：Puv = KPc。
4）雙目相機模型
通過同步採集左右相機的影象，計算影象間視差，來估計每一個畫素的深度。
雙目相機一般由左眼相機和右眼相機兩個水平放置的相機組成。它們是水平放置的，意味著兩個相機的光圈中心都位於 x 軸上。兩者之間的距離稱為雙目相機的基線（Baseline，記作 b），是雙目相機的重要引數。

現在，考慮一個空間點 P，它在左眼相機和右眼相機各成一像，記作 PL, PR。由於相機基線的存在，這兩個成像位置是不同的。理想情況下，由於左右相機只在 x 軸上有位移，因此 P 的像也只
在 x 軸（對應影象的 u 軸）上有差異。記它的左側座標為 uL，右側座標為 uR，根據 △P PLPR 和 △P OLOR 的相似關係，有：

稍加整理，得：

其中 d 定義為左右圖的橫座標之差，稱為視差（Disparity）。根據視差，我們可以估計一個畫素與相機之間的距離。視差與距離成反比：視差越大，距離越近。
5）RGB-D 相機模型
目前的 RGB-D 相機按原理可分為兩大類：
1.通過紅外結構光（Structured Light）來測量畫素距離的。例子有 Kinect 1 代、Project Tango 1代、Intel RealSense 等。
2 通過飛行時間法（Time-of-flight，ToF）原理測量畫素距離的。例子有 Kinect 2 代和一些現有的 ToF 感測器等。
RGB-D 相機能夠實時地測量每個畫素點的距離。但是，由於這種發射 − 接收的測量方式，其使用範圍比較受限。用紅外光進行深度值測量的 RGB-D 相機，容易受到日光或其他感測器發射的紅外光干擾，因此不能在室外使用。在沒有調製的情況下，同時使用多個 RGB-D 相機時也會相互干擾。對於透射材質的物體，因為接收不到反射光，所以無法測量這些點的位置。此外，RGB-D 相機在成本、功耗方面，都有一些劣勢。
二、影象
在一張灰度圖中，每個畫素位置 (x, y) 對應一個灰度值 I，所以，一張寬度為 w、高度為 h 的影象，數學上可以記為一個函式：

其中 (x, y) 是畫素的座標。然而，計算機並不能表達實數空間，所以我們需要對下標和影象讀數在某個範圍內進行量化。

三、實踐：計算機中的影象
1）OpenCV 的基礎使用方法
從 http://opencv.org/downloads.html 下載，選擇 OpenCV for Linux 版本即可。獲得壓縮包。將它解壓到任意目錄下，可以發現 OpenCV 亦是一個 cmake 工程。
安裝依賴項
sudo apt-get install build-essential libgtk2.0-dev libvtk5-dev libjpeg-dev libtiff4-dev libjasper-dev libopenexr-dev libtbb-dev
隨後的編譯安裝和普通的 cmake 工程一樣，請在 make 之後，呼叫 sudo make install 將 OpenCV安裝到你的機器上（而不是僅僅編譯它）。
參考：https://www.cnblogs.com/Shuqing-cxw/p/9195303.html

視覺SLAM十四講第五講

第五章相機與影象主要目標理解針孔相機的模型、內參與徑向畸變引數。理解一個空間點是如何投影到相機成像平面的。掌握 OpenCV 的影象儲存與表達方式。學會基本的攝像頭標定方法。在計算機中，一張照片由

視覺SLAM十四講第三講

第三章三維空間剛體運動主要目標理解三維空間的剛體運動描述方式：旋轉矩陣、變換矩陣、四元數和尤拉角。掌握 Eigen 庫的矩陣、幾何模組使用方法。一、旋轉矩陣剛體，它不光有位置，還有自身的姿態。

視覺SLAM十四講第八講

第 8 講視覺里程計 2 本節目標理解光流法跟蹤特徵點的原理。理解直接法是如何估計相機位姿的。使用 g2o 進行直接法的計算。一、直接法直接法擁有如下的缺點： 1.、關鍵點的提取與描述子的計算非常耗時。

《視覺SLAM十四講第9章設計前端》總結

第9章設計前端講解了如何設計一個前端，這裡自己也做個總結。 1、一個完整的工程專案的資料夾組織框架一般包含以下7個部分。 1）bin：用來存放二進位制檔案 2）include/slam：存放標頭檔案 3）src：存放原始碼 4）

【視覺slam十四講】第二版/第四講/useSophus.cpp程式碼執行時遇到的問題

技術標籤：視覺slam十四講c++ 環境：ubuntu18.04 提示錯誤：sophus/se3.hpp: 沒有那個檔案或目錄解決方法： 1.原來的Sophus庫可以成功執行第一版書中提供的程式碼； 2.懷疑是第一版書中Sophus庫版本問題，所以重

視覺SLAM第三方庫的安裝（ubuntu16.04環境，基於《視覺SLAM十四講》）

1、安裝Eigen sudo apt-get install libeigen3-dev 2、安裝Sophus Sophus 庫是 Strasdat 維護的一個較好的李代數庫，《視覺SLAM十四講》使用非模板的 Sophus 庫。可以輸入以下命令獲得非模板類的 Sophus:

《視覺SLAM十四講》詳細筆記

《視覺SLAM十四講》筆記摘抄 ch02 初識SLAM 經典視覺SLAM框架SLAM問題的數學表述ch03 三維空間剛體運動

視覺slam十四講—利用編譯好的orbslam2來執行自己的video（這裡是高翔博士作業給出的參考程式碼）

技術標籤：slam的學習利用編譯好的orbslam2來執行自己的video 一、首先在orbslam2的目錄下，也就是在build的同一級目錄上建立一個myvideo.cpp檔案，具體的程式碼如下：

SLAM十四講第二講

第二章初識 SLAM 1、相機分類相機可以分為單目相機（Monocular）、雙目相機（Stereo）和深度相機（RGB-D）三大類。 1）單目相機只使用一個攝像頭進行 SLAM 的做法稱為單目SLAM（Monocular SLAM）。這種感

ubuntu下slam十四講環境安裝

第0章，安裝c++與cmake，建立環境#安裝c++支援 sudo apt install build-essential #安裝cmake

視覺十四講：第八講_光流法(特徵點追蹤)

1.直接法的引出特徵點估計相機運動的方法，主要是在關鍵點和描述子的計算非常耗時；而且在紋理資訊比較少的情況下，特徵點的數量會明顯減少。

視覺十四講：第八講_直接法

1.直接法的推導：考慮某個空間點P和兩個時刻的相機，P的世界座標為[X,Y,Z],它在兩個相機上成像，記非齊次畫素座標為\\(p_{1},p_{2}\\)，目標是求第一個相機到第二個相機的相對位姿變換。

第十四講：Prometheus 企業級實際使⽤二

　　本講內容　　Prometheus+grafana TCP等待連結監控企業實際使⽤　　　　使⽤公式

視覺十四講:BA優化_g2o

1.投影模型和BA代價函式這個流程就是觀測方程之前抽象的記為：\\(z = h（x, y）\\)

【筆記】Linux就該這麼學-第十四課第十二（下）、十三章

NFS網路檔案系統 yuminstallnfs-utils 清空NFS伺服器上面iptables防火牆的預設策略 iptables-F

web十四講，CSS定位

CSS定位定位允許定義元素框相對於其正常位置或父元素、另一個元素甚至是瀏覽器本身來重新定義應該出現的位置。

《九日集訓》第十五輪 (第五講) 排序

知識點排序 int cmp(const void*p1, const void *p2) { // (1) int v1 = *(int *)p1;// (2) int v2 = *(int *)p2;// (3)

[學習報告]《九日集訓》第十五輪 (第四講) 指標

知識點指標 /** * Note: The returned array must be malloced, assume caller calls free().// (1) */ int *func(int *nums, int numsSize, int *returnSize) {// (2)

2022.3.28-2022.4.3 Steam新增視覺小說系遊戲（第三十四期）

1.五色浮影綻放於花之海洋計劃發行日期：4月22日商店連結：https://store.steampowered.com/app/1944250/_/

第十四節：Lambda、linq、SQL的相愛相殺(3)

一. SQL 開篇 1. where用法 1　　　#region 封裝EF呼叫SQL語句查詢 2public static List<T> ExecuteQuery<T>(string sql,params SqlParameter[] pars)

視覺SLAM十四講第五講

第五章 相機與影象

相關推薦

第五章相機與影象