OpenGL學習筆記（七）攝像機

阿新 • • 發佈：2021-08-16

概述
一、攝像機/觀察空間
二、Look At矩陣
三、自由移動
四、移動速度
五、視角移動

概述

前面的教程中我們討論了觀察矩陣以及如何使用觀察矩陣移動場景（我們向後移動了一點）。OpenGL本身沒有攝像機(Camera)的概念，但我們可以通過把場景中的所有物體往相反方向移動的方式來模擬出攝像機，產生一種我們在移動的感覺，而不是場景在移動。

本節我們將會討論如何在OpenGL中配置一個攝像機，並且將會討論FPS風格的攝像機，讓你能夠在3D場景中自由移動。我們也會討論鍵盤和滑鼠輸入

，最終完成一個自定義的攝像機類。

一、攝像機/觀察空間

當我們討論攝像機/觀察空間(Camera/View Space)的時候，是在討論以攝像機的視角作為場景原點時場景中所有的頂點座標：觀察矩陣把所有的世界座標變換為相對於攝像機位置與方向的觀察座標。要定義一個攝像機，我們需要：

它在世界空間中的位置
觀察的方向
一個指向它右測的向量以及一個指向它上方的向量

細心的讀者可能已經注意到我們實際上建立了一個三個單位軸相互垂直的、以攝像機的位置為原點的座標系。

1. 攝像機位置

獲取攝像機位置很簡單。攝像機位置簡單來說就是世界空間中一個指向攝像機位置的向量。我們把攝像機位置設定為上一節中的那個相同的位置：

glm::vec3 cameraPos = glm::vec3(0.0f, 0.0f, 3.0f);

不要忘記正z軸是從螢幕指向你的，如果我們希望攝像機向後移動，我們就沿著z軸的正方向移動。

2. 攝像機方向

攝像機方向，即攝像機指向的方向。現在我們讓攝像機指向場景原點：(0, 0, 0)。還記得如果將兩個向量相減，我們就能得到這兩個向量的差嗎？用場景原點向量減去攝像機位置向量的結果就是攝像機的指向向量。由於我們知道攝像機指向z軸負方向，但我們希望方向向量(Direction Vector)指向攝像機的z軸正方向。如果我們交換相減的順序，我們就會獲得一個指向攝像機正z軸方向的向量：

glm::vec3 cameraTarget = glm::vec3(0.0f, 0.0f, 0.0f);
glm::vec3 cameraDirection = glm::normalize(cameraPos - cameraTarget);

方向向量(Direction Vector)並不是最好的名字，因為它實際上指向從它到目標向量的相反方向（譯註：注意看前面的那個圖，藍色的方向向量大概指向z軸的正方向，與攝像機實際指向的方向是正好相反的）。

3. 右軸

我們需要的另一個向量是一個右向量(Right Vector)，它代表攝像機空間的x軸的正方向。為獲取右向量我們需要先使用一個小技巧：先定義一個上向量(Up Vector)。接下來把上向量和第二步得到的方向向量進行叉乘。兩個向量叉乘的結果會同時垂直於兩向量，因此我們會得到指向x軸正方向的那個向量（如果我們交換兩個向量叉乘的順序就會得到相反的指向x軸負方向的向量）：

glm::vec3 up = glm::vec3(0.0f, 1.0f, 0.0f); 
glm::vec3 cameraRight = glm::normalize(glm::cross(up, cameraDirection));

4. 上軸

現在我們已經有了x軸向量和z軸向量，獲取一個指向攝像機的正y軸向量就相對簡單了：我們把方向向量和右向量進行叉乘：

glm::vec3 cameraUp = glm::cross(cameraDirection, cameraRight);

使用這些攝像機向量我們就可以建立一個LookAt矩陣了，它在建立攝像機的時候非常有用。

二、Look At矩陣

使用矩陣的好處之一是如果你使用3個相互垂直（或非線性）的軸定義了一個座標空間，你可以用這3個軸外加一個平移向量來建立一個矩陣，並且你可以用這個矩陣乘以任何向量來將其變換到那個座標空間。這正是LookAt矩陣所做的，現在我們有了3個相互垂直的軸和一個定義攝像機空間的位置座標，我們可以建立我們自己的LookAt矩陣了：

\[LookAt = \begin{bmatrix} \color{red}{R_x} & \color{red}{R_y} & \color{red}{R_z} & 0 \\ \color{green}{U_x} & \color{green}{U_y} & \color{green}{U_z} & 0 \\ \color{blue}{D_x} & \color{blue}{D_y} & \color{blue}{D_z} & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} * \begin{bmatrix} 1 & 0 & 0 & -\color{purple}{P_x} \\ 0 & 1 & 0 & -\color{purple}{P_y} \\ 0 & 0 & 1 & -\color{purple}{P_z} \\ 0 & 0 & 0 & 1 \end{bmatrix} \]

其中R是右向量，U是上向量，D是方向向量P是攝像機位置向量。注意，位置向量是相反的，因為我們最終希望把世界平移到與我們自身移動的相反方向。把這個LookAt矩陣作為觀察矩陣可以很高效地把所有世界座標變換到剛剛定義的觀察空間。LookAt矩陣就像它的名字表達的那樣：它會建立一個看著(Look at)給定目標的觀察矩陣。

幸運的是，GLM已經提供了這些支援。我們要做的只是(1)定義一個攝像機位置，(2)一個目標位置和(3)一個表示世界空間中的上向量的向量（我們計算右向量使用的那個上向量）。接著GLM就會建立一個LookAt矩陣，我們可以把它當作我們的觀察矩陣：

glm::mat4 view;
view = glm::lookAt(glm::vec3(0.0f, 0.0f, 3.0f), 
           glm::vec3(0.0f, 0.0f, 0.0f), 
           glm::vec3(0.0f, 1.0f, 0.0f));

引數：

攝像機位置
目標位置
世界座標的上向量

在討論使用者輸入之前，我們先來做些有意思的事，把我們的攝像機在場景中旋轉。我們會將攝像機的注視點保持在(0, 0, 0)。

我們需要用到一點三角學的知識來在每一幀建立一個x和z座標，它會代表圓上的一點，我們將會使用它作為攝像機的位置。通過重新計算x和y座標，我們會遍歷圓上的所有點，這樣攝像機就會繞著場景旋轉了。我們預先定義這個圓的半徑radius，在每次渲染迭代中使用GLFW的glfwGetTime函式重新建立觀察矩陣，來擴大這個圓。

float radius = 10.0f;
float camX = sin(glfwGetTime()) * radius;
float camZ = cos(glfwGetTime()) * radius;
glm::mat4 view;
view = glm::lookAt(glm::vec3(camX, 0.0, camZ), glm::vec3(0.0, 0.0, 0.0), glm::vec3(0.0, 1.0, 0.0));

執行效果：

三、自由移動

讓攝像機繞著場景轉的確很有趣，但是讓我們自己移動攝像機會更有趣！首先我們必須設定一個攝像機系統，所以在我們的程式前面定義一些攝像機變數很有用：

glm::vec3 cameraPos   = glm::vec3(0.0f, 0.0f,  3.0f);
glm::vec3 cameraFront = glm::vec3(0.0f, 0.0f, -1.0f);
glm::vec3 cameraUp    = glm::vec3(0.0f, 1.0f,  0.0f);

LookAt函式現在成了：

view = glm::lookAt(cameraPos, cameraPos + cameraFront, cameraUp);

我們首先將攝像機位置設定為之前定義的cameraPos。目標位置是當前的位置加上我們剛剛定義的方向向量。這樣能保證無論我們怎麼移動，攝像機都會注視著目標方向。讓我們擺弄一下這些向量，在按下某些按鈕時更新cameraPos向量。

我們已經為GLFW的鍵盤輸入定義過一個processInput函數了，我們來新新增幾個需要檢查的按鍵命令：

void processInput(GLFWwindow *window) {
    ...
    float cameraSpeed = 0.05f; // adjust accordingly
    if (glfwGetKey(window, GLFW_KEY_W) == GLFW_PRESS)
        cameraPos += cameraSpeed * cameraFront;
    if (glfwGetKey(window, GLFW_KEY_S) == GLFW_PRESS)
        cameraPos -= cameraSpeed * cameraFront;
    if (glfwGetKey(window, GLFW_KEY_A) == GLFW_PRESS)
        cameraPos -= glm::normalize(glm::cross(cameraFront, cameraUp)) * cameraSpeed;
    if (glfwGetKey(window, GLFW_KEY_D) == GLFW_PRESS)
        cameraPos += glm::normalize(glm::cross(cameraFront, cameraUp)) * cameraSpeed;
}

當我們按下WASD鍵的任意一個，攝像機的位置都會相應更新。如果我們希望向前或向後移動，我們就把位置向量加上或減去方向向量。如果我們希望向左右移動，我們使用叉乘來建立一個右向量(Right Vector)，並沿著它相應移動就可以了。這樣就建立了使用攝像機時熟悉的橫移(Strafe)效果。

注意，我們對右向量進行了標準化。如果我們沒對這個向量進行標準化，最後的叉乘結果會根據cameraFront變數返回大小不同的向量。如果我們不對向量進行標準化，我們就得根據攝像機的朝向不同加速或減速移動了，但如果進行了標準化移動就是勻速的。

四、移動速度

目前我們的移動速度是個常量，理論上沒什麼問題。但是實際情況下根據處理器的能力不同，有些人可能會比其他人每秒繪製更多幀，也就是以更高的頻率呼叫processInput函式。結果就是，根據配置的不同，有些人可能移動很快，而有些人會移動很慢。當你釋出你的程式的時候，你必須確保它在所有硬體上移動速度都一樣。

圖形程式和遊戲通常會跟蹤一個時間差(Deltatime)變數，它儲存了渲染上一幀所用的時間。我們把所有速度都去乘以deltaTime值。結果就是，如果我們的deltaTime很大，就意味著上一幀的渲染花費了更多時間，所以這一幀的速度需要變得更高來平衡渲染所花去的時間。使用這種方法時，無論你的電腦快還是慢，攝像機的速度都會相應平衡，這樣每個使用者的體驗就都一樣了。

這樣我們可以定義每秒執行的速度（即單位時間路程），這樣無論是幀數高還是低物體都可以以該速度運動。

例如：

定義速度為 1m/s

慢電腦為30幀，則每幀物體運動的距離為：\(\frac{1}{30}\)m，每秒執行1m

快電腦為60幀，則每幀物體運動的距離為：\(\frac{1}{60}\)m，每秒執行1m

我們跟蹤兩個全域性變數來計算出deltaTime值：

float deltaTime = 0.0f; // 當前幀與上一幀的時間差
float lastFrame = 0.0f; // 上一幀的時間

在每一幀中我們計算出新的deltaTime以備後用：

float currentFrame = glfwGetTime();
deltaTime = currentFrame - lastFrame;
lastFrame = currentFrame;

現在我們有了deltaTime，在計算速度的時候可以將其考慮進去了：

void processInput(GLFWwindow *window)
{
  float cameraSpeed = 2.5f * deltaTime;
  ...
}

執行效果：

五、視角移動

為了能夠改變視角，我們需要根據滑鼠的輸入改變cameraFront向量。

1. 尤拉角

尤拉角(Euler Angle)是可以表示3D空間中任何旋轉的3個值，由萊昂哈德·尤拉(Leonhard Euler)在18世紀提出。一共有3種尤拉角：俯仰角(Pitch)、偏航角(Yaw)和滾轉角(Roll)，下面的圖片展示了它們的含義：

俯仰角是描述我們如何往上或往下看的角
偏航角表示我們往左和往右看的程度
滾轉角代表我們如何翻滾攝像機，通常在太空飛船的攝像機中使用。

每個尤拉角都有一個值來表示，把三個角結合起來我們就能夠計算3D空間中任何的旋轉向量了。

對於我們的攝像機系統來說，我們只關心俯仰角和偏航角，所以我們不會討論滾轉角。

給定一個俯仰角和偏航角，我們可以把它們轉換為一個代表新的方向向量的3D向量。俯仰角和偏航角轉換為方向向量的處理需要一些三角學知識。

如果我們想象自己在xz平面上，看向y軸，我們可以基於第一個三角形計算來計算它的長度/y方向的強度(Strength)（我們往上或往下看多少）。從圖中我們可以看到對於一個給定俯仰角的y值等於\(sin{(pitch)}\)：

direction.y = sin(glm::radians(pitch)); // 注意我們先把角度轉為弧度

這裡我們只更新了y值，仔細觀察x和z分量也被影響了。從三角形中我們可以看到它們的值等於：

length = cos(glm::radians(pitch));

其中length=x^2+z^2

看看我們是否能夠為偏航角找到需要的分量：

就像俯仰角的三角形一樣，我們可以看到x分量取決於cos(yaw)的值，z值同樣取決於偏航角的正弦值。把這個加到前面的值中，會得到基於俯仰角和偏航角的方向向量：

direction.y = sin(glm::radians(pitch));
direction.x = cos(glm::radians(pitch)) * cos(glm::radians(yaw)); // 譯註：direction代表攝像機的前軸(Front)，這個前軸是和本文第一幅圖片的第二個攝像機的方向向量是相反的
direction.z = cos(glm::radians(pitch)) * sin(glm::radians(yaw));

這樣我們就有了一個可以把俯仰角和偏航角轉化為用來自由旋轉視角的攝像機的3維方向向量了。你可能會奇怪：我們怎麼得到俯仰角和偏航角？

2. 滑鼠輸入

偏航角和俯仰角是通過滑鼠（或手柄）移動獲得的：

水平的移動影響偏航角
豎直的移動影響俯仰角

它的原理就是：儲存上一幀滑鼠的位置，在當前幀中我們當前計算滑鼠位置與上一幀的位置相差多少。如果水平/豎直差別越大那麼俯仰角或偏航角就改變越大，也就是攝像機需要移動更多的距離。

首先我們要告訴GLFW，它應該隱藏游標，並捕捉(Capture)它。捕捉光標表示的是，如果焦點在你的程式上（譯註：即表示你正在操作這個程式，Windows中擁有焦點的程式標題欄通常是有顏色的那個，而失去焦點的程式標題欄則是灰色的），游標應該停留在視窗中（除非程式失去焦點或者退出）。我們可以用一個簡單地配置呼叫來完成：

glfwSetInputMode(window, GLFW_CURSOR, GLFW_CURSOR_DISABLED);

函式作用：無論我們怎麼去移動滑鼠，游標都不會顯示了，它也不會離開視窗。對於FPS攝像機系統來說非常完美。

為了計算俯仰角和偏航角，我們需要讓GLFW監聽滑鼠移動事件。（和鍵盤輸入相似）我們會用一個回撥函式來完成，函式的原型如下：

void mouse_callback(GLFWwindow* window, double xpos, double ypos);

這裡的xpos和ypos代表當前滑鼠的位置。當我們用GLFW註冊了回撥函式之後，滑鼠一移動mouse_callback函式就會被呼叫：

glfwSetCursorPosCallback(window, mouse_callback);

在處理FPS風格攝像機的滑鼠輸入的時候，我們必須在最終獲取方向向量之前做下面這幾步：

計算滑鼠距上一幀的偏移量。
把偏移量新增到攝像機的俯仰角和偏航角中。
對偏航角和俯仰角進行最大和最小值的限制。
計算方向向量。

①獲取滑鼠偏移量

我們必須先在程式中儲存上一幀的滑鼠位置，我們把它的初始值設定為螢幕的中心（螢幕的尺寸是800x600）：

float lastX = SCR_WIDTH/2, lastY = SCR_HEIGHT/2;

然後在滑鼠的回撥函式中我們計算當前幀和上一幀滑鼠位置的偏移量：

float xoffset = xpos - lastX;
float yoffset = lastY - ypos; // 注意這裡是相反的，因為y座標是從底部往頂部依次增大的
lastX = xpos;
lastY = ypos;

float sensitivity = 0.05f;
xoffset *= sensitivity;
yoffset *= sensitivity;

注意我們把偏移量乘以了sensitivity（靈敏度）值。如果我們忽略這個值，滑鼠移動就會太大了；你可以自己實驗一下，找到適合自己的靈敏度值。

②把偏移量新增到攝像機的俯仰角和偏航角中

把偏移量加到全域性變數pitch和yaw上：

yaw   += xoffset;
pitch += yoffset;

③給攝像機新增一些限制

我們需要給攝像機新增一些限制，這樣攝像機就不會發生奇怪的移動了（這樣也會避免一些奇怪的問題）。對於俯仰角，要讓使用者不能看向高於89度的地方（在90度時視角會發生逆轉，所以我們把89度作為極限），同樣也不允許小於-89度。這樣能夠保證使用者只能看到天空或腳下，但是不能超越這個限制。我們可以在值超過限制的時候將其改為極限值來實現：

if(pitch > 89.0f)
  pitch =  89.0f;
if(pitch < -89.0f)
  pitch = -89.0f;

④得到真正的方向向量

glm::vec3 front;
front.x = cos(glm::radians(pitch)) * cos(glm::radians(yaw));
front.y = sin(glm::radians(pitch));
front.z = cos(glm::radians(pitch)) * sin(glm::radians(yaw));
cameraFront = glm::normalize(front);

計算出來的方向向量就會包含根據滑鼠移動計算出來的所有旋轉了。由於cameraFront向量已經包含在GLM的lookAt函式中，我們這就沒什麼問題了。

⑤細節調整

如果你現在執行程式碼，你會發現在視窗第一次獲取焦點的時候攝像機會突然跳一下。這個問題產生的原因是，在你的滑鼠移動進視窗的那一刻，滑鼠回撥函式就會被呼叫，這時候的xpos和ypos會等於滑鼠剛剛進入螢幕的那個位置。這通常是一個距離螢幕中心很遠的地方，因而產生一個很大的偏移量，所以就會跳了。我們可以簡單的使用一個bool變數檢驗我們是否是第一次獲取滑鼠輸入，如果是，那麼我們先把滑鼠的初始位置更新為xpos和ypos值，這樣就能解決這個問題；接下來的滑鼠移動就會使用剛進入的滑鼠位置座標來計算偏移量了：

if(firstMouse) // 這個bool變數初始時是設定為true的
{
    lastX = xpos;
    lastY = ypos;
    firstMouse = false;
}

最後的程式碼應該是這樣的：

void mouse_callback(GLFWwindow* window, double xpos, double ypos)
{
    if(firstMouse)
    {
        lastX = xpos;
        lastY = ypos;
        firstMouse = false;
    }

    float xoffset = xpos - lastX;
    float yoffset = lastY - ypos; 
    lastX = xpos;
    lastY = ypos;

    float sensitivity = 0.05;
    xoffset *= sensitivity;
    yoffset *= sensitivity;

    yaw   += xoffset;
    pitch += yoffset;

    if(pitch > 89.0f)
        pitch = 89.0f;
    if(pitch < -89.0f)
        pitch = -89.0f;

    glm::vec3 front;
    front.x = cos(glm::radians(yaw)) * cos(glm::radians(pitch));
    front.y = sin(glm::radians(pitch));
    front.z = sin(glm::radians(yaw)) * cos(glm::radians(pitch));
    cameraFront = glm::normalize(front);
}

3. 縮放

作為我們攝像機系統的一個附加內容，我們還會來實現一個縮放(Zoom)介面。在之前的教程中我們說視野(Field of View)或fov定義了我們可以看到場景中多大的範圍。當視野變小時，場景投影出來的空間就會減小，產生放大(Zoom In)了的感覺。我們會使用滑鼠的滾輪來放大。與滑鼠移動、鍵盤輸入一樣，我們需要一個滑鼠滾輪的回撥函式：

void scroll_callback(GLFWwindow* window, double xoffset, double yoffset)
{
  if(fov >= 1.0f && fov <= 45.0f)
    fov -= yoffset;
  if(fov <= 1.0f)
    fov = 1.0f;
  if(fov >= 45.0f)
    fov = 45.0f;
}

當滾動滑鼠滾輪的時候，yoffset值代表我們豎直滾動的大小。當scroll_callback函式被呼叫後，我們改變全域性變數fov變數的內容。因為45.0f是預設的視野值，我們將會把縮放級別(Zoom Level)限制在1.0f到45.0f。

我們現在在每一幀都必須把透視投影矩陣上傳到GPU，但現在使用fov變數作為它的視野：

projection = glm::perspective(glm::radians(fov), 800.0f / 600.0f, 0.1f, 100.0f);

註冊滑鼠滾輪的回撥函式：

glfwSetScrollCallback(window, scroll_callback);

4. 上升和下降

例如《我的世界》這樣的遊戲，在建造模式中角色可以進行飛行，而此時可以點選鍵盤的空格鍵實現角色的上升運動，我們這裡也新增這個功能，只需在鍵盤事件函式中新增：

if (glfwGetKey(objectPool->window, GLFW_KEY_Q) == GLFW_PRESS) {
    cameraPos += cameraUp * cameraSpeed;
}
if (glfwGetKey(objectPool->window, GLFW_KEY_E) == GLFW_PRESS) {
    cameraPos -= cameraUp * cameraSpeed;
}

即點選Q鍵上升，E鍵下降。

OpenGL學習筆記（七）攝像機

概述

一、攝像機/觀察空間

1. 攝像機位置

2. 攝像機方向

3. 右軸

4. 上軸

二、Look At矩陣

三、自由移動

四、移動速度

五、視角移動

1. 尤拉角

2. 滑鼠輸入

3. 縮放

4. 上升和下降

OpenGL學習筆記（七）攝像機

openGL 學習筆記（一）瞭解 OpenGL，建立第一個OpenGL視窗

kafka學習筆記（七）kafka的狀態機模組

Hadoop 學習筆記（七）HDFS 客戶端操作（下）

Pytest學習筆記（七）引數化parametrize

SpringMVC學習筆記（七）—— RestfulCRUD

go get 分支_GO語言聖經學習筆記（七）方法和介面

Latex學習筆記（七）參考文獻模板

[ python ] pandas學習筆記（七）字串處理

MYSQL學習筆記（七）許可權和資料庫設計（三大正規化）

opengl學習筆記（三）

機器學習筆記（七）——嶺迴歸（sklearn）

PHP學習筆記（七）

JUC學習筆記（七）

Java學習筆記（七）：陣列

Docker 與 K8S學習筆記（七）—— 容器的網路

設計模式學習筆記（七）代理模式以及動態代理的實現

《第一行程式碼：Android篇》學習筆記（七）

JVM學習筆記（七、GC1-基礎知識點）

【Java學習筆記（七十八）】之集合Collection介面，iterator介面，連結串列，陣列列表，散列表，樹集，佇列，雙端佇列，優先佇列

OpenGL學習筆記（七）攝像機

概述

一、攝像機/觀察空間

1. 攝像機位置

2. 攝像機方向

3. 右軸

4. 上軸

二、Look At矩陣

三、自由移動

四、移動速度

五、視角移動

1. 尤拉角

2. 滑鼠輸入

3. 縮放

4. 上升和下降

相關推薦