1. 程式人生 > 資料庫 >記一次MySQL Slave庫恢復實戰記錄

記一次MySQL Slave庫恢復實戰記錄

狀況描述:

今天登入一個MySQL資料庫slave節點主機發現/var/lib/mysql下存放大量的mysql-relay-bin檔案,最早的檔案建立日期甚至是2018年,我記得在slave庫同步完master的日誌操作記錄後,會刪除這些檔案(預設設定不會刪除,我記錯了),於是便查看了slave庫的狀態,發現如下報錯:

mysql> show slave status\G;
*************************** 1. row ***************************
        Slave_IO_State: Waiting for master to send event
         Master_Host: *.*.*.*
         Master_User: dbsync
         Master_Port: 3306
        Connect_Retry: 60
       Master_Log_File: mysql-bin.000095
     Read_Master_Log_Pos: 869242147
        Relay_Log_File: mysqld-relay-bin.000146
        Relay_Log_Pos: 871280529
    Relay_Master_Log_File: mysql-bin.000075
       Slave_IO_Running: Yes
      Slave_SQL_Running: No
       Replicate_Do_DB: cdb,cdb_admin
     Replicate_Ignore_DB: mysql
      Replicate_Do_Table: 
    Replicate_Ignore_Table: 
   Replicate_Wild_Do_Table: 
 Replicate_Wild_Ignore_Table: 
          Last_Errno: 1594
          Last_Error: Relay log read failure: Could not parse relay log event entry. The possible reasons are: the master's binary log is corrupted (you can check this by running 'mysqlbinlog' on the binary log),the slave's relay log is corrupted (you can check this by running 'mysqlbinlog' on the relay log),a network problem,or a bug in the master's or slave's MySQL code. If you want to check the master's binary log or slave's relay log,you will be able to know their names by issuing 'SHOW SLAVE STATUS' on this slave.
         Skip_Counter: 0
     Exec_Master_Log_Pos: 871280384
       Relay_Log_Space: 19994786573
       Until_Condition: None
        Until_Log_File: 
        Until_Log_Pos: 0
      Master_SSL_Allowed: No
      Master_SSL_CA_File: 
      Master_SSL_CA_Path: 
       Master_SSL_Cert: 
      Master_SSL_Cipher: 
        Master_SSL_Key: 
    Seconds_Behind_Master: NULL
Master_SSL_Verify_Server_Cert: No
        Last_IO_Errno: 0
        Last_IO_Error: 
        Last_SQL_Errno: 1594
        Last_SQL_Error: Relay log read failure: Could not parse relay log event entry. The possible reasons are: the master's binary log is corrupted (you can check this by running 'mysqlbinlog' on the binary log),you will be able to know their names by issuing 'SHOW SLAVE STATUS' on this slave.
1 row in set (0.00 sec)

ERROR: 
No query specified

原因:

我在master節點上刪除了名稱為mysql-bin.00007格式的檔案,其中包括mysql-bin.000075,因此,slave庫找不到該檔案,無法同步。

解決辦法:

1、在slave庫上重新指定同步位置。(不可行)

slave stop;
CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000095',MASTER_LOG_POS=869242147; //mysql master節點上mysql-bin.000095的已有位置
slave start;

slave節點上show slave status,依然報錯,具體的報錯內容沒有複製下來,只記得errno為1236,Slave_IO_Running程序不執行,Slave_SQL_Running程序執行,大概描述就是某個庫的某個表有問題。

在多次嘗試指定不同的同步位置(報錯的位置,master上mysql-bin-000095剛寫過的位置)依然存在該錯誤。

實際上,表記錄已經有問題,就拿描述中提出的那個表來說,slave庫存放了約1200條記錄,master庫則有1900+的記錄。除非手工將這些資料補上,否則由於記錄操作資料的日誌已經丟失(被我刪除),是找不到最近的一致的日誌操作執行位置的。

2、重做slave庫。

由於資料差異太大,而且我覺得不光一張表出現了資料不一樣的問題,所以乾淨點,把從庫重做。
1)比對master、slave節點庫配置資訊,保證一致。(我不知道為什麼設定了雙主模式,實際上我只有一個例項跑在master節點上啊?)

2)在master、slave節點上檢視流量情況(show processlist),保證要重做的slave庫上沒有業務的流量接入。

3)停止master節點上slave程序。(這個停了以後,我就沒開過,不知道有沒有問題,待觀察)

4)記錄master節點上庫的日誌記錄位置,之後備份資料庫:

mysql> show master status;
+------------------+-----------+-------------------------------+------------------+
| File       | Position | Binlog_Do_DB         | Binlog_Ignore_DB |
+------------------+-----------+-------------------------------+------------------+
| mysql-bin.000095 | 871760173 | cdb,cdb_admin | mysql      |
+------------------+-----------+-------------------------------+------------------+
1 row in set (0.01 sec)
 mysqldump -u root -p --databases cdb,cdb_admin > bak.master.sql

5)保險起見,備份slave節點庫:

mysqldump -u root -p --databases cdb,cdb_admin > bak.slave.sql

6)重做開始:把master庫備份檔案複製到slave節點上,匯入該備份檔案

mysql -u root -p < bak.master.sql

7)在slave節點上,重新指定讀master日誌的位置:

slave stop;
CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000095',MASTER_LOG_POS=871760173; //POS為剛才記錄的master節點日誌記錄位置
slave start;

8)slave節點上 show slave status;此時Slave_IO_Running,Slave_SQL_Running均執行起來了,重新整理slave status,Read_Master_Log_Pos數值也開始增加,重新開始同步了。

總結:

清理檔案時,要注意mysql-bin檔案在master、slave節點日誌讀取和寫的位置啊!,刪之前一定要確認日誌位置在master和slave斷已被讀過,不要亂刪,否則搞得slave庫無法同步了,就算在slave節點上強行指定master日誌讀取位置或者跳過該錯誤,也不排除slave庫上資料丟失的可能。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。