PostgreSQL 數據庫跨版本升級常用方案

作者: 不剪發(fā)的Tony老師
畢業(yè)于北京航空航天大學,十多年數據庫管理與開發(fā)經驗,目前在一家全球性的金融公司從事數據庫架構設計。CSDN學院簽約講師以及GitChat專欄作者。csdn上的博客收藏于以下地址:https://tonydong.blog.csdn.net


文章目錄

        升級方案概述
        通過邏輯備份與還原進行升級
        利用 pg_upgrade 工具進行升級
        使用邏輯復制功能進行升級
        總結

大家好,我是只談技術不剪發(fā)的 Tony 老師。對于企業(yè)而言,將數據庫系統(tǒng)升級到新版本通??梢垣@得更好的性能、更多的功能、最新的安全補丁和錯誤修復等。因此,本文就來介紹一下 PostgreSQL 數據庫版本升級的 3 種常用方案。

如果覺得文章有用,歡迎評論??、點贊??、推薦??
升級方案概述

PostgreSQL 版本號由主要版本和次要版本組成。例如,PostgreSQL 12.4 中的 12 是主要版本,4 是次要版本;PostgreSQL 10.0 之前的版本由 3 個數字組成,例如 9.6.19,其中 9.6 是主要版本,19 是次要版本。

發(fā)布次要版本是不會改變內存的存儲格式,因此總是和相同的主要版本兼容。例如,PostgreSQL 12.4 和 PostgreSQL 12.0 以及后續(xù)的 PostgreSQL 12.x 兼容。對于這些兼容版本的升級非常簡單,只需要關閉數據庫服務,安裝替換二進制的可執(zhí)行文件,重新啟動服務即可。

接下來,我們主要討論 PostgreSQL 的跨版本升級問題,例如從 PostgreSQL 12.x 升級到 PostgreSQL 13.y。主要版本的升級可能會修改內部數據的存儲格式,因此需要執(zhí)行額外的操作。常用的跨版本升級方法和適用場景如下:
 

    ??如果使用廠商提供的 PostgreSQL 定制版本,也可能通過他們提供的工具實現版本升級,具體參考相關文檔。

注意事項:升級主要版本通過會導致用戶可見的不兼容性,因此應用程序可能需要進行相應的修改。具體的變化可以參考發(fā)行說明,尤其是“Migration”部分的內容;如果跨多個主要版本進行升級,需要閱讀每個中間版本的發(fā)行說明。
通過邏輯備份與還原進行升級

傳統(tǒng)的跨版本升級方法利用 pg_dump/pg_dumpall 邏輯備份導出數據庫,然后在新版本中通過 pg_restore 進行還原。導出舊版本數據庫時推薦使用新版本的 pg_dump/pg_dumpall 工具,可以利用最新的并行導出和還原功能,同時可以減少數據庫膨脹問題。

邏輯備份與還原非常簡單但速度比較慢,停機時間取決于數據庫的大小,因此適合中小型數據庫的升級。

下面我們介紹這種升級方法的具體操作,假如當前 PostgreSQL 軟件的安裝目錄位于 /usr/local/pgsql,同時數據目錄位于 /usr/local/pgsql/data,我們在同一臺服務器上進行升級。

    執(zhí)行邏輯備份之前停止應用程序,確保沒有數據更新,因為備份開始后的更新不會被導出。如有必要,可以修改 /usr/local/pgsql/data/pg_hba.conf 文件禁止其他人訪問數據庫。

    然后備份數據庫:

    pg_dumpall > outputfile
 

    如果已經安裝了新版本的 PostgreSQL,可以使用新版本的 pg_dumpall 命令備份舊版本數據庫。

    停止舊版本的后臺服務:

    pg_ctl stop
 

    或者通過其他方式停止后臺服務。

    如果安裝目錄沒有包含特定版本標識,可以將目錄改名,必要時可以再修改回來??梢允褂妙愃埔韵碌拿钪孛夸洠?/p>

    mv /usr/local/pgsql /usr/local/pgsql.old
 

    安裝新版本 PostgreSQL 軟件,假如安裝目錄仍然是 /usr/local/pgsql。

    初始化一個新的數據庫集群,需要使用數據庫專用用戶(通常是 postgres;如果是升級版本,應該已經存在該用戶)執(zhí)行操作:

    /usr/local/pgsql/bin/initdb -D /usr/local/pgsql/data
 

    將舊版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改動在對應的新配置文件中再次進行修改。

    使用數據庫專用用戶啟動新版本的后臺服務:

     /usr/local/pgsql/bin/postgres -D /usr/local/pgsql/data
 

    最后,利用新版本的 psql 命令還原數據:

    /usr/local/pgsql/bin/psql -d postgres -f outputfile
 

為了減少停機時間,可以將新版本的 PostgreSQL 安裝到另一個目錄(例如 /usr/local/pgsql-13),同時使用不同的端口啟動服務。然后同時執(zhí)行數據庫的導出和導入:

pg_dumpall -p 5432 | psql -d postgres -p 5433

 

執(zhí)行以上操作時,新舊版本的后臺服務同時運行,新版本使用 5433 端口,舊版本使用 5432 端口。
利用 pg_upgrade 工具進行升級

pg_upgrade 工具可以支持 PostgreSQL 跨版本的就地升級,不需要執(zhí)行導出和導入操作。pg_upgrade 可以支持 PostgreSQL 8.4.X 到最新版本的升級,包括快照版本和測試版本。

pg_upgrade 提供了升級前的兼容性檢查(-c 或者 --check 選項)功能, 可以發(fā)現插件、數據類型不兼容等問題。如果指定了 --link 選項,新版本服務可以直接使用原有的數據庫文件而不需要執(zhí)行復制,通??梢栽趲追昼妰韧瓿缮壊僮鳌?/p>

下面我們介紹這種升級方法的具體操作,假如當前 PostgreSQL 軟件的安裝目錄位于 /usr/pgsql-12/,同時數據目錄位于 /var/lib/pgsql/12/data/,我們將其升級為 PostgreSQL 13。

    確定沒有客戶端訪問之后備份數據庫,然后停止舊版本的后臺服務。例如 CentOS 可以執(zhí)行以下命令:

    sudo systemctl stop postgresql-12
    sudo systemctl disable postgresql-12
 

    安裝新版本的 PostgreSQL 軟件。例如 PostgreSQL 13.0,安裝目錄位于 /usr/pgsql-13/。

    初始化新版本的數據庫集群。數據目錄設置為 /var/lib/pgsql/13/data/。

    如果舊版本中安裝了擴展模塊,在新版本中也需要安裝相應的共享對象文件或者 DLL 文件。但是不要執(zhí)行CREATE EXTENSION命令,因為會從舊數據庫中進行升級。另外,如果使用了任何自定義的全文搜索文件(字典、同義詞、詞庫、停用詞),也需要復制到新的數據庫集群目錄中。

    停止新版本的后臺服務。例如 CentOS 可以執(zhí)行以下命令:

    sudo systemctl stop postgresql-13
 

    通過 pg_upgrade 執(zhí)行升級操作,使用數據庫專用用戶(通常是 postgres)執(zhí)行以下操作:

    /usr/pgsql-13/bin/pg_upgrade \
      --old-datadir /var/lib/pgsql/12/data/ \
      --new-datadir /var/lib/pgsql/13/data/ \
      --old-bindir /usr/pgsql-12/bin/ \
      --new-bindir /usr/pgsql-13/bin/ \
      --check
 

    其中 --check 表示執(zhí)行升級檢查,而不會真的執(zhí)行升級操作。通過檢查之后,可以去掉該參數執(zhí)行升級:

    /usr/pgsql-13/bin/pg_upgrade \
      --old-datadir /var/lib/pgsql/12/data/ \
      --new-datadir /var/lib/pgsql/13/data/ \
      --old-bindir /usr/pgsql-12/bin/ \
      --new-bindir /usr/pgsql-13/bin/ \
      --link
 

    其中 --link 表示將新版本的數據目錄硬鏈接到舊版本的數據目錄,而不會復制一份新的數據文件,可以快速進行升級。

    將舊版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改動在對應的新配置文件中再次進行修改。

    啟動新版本的后臺服務。例如 CentOS 可以執(zhí)行以下命令:

    sudo systemctl start postgresql-13
    sudo systemctl enable postgresql-13
 

    連接服務器查看數據庫的版本信息:

    SELECT version();
    version                                                                                                |
    -------------------------------------------------------------------------------------------------------|
    PostgreSQL 13.0 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-39), 64-bit|
 

    收集統(tǒng)計信息。pg_upgrade 不會生成新版本數據庫的統(tǒng)計信息,但是會創(chuàng)建一個腳本文件,執(zhí)行該文件:

    ./analyze_new_cluster.sh
 

    如果確認升級成功,可以選擇刪除或者保留舊的數據庫軟件和集群。pg_upgrade 同樣提供了一個刪除舊數據庫集群的腳本:

      ./delete_old_cluster.sh
 

    然后可以刪除舊版本的 PostgreSQL 軟件,例如 CentOS 可以執(zhí)行以下命令:

    yum remove postgresql12*
 

    如果想要回退到舊版本的數據庫,可以分為不同的情況:
        如果只運行了 --check 選項命令,表示沒有真正執(zhí)行升級,重新啟動服務即可;
        如果升級時沒有使用 --link 選項,舊版本的數據庫集群沒有任何修改,重新啟動服務即可;
        如果升級時使用了 --link 選項,數據庫文件可能已經被新版本的集群使用:
            如果 pg_upgrade 在鏈接操作之前終止,舊版本的數據庫集群沒有任何修改,重新啟動服務即可;
            如果沒有啟動過新版本的后臺服務,舊版本的數據庫集群沒有修改,但是鏈接過程已經將 $PGDATA/global/pg_control 文件重命名為 $PGDATA/global/pg_control.old;此時需要將該文件名中的 .old 后綴去掉,然后重新啟動服務即可;
            如果已經啟動了新版本的數據庫集群,已經修改了數據庫文件,再啟動舊版本的服務可能導致數據損壞;此時需要通過備份文件還原舊版本的數據庫。

關于 pg_upgrade 的詳細使用和升級注意事項,例如流復制結構和日志傳輸復制結構中備用節(jié)點的升級,可以參考官方文檔。
使用邏輯復制功能進行升級
 

PostgreSQL 邏輯復制支持跨版本之間的數據復制,而且支持不同平臺之間的復制,因此也可以用于實現版本升級。我們可以安裝一個新版本的數據庫作為復制的從節(jié)點,當數據已經同步時執(zhí)行一次主從切換,然后關閉舊版本的主節(jié)點。主從切換的升級方法通常只需要幾秒鐘就能完成,利用第三方高可用組件甚至可以實現零停機時間升級。

PostgreSQL 10 開始提供了內置的邏輯復制功能,或者也可以使用 pglogical、Slony、Londiste 以及 Bucardo 等邏輯復雜工具。

關于 PostgreSQL 邏輯復制結構的創(chuàng)建和主從切換,可以參考官方文檔。
總結

PostgreSQL 小版本升級只需要替換二進制文件即可,跨版本升級的方案主要有 3 種:通過 pg_dump/pg_dumpall 邏輯備份與還原進行升級,利用 pg_upgrade 工具進行升級,使用邏輯復制功能進行升級。了解它們的優(yōu)缺點和適用場景可以幫助我們選擇最佳的升級方式。