鄭州地鐵集團(tuán)有限公司 徐淑鵬,陳俊亞,曹美閣
摘要:本文基于鄭州市軌道交通自動售檢票線網(wǎng)管理中心(ANCC)系統(tǒng)主副中心雙活設(shè)計方案,從災(zāi)備中心建設(shè)的必要性入手,分析得出選擇雙活中心方案建設(shè)。其次對雙活中心的容災(zāi)架構(gòu)、存儲雙活、應(yīng)用雙 活和主備倒切流程等分別做出分析,展現(xiàn)了雙活中心的架構(gòu)特點(diǎn)和相較于傳統(tǒng)方案的應(yīng)用優(yōu)勢,為后續(xù)城市線網(wǎng)管理中心的建設(shè)提供參考。
關(guān)鍵詞:城市軌道交通;自動售檢票系統(tǒng);災(zāi)備
Abstract: In this paper, based on the Zhengzhou rail transit automatic fare collection line network management center (ANCC) system main and auxiliary center double live design scheme and starting from the necessity of the construction of disaster recovery center, we analysis the choice of double live center construction scheme. Then we analysis the disaster recovery architecture, storage, application and main / standby switching process of the dual activity center respectively, showing the architecture characteristics of the dual activity center and the application advantages compared with the traditional scheme. The analysis of this paper provides a reference for the subsequent construction of urban network management center.
Key words: Urban rail transit; Automated fare collection system; Disaster recovery
1 引言
近年,全國各地城市軌道交通的快速建設(shè),各大城市的城軌線網(wǎng)逐漸成型,對線網(wǎng)級自動化、智能化調(diào)度指揮和運(yùn)維管理的需求日益加強(qiáng)[1]。鄭州市軌道交通在建設(shè)多線路中心(MLC)和清分中心(ACC)擴(kuò)容的背景下,從架構(gòu)、可行性、建設(shè)成本、技術(shù)發(fā)展趨勢等方面進(jìn)行了充分的論證和分析,依托云平臺、大數(shù)據(jù)的快速發(fā)展,最終確定實(shí)施ACC及MLC系統(tǒng)組合建設(shè)方案, 即建設(shè)鄭州市軌道交通線網(wǎng)管理中心ANCC系統(tǒng)。
可以看出,ANCC成為了鄭州市軌道交通全線網(wǎng) AFC系統(tǒng)協(xié)調(diào)及對外票務(wù)信息服務(wù)和管理的主要窗口, 重要性可見一斑。ANCC系統(tǒng)癱瘓或者由于其它原因 (火災(zāi)、恐怖襲擊等)退出運(yùn)行,將會導(dǎo)致全線網(wǎng)運(yùn)營管理處于癱瘓狀態(tài),造成票務(wù)收益損失[2],因此建立一套安全、可靠的災(zāi)備系統(tǒng),是非常必要的[3]。本文基于鄭州市軌道交通ANCC系統(tǒng)的建設(shè),分析了災(zāi)備中心建設(shè)的必要性、雙活中心方案的設(shè)計選擇,并對雙活中心的建設(shè)方案進(jìn)行介紹。
2 建設(shè)背景
2.1 必要性分析
災(zāi)備方案是ANCC建設(shè)工作重要內(nèi)容,關(guān)系到業(yè)務(wù)可用性、業(yè)務(wù)連續(xù)性、數(shù)據(jù)安全性、系統(tǒng)合規(guī)性等多方面[4]。
高可用設(shè)計包括平臺架構(gòu)高可用和業(yè)務(wù)系統(tǒng)高可 用,保證整個業(yè)務(wù)平臺可以穩(wěn)定運(yùn)行,當(dāng)故障出現(xiàn)時快速定位并恢復(fù)故障[5];對于業(yè)務(wù)系統(tǒng)來說,在出現(xiàn)意外宕機(jī)時業(yè)務(wù)不會中斷,對用戶無感知。
ANCC作為線網(wǎng)級生產(chǎn)平臺,作為各線路的大腦,如果由于意外事故的出現(xiàn),線網(wǎng)級業(yè)務(wù)癱瘓并停止運(yùn)行,會給整個行業(yè)帶來嚴(yán)重的后果[6]。所以應(yīng)該建立擁有線網(wǎng)業(yè)務(wù)功能的后備中心系統(tǒng),當(dāng)主系統(tǒng)發(fā)生故障或意外不能正常工作時,及時、快速地接管主系統(tǒng)的基本工作,實(shí)現(xiàn)正常情況下異地災(zāi)備、緊急情況 下應(yīng)急處理等。
2.2 雙活中心的選擇
災(zāi)備包含三個層次,即基礎(chǔ)設(shè)施災(zāi)備、數(shù)據(jù)災(zāi)備和應(yīng)用災(zāi)備[7]。基礎(chǔ)設(shè)施災(zāi)備是對業(yè)務(wù)處理邏輯相關(guān)的設(shè)備備份,數(shù)據(jù)災(zāi)備是對數(shù)據(jù)備份以保證數(shù)據(jù)的完整 性,應(yīng)用災(zāi)備是對應(yīng)用處理系統(tǒng)的冗余備份。
雙活中心方案從基礎(chǔ)設(shè)施、數(shù)據(jù)、應(yīng)用三個層面進(jìn)行容災(zāi),具有更高級的連續(xù)性和高可用性,能夠針對服務(wù)器、硬盤、適配器卡、網(wǎng)絡(luò)等物理設(shè)備實(shí)施保護(hù), 也能針對操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用、服務(wù)等軟件的致命錯誤實(shí)施保護(hù),對于發(fā)生在本地的錯誤,具備自動接管功能[8]。該方案技術(shù)實(shí)現(xiàn)復(fù)雜度最高,但能夠充分利用兩個中心的所有資源,業(yè)務(wù)高可用性和連續(xù)性最優(yōu)。
3 ANCC系統(tǒng)雙活中心關(guān)鍵技術(shù)
3.1 雙活容災(zāi)架構(gòu)
各線路數(shù)據(jù)匯聚節(jié)點(diǎn)就近接入,主副中心同時處理業(yè)務(wù),資源得到有效利用;業(yè)務(wù)處理完成后,寫入主中心數(shù)據(jù)庫,主副中心數(shù)據(jù)庫通過數(shù)據(jù)庫同步軟件進(jìn)行同步;當(dāng)主中心/副中心接入故障或業(yè)務(wù)處理故障時, 系統(tǒng)通過預(yù)置的備用路由,自動完成線路接入的切換; 當(dāng)系統(tǒng)數(shù)據(jù)存儲出現(xiàn)故障時,系統(tǒng)通過內(nèi)部業(yè)務(wù)倒切, 實(shí)現(xiàn)數(shù)據(jù)的有序入庫存儲;通過系統(tǒng)應(yīng)用雙活設(shè)計,實(shí)現(xiàn)系統(tǒng)的高穩(wěn)定運(yùn)營。
生產(chǎn)中心發(fā)生災(zāi)難(生產(chǎn)中心停電、火災(zāi)等): 可對受云服務(wù)器高可用性(CSHA)服務(wù)保護(hù)的生產(chǎn)云服務(wù)器自動或手工切換到災(zāi)備中心,快速啟動容災(zāi)云服務(wù)器。
計劃內(nèi)停機(jī)(計劃性停電、日常運(yùn)維等):容災(zāi)管理員可對受CSHA服務(wù)保護(hù)的生產(chǎn)云服務(wù)器進(jìn)行一鍵式的計劃性遷移,在災(zāi)備中心快速啟動容災(zāi)云服務(wù)器,保證業(yè)務(wù)數(shù)據(jù)零丟失;在原生產(chǎn)中心完成計劃性活動后,容災(zāi)管理員對受保護(hù)云服務(wù)器進(jìn)行反向重保護(hù),并在合適時間通過計劃性遷移將業(yè)務(wù)切回到原生產(chǎn)中心。
雙活中心的總體架構(gòu)如圖1所示。
圖1 雙活中心總體架構(gòu)
3.2 存儲雙活方案
3.2.1 方案描述
云硬盤高可用服務(wù)(VHA)為云服務(wù)器中的云硬盤提供本地存儲雙活保護(hù)[9]。當(dāng)單套存儲設(shè)備發(fā)生故障時,數(shù)據(jù)零丟失,業(yè)務(wù)不中斷。該方案是基于 FusionSphere OpenStack云操作系統(tǒng)平臺的IaaS層云服務(wù)器容災(zāi)方案。它通過云數(shù)據(jù)中心結(jié)合存儲雙活實(shí)現(xiàn)單中心內(nèi)的云硬盤容災(zāi)。
3.2.2 方案架構(gòu)
云硬盤高可用服務(wù)與網(wǎng)絡(luò)是解耦的,原則上使用 FusionCloud的通用網(wǎng)絡(luò)方案即可,僅要求在通用組網(wǎng)方案上預(yù)留存儲網(wǎng)絡(luò)端口,增加兩套雙活存儲間的雙活數(shù)據(jù)路徑。
在組件部署上,云硬盤高可用主要增加了存儲仲裁軟件和BCManager eReplication兩大組件。二者均可部署在物理機(jī)中,也可以部署在虛擬機(jī)中。如圖2所示。
圖2 存儲雙活方案架構(gòu)
3.2.3 實(shí)現(xiàn)原理
租戶登錄VHA服務(wù)申請界面,為云主機(jī)申請本地存儲雙活容災(zāi)保護(hù)。系統(tǒng)過濾出該租戶具備創(chuàng)建容災(zāi)保護(hù)條件但還尚未創(chuàng)建的云主機(jī)[10]。租戶可從中選擇單個或多個需要容災(zāi)保護(hù)的云主機(jī),提交申請。后臺自動調(diào)用容災(zāi)管理組件對應(yīng)API,創(chuàng)建存儲雙活保護(hù),實(shí)現(xiàn)的基本原理及主要步驟如下:
(1)調(diào)用Cinder建卷API,在對應(yīng)的容災(zāi)存儲上創(chuàng)建雙活占位卷(并設(shè)置為預(yù)留狀態(tài))及雙活LUN;
(2)調(diào)用DRextend容災(zāi)擴(kuò)展組件,為雙活LUN 配置雙活Pair;
(3)調(diào)用DRextend容災(zāi)擴(kuò)展組件,創(chuàng)建雙活一 致性組(將雙活Pair加入雙活一致性組,當(dāng)災(zāi)難發(fā)生時,可實(shí)現(xiàn)存儲一致性切換,實(shí)現(xiàn)存儲一致性保護(hù));
(4)調(diào)用Nova的在線重連雙活卷擴(kuò)展接口,將創(chuàng) 建的雙活LUN掛載給云主機(jī);
(5)生成VHA保護(hù)服務(wù)實(shí)例。
3.2.4 方案優(yōu)勢
(1)開放架構(gòu)
業(yè)界率先推出基于Openstack+KVM云架構(gòu)的云硬盤 高可用方案,在一套Openstack私有云架構(gòu)上構(gòu)建云服務(wù) 器本地存儲雙活保護(hù)能力防止廠商鎖定,為客戶節(jié)約成本擴(kuò)展Openstack標(biāo)準(zhǔn)并開放接口,只要第三方廠家支持該 接口,就可以接入進(jìn)行統(tǒng)一高可用配置和管理。
(2)按需使用
支持租戶按需自助申請?jiān)朴脖P高可用服務(wù),服務(wù)開通便捷高效,業(yè)務(wù)發(fā)放周期由一周縮短到半小時內(nèi),系 統(tǒng)根據(jù)租戶要求自動化配置和開通云硬盤高可用服務(wù)。
(3)可靠高效
基于存儲側(cè)的雙活技術(shù),對主機(jī)性能無影響;數(shù)據(jù)實(shí)時同步。
3.3 應(yīng)用雙活方案
3.3.1 方案描述
此方案特點(diǎn)是各線路就近接入主、副中心,主副 中心同時處理業(yè)務(wù),有效利用資源;針對主副中心不能 同時上線的情況,由單中心改為雙中心的實(shí)施過程較簡 單,可在線操作,不影響業(yè)務(wù)運(yùn)行,實(shí)施風(fēng)險較小。總體架構(gòu)如圖3所示。
圖3 應(yīng)用中心總體架構(gòu)
3.3.2 實(shí)現(xiàn)原理
云服務(wù)器高可用(CSHA)是為了當(dāng)生產(chǎn)中心故障 后,容災(zāi)云服務(wù)器能夠掛載容災(zāi)端的卷,并在災(zāi)備中心快速啟動,實(shí)現(xiàn)的基本原理如下:
租戶根據(jù)生產(chǎn)中心網(wǎng)絡(luò)、計算的資源類型及高可用要求,在災(zāi)備中心配置相同或相似的網(wǎng)絡(luò)、計算資源,并申請CSHA服務(wù)實(shí)例。
服務(wù)申請成功后,根據(jù)生產(chǎn)端云服務(wù)器的云磁盤信息,自動在容災(zāi)端創(chuàng)建相同規(guī)格的云磁盤,并在存儲層配置雙活復(fù)制對、一致性組,實(shí)現(xiàn)數(shù)據(jù)的鏡像保護(hù)。
當(dāng)生產(chǎn)中心發(fā)生站點(diǎn)級故障時,云平臺仲裁服務(wù)顯示站點(diǎn)故障,同時生產(chǎn)云服務(wù)器、存儲層雙活復(fù)制對故障。此時,可自動或管理員手工觸發(fā)CSHA保護(hù)組切換,將災(zāi)備中心的云硬盤掛載至容災(zāi)云服務(wù)器并啟動云服務(wù)器。
容災(zāi)云服務(wù)器接入所在災(zāi)備中心的網(wǎng)絡(luò),取決于容災(zāi)云服務(wù)器創(chuàng)建時所接入的VPC網(wǎng)絡(luò)。
3.4 主備倒切流程
主備系統(tǒng)倒切應(yīng)急處置流程分為五個階段,即災(zāi) 難發(fā)生、處置決策、前期準(zhǔn)備、應(yīng)急處置和處置結(jié)束。
災(zāi)難發(fā)生階段,當(dāng)系統(tǒng)發(fā)生災(zāi)難影響生產(chǎn)中心正常業(yè)務(wù)時,應(yīng)立即將災(zāi)難情況報告給應(yīng)急處置小組組長、副組長。
處置決策階段,應(yīng)急處置小組組長、副組長,收到災(zāi)難情況報告后,應(yīng)立即組織小組成員開會,分析災(zāi) 難具體情況、判斷影響范圍并確定對應(yīng)措施啟動相關(guān)預(yù)案,開展應(yīng)急處置工作。
前期準(zhǔn)備階段,根據(jù)應(yīng)急處置小組組長決策,各分組組長按照預(yù)案內(nèi)容,組織分組成員進(jìn)行主備系統(tǒng)倒切前的相關(guān)技術(shù)準(zhǔn)備。副組長負(fù)責(zé)與相關(guān)單位溝通,協(xié)調(diào)主備系統(tǒng)倒切前工作。
應(yīng)急處置階段,準(zhǔn)備工作完成后,應(yīng)急處置小組組長指揮小組成員進(jìn)行主備系統(tǒng)倒切工作。系統(tǒng)倒切完成后,各分組組長負(fù)責(zé)確認(rèn)系統(tǒng)狀態(tài)、業(yè)務(wù)情況,并向組進(jìn)行報告。
處置結(jié)束階段,主備系統(tǒng)倒切完成后,確認(rèn)系統(tǒng)狀態(tài)、業(yè)務(wù)情況正常后,應(yīng)急處置小組組長向上級單位、 領(lǐng)導(dǎo)匯報應(yīng)急處置工作情況。
4 結(jié)論
軌道交通自動售檢票系統(tǒng)線網(wǎng)管理中心的建設(shè),提高了基礎(chǔ)設(shè)施資源的利用率,實(shí)現(xiàn)了鄭州軌道信息化基礎(chǔ)設(shè)施資源的統(tǒng)一規(guī)劃、統(tǒng)一建設(shè)、按需調(diào)配、即需即用、有效共享。采用雙活中心的容災(zāi)方案,可更大程度 保證業(yè)務(wù)的連續(xù)性,也可有效保障災(zāi)難發(fā)生后,業(yè)務(wù)恢復(fù)的時效性。隨著技術(shù)的發(fā)展和建設(shè)需求,后續(xù)可繼續(xù)探索災(zāi)備中心建設(shè)的可能性。
作者簡介:
徐淑鵬(1969-),男,山東莘縣人,高級工程師,學(xué)士,現(xiàn)就職于鄭州地鐵集團(tuán)有限公司,主要從事地鐵 AFC系統(tǒng)建設(shè)的工作。
陳俊亞(1993-),女,河南周口人,助理工程師,碩士,現(xiàn)就職于鄭州地鐵集團(tuán)有限公司,主要從事地鐵 AFC系統(tǒng)建設(shè)的工作。
曹美閣(1989-),女,河南許昌人,工程師,碩士, 現(xiàn)就職于鄭州地鐵集團(tuán)有限公司,主要從事地鐵AFC系統(tǒng)建設(shè)的工作。
參考文獻(xiàn):
[1] 李中浩. 城軌互聯(lián)網(wǎng)票務(wù)系統(tǒng)建設(shè)指南[J]. 城市軌道交通, 2019, 37 (03) : 25 - 28.
[2] 王彪. 城軌云架構(gòu)下災(zāi)備方案研究[J]. 都市快軌交通, 2019, 32 (03) : 33 - 39.
[3] 趙晗, 陳琦, 高偉, 等. “互聯(lián)網(wǎng)+"技術(shù)在鄭州地鐵AFC系統(tǒng)中的應(yīng)用[J]. 都市快軌交通, 2017, (4) : 81 - 85.
[4] 顧洋, 陳青云. 移動支付在軌道交通自動售檢票系統(tǒng)中的設(shè)計與應(yīng)用[J]. 都市快軌交通, 2016, (6) : 114 - 119.
[5] 廖東玲. 深圳地鐵三期工程AFC系統(tǒng)建設(shè)與創(chuàng)新實(shí)踐[J]. 鐵路技術(shù)創(chuàng)新, 2016, (6) : 17 - 22.
[6] 張守芝. 軌道交通清分系統(tǒng)災(zāi)備升級方案研究[J]. 鐵道通信信號, 2016, 52 (012) : 72 - 76.
[7] 徐鐘全, 張見, 張寧, 等. 基于數(shù)據(jù)倉庫的ACC系統(tǒng)架構(gòu)方案探討[J]. 鐵路通信信號工程技術(shù), 2017, 14 (03) : 62 - 67.
[8] 顧洋, 陳青云. 基于雙活架構(gòu)的城市軌道交通自動售檢票系統(tǒng)設(shè)計[J]. 城市軌道交通研究, 2020, 23 (10) : 129 - 133.
[9] 湛維昭, 張森. 基于金融標(biāo)準(zhǔn)的移動支付技術(shù)在寧波軌道交通的應(yīng)用[J]. 都市快軌交通, 2017, (1) : 106 - 109.
[10] 李道全. 城市軌道交通自動售檢票系統(tǒng)多元化支付研究與應(yīng)用[J]. 都市快軌交通, 2019, (4) : 126 - 131
摘自《自動化博覽》2021年6月刊