分布式數(shù)據(jù)庫管理員(GaussDB & GoldenDB方向)
主要職責(zé):
1. 日常運維:
· 負(fù)責(zé)GaussDB和GoldenDB分布式數(shù)據(jù)庫集群的部署、安裝、升級、擴(kuò)容、備份恢復(fù)、性能調(diào)優(yōu)和故障排除。
· 分布式數(shù)據(jù)庫深度監(jiān)控與性能容量分析,設(shè)計并落實分布式數(shù)據(jù)自定義巡檢模板,定期/按需執(zhí)行數(shù)據(jù)庫健康
巡檢。
2. 自動化腳本開發(fā):
· 編寫和維護(hù) Ansible Playbooks、Shell/Python 腳本,實現(xiàn)平臺下發(fā)的各類運維操作(如安裝、啟停、切換、
檢查)。
· 確保腳本的健壯性、冪等性和詳細(xì)的日志輸出,便于平臺跟蹤任務(wù)狀態(tài)。
3. 環(huán)境檢查與集成:
· 開發(fā)各類檢查腳本(OS配置基線、數(shù)據(jù)庫參數(shù)一致性、高可用架構(gòu)靜態(tài)配置),并將結(jié)果標(biāo)準(zhǔn)化上報給平
臺。
· 深入理解GoldenDB/GaussDB的架構(gòu)和運維細(xì)節(jié),為平臺的功能設(shè)計提供專業(yè)建議。
4. 故障排查與處理:
· 當(dāng)平臺操作失敗時,進(jìn)行深度根因分析,是腳本問題、環(huán)境問題還是數(shù)據(jù)庫本身問題。
· 開發(fā)或整合故障自愈(Self-Healing)方案,如數(shù)據(jù)庫異常后的自動重啟與同步重建。
5. 安全與合規(guī): 負(fù)責(zé)運維腳本和平臺操作的權(quán)限控制、審計和合規(guī)性要求。
任職要求:
· 必備條件:
· 計算機(jī)科學(xué)或相關(guān)專業(yè)本科及以上學(xué)歷,3年以上運維或運維開發(fā)經(jīng)驗。
· 精通 Linux 操作系統(tǒng),能熟練進(jìn)行問題診斷和性能調(diào)優(yōu)。
· 精通 Ansible 或其它自動化配置管理工具,有大規(guī)模環(huán)境自動化部署經(jīng)驗。
· 精通 Shell/Python 腳本編程。
· 深入理解網(wǎng)絡(luò)、存儲、負(fù)載均衡等基礎(chǔ)設(shè)施原理。
· 具備良好的故障排查能力和抗壓能力
· 對GaussDB或GoldenDB的內(nèi)核機(jī)制有深入了解者。
· 優(yōu)先考慮:
· 有從零開始參與設(shè)計或開發(fā)數(shù)據(jù)庫管理平臺、自動化運維平臺經(jīng)驗者。
· 持有華為GaussDB或中興GoldenDB相關(guān)認(rèn)證者。
· 有大型金融、電信行業(yè)核心系統(tǒng)分布式數(shù)據(jù)庫運維經(jīng)驗者。