I/O 2022:谷歌推出全管理型AlloyDB數據庫 效率較PostgreSQL競品翻番

在 I/O 2022 開發者大會首日,Google 隆重推出了名為 AlloyDB 的全託管式 PostgreSQL 數據庫。與亞馬遜雲服務(AWS)的 Aurora PostgreSQL 競品相比,Google 宣稱 AlloyDB 具有翻倍的效率。此外在相同的工作負載下,AlloyDB 的運行效率可達標準 PostgreSQL 的四倍、分析查詢的速度也快了百倍。

1.jpg

熟悉 Google Cloud 生態的開發者,或許不會對全管型 PostgreSQL 數據庫服務感到陌生。

此前該公司已經為 PostgreSQL 和 Spanner 提供了 CloudSQL,且 Google Cloud 的全管理關係數據庫服務也提供了 PostgreSQL 兼容接口。

AlloyDB 的核心,仍基於標準的 PostgreSQL 數據庫來實現。只是為了能夠充分發揮谷歌自家基礎設施的實力,開發團隊才對於其內核進行了修改、同時努力保持在最新的版本狀態。

2.jpg

在 AWS 工作了很長一段事件后,Andi Gutmans 於 2020 年跳槽到了 Google、並擔任數據庫產品的主管兼工程副總裁。

他表示,儘管 Google 在幫助企業將 MySQL 和 PostgreSQL 遷移到雲端的工作中提供了很大的幫助,但還是未能充分照顧到那些想要遷移其遺留數據庫(比如 Oracle)到開源服務的部分客戶。

究其原因,是因為許多企業用到了不止一個雲服務提供商,同時希望能夠儘可能靈活地在任何地方運行。在拖延了多年後,目前正有越來越多的客戶願意投入資源來擺脫相關束縛。

隨着 Postgres 的崛起(以及 MySQL 的衰落)、並逐漸成為開源關係數據庫的事實標準,Google 推動客戶向專用的高性能 PostgreSQL 服務遷移的動力也變得更加充足。

3.jpg

Gutmans 補充道:許多 Google 客戶正希望將他們的關係數據庫用於分析用例,因而該 AlloyDB 開發團隊耗費了大量的精力來確保 Postgres 能夠為這部分用戶帶來更好的性能體驗。

在 AWS 工作期間,他曾帶領過 AWS 諸多分析服務的管理工作,有機會了解到數據對客戶的重要性和關鍵性、並且積攢下了深厚的技術背景。

不過隨着行業風向的轉變,與之交談的不再一定是一線開發人員 —— 甚至不少客戶來自業務部門、或以分析師的身份來接洽。

在看到現實世界在如此融合的同時,他也切實感受到了用戶希望從他們的數據中獲得實時的洞察力。

4.jpg

回到技術底層,可知 AlloyDB 建立在 Google 現有的基礎架構之上、可將計算和存儲剝離開來 —— 與運行 Spanner、BigQuery 和幾乎所有 Google 服務的基礎架構層類似。

除了專註於 PostgreSQL 的 AlloyDB,相關服務也已在競爭中佔據了相當大的優勢。然而在努力支持多個數據庫引擎 / 查詢語言的時候,你並不總能開展面面俱到的優化。

鑒於企業要求使用 Postgre 來遷移這些遺留數據,Google 最終決定在該領域做到頂尖。通過內核級的更改,該團隊已實現超過 64 個虛擬內核的線性擴展。

而在分析方面,AlloyDB 團隊也打造了一套基於機器學習的定製緩存服務來學習客戶的訪問模式。然後將 Postgres 的行格式轉換為內存中的列格式,以顯着提升執行的效率。

(0)
上一篇 2022-05-12 14:23
下一篇 2022-05-12 14:23

相关推荐