2021年10月,杭州云棲大會,阿里云正式對外推出自研磐久服務器家族,將基礎硬件創(chuàng)新與上層云產品軟硬件一體化,從而為客戶提供更多選擇,助力客戶業(yè)務創(chuàng)新。
2021年雙11、雙12期間,全新自研磐久服務器M系列首次上線運行,應用于電商等多個重要核心場景,順利支撐了電商業(yè)務的峰值流量,性能和穩(wěn)定性均超預期。
從云棲首發(fā)到兩次電商流量洪峰考驗,阿里云加大底層基礎技術的自研邏輯是什么?磐久服務器M系列是什么?有何獨特技術優(yōu)勢?筆者帶您一起走進磐久服務器M系列研發(fā)背后的故事。
從云棲大會首次發(fā)布,到順利通過雙11、雙12兩次電商流量洪峰考驗,磐久服務器M系列不僅證明阿里云實現業(yè)界最快的ARM架構服務器自研和業(yè)務上線運行,更是阿里云服務器研發(fā)團隊多年來砥礪創(chuàng)新、深耕自研的結果。
2014年,阿里云服務器團隊開始在內部針對ARM架構在數據中心上的應用進行探索,業(yè)內所有面向數據中心的ARM處理器都在阿里的核心產品和業(yè)務場景中進行過測試調優(yōu)和驗證,當時,阿里積累了豐富的應用經驗和大量性能數據,成為國內針對ARM架構在數據中心應用探索的先行者之一。
“研發(fā)最開始是一股熱情,但到后面發(fā)現困難重重”,阿里云服務器研發(fā)資深專家陳義全回憶研發(fā)初期說到。研發(fā)小組面臨的第一個挑戰(zhàn)是對如何對原有MySQL數據庫、ODPS、機器翻譯、電商交易等應用進行大規(guī)模代碼移植、適配和調優(yōu),當時可沒有如今高級的AI工具幫忙,幾乎所有的代碼移植和適配工作都得靠研發(fā)小組手動操作。例如,MySQL應用驗證初期遇到整機吞吐性能只有主流平臺50%問題,陳義全帶領團隊幾乎從零開始,深入分析源碼和熱點函數,結合ARM架構特點,快速找到瓶頸點,并使用ARM匯編重寫了部分MySQL內核時間、鎖等函數,最終實現整機吞吐與主流平臺持平。
研發(fā)團隊通過攻克一個個難題,積累了豐富的性能數據和寶貴的實踐經驗,為后續(xù)自研服務器和處理器的設計鏟平了很多障礙,開創(chuàng)性地解決了眾多難題,并在2016年實現了部分自有業(yè)務在ARM架構上小規(guī)模運行,用很短的時間實現了阿里云服務器歷史性飛躍。
2021年云棲大會上,阿里云正式發(fā)布自研磐久服務器家族。其中包括磐久高性能計算、磐久高性能存儲和磐久大容量存儲三大系列。但磐久服務器-M系列又是什么呢?M系列是磐久服務器中ARM架構專屬分類,未來會全面覆蓋高性能計算,高性能存儲,和大容量存儲等機型。
阿里云為什么要全面自研磐久服務器呢?這應該要從今天的云計算趨勢說起。
近幾年來,云原生業(yè)務呈現爆發(fā)式增長,給企業(yè)原有的基礎設施帶來了很大挑戰(zhàn)。廣義云原生是指因云而生的軟件、硬件和業(yè)務架構。而落到基礎設施這個層面,主要的挑戰(zhàn)則是,基礎設施要真正具備敏捷、彈性、高穩(wěn)定性和高利用率等特性。
說起云原生大家都不陌生,但對于云原生硬件或云原生服務器基礎設施的解讀,業(yè)界說法不一。在陳義全看來,“說到底,云原生服務器基礎設施,就是面向云業(yè)務場景的需求,深挖IaaS層面,通過軟硬件一體化,實現極致性能和極致可靠性,真正做到硬件資源彈性,而不僅僅客戶看到的資源彈性?!?/p>
今天,數據中心的算力需求和2014年已完全不同。這幾年來,陳義全和其研發(fā)團隊一路向前,如今已拉通業(yè)務、產品和硬件研發(fā)三線團隊,基于前端客戶對云原生業(yè)務的需求分析,以及最新的服務器架構和芯片的潛心打磨,最終落地阿里云磐久服務器-M系列。
如何讓業(yè)務更加簡單,整個算力資源更加彈性和快速,整個基礎設施或者整個業(yè)務運行更加穩(wěn)定,這正是阿里云一直追求的。而做到這一切,則需要打造適合云原生的服務器、網絡以及數據中心,大幅提升計算和存儲效率,實現云原生所需的極致彈性和性價比。作為云產品的基礎底座,過去幾年,阿里云基礎設施團隊通過自主研發(fā)持續(xù)重構軟硬件之間的系統(tǒng)接口,部件和整機系統(tǒng),打造最高效的服務器和網絡基礎設施。聚焦到服務器技術領域,阿里云基礎設施走過了小型機、行業(yè)標準服務器、規(guī)格定制服務器和自研云原生服務器這幾個時代,最新的磐久服務器-M系列則是目前云原生時代最新的服務器技術實踐之一。
如何設計最高效的服務器硬件系統(tǒng)和CPU以獲取最佳的處理能力和高能效比,是業(yè)界自研服務器所面臨的最大挑戰(zhàn),但這對于阿里云來說反而是最大的優(yōu)勢。
阿里云在自研云原生服務器和定制處理器上具有很長的歷史積累和技術沉淀。首先,基于云計算對云服務器和處理器的要求,阿里云聯合業(yè)內主流處理器供應商開展了多代的處理器定制,獲取了基于業(yè)務場景的遠高于主流處理器的價值收益。其次,阿里巴巴百萬級在線服務器規(guī)模,有各種應用場景下的性能模型和成本模型,而豐富的業(yè)務場景,如彈性計算,云存儲,大數據及分布式系統(tǒng)等方面積累了海量的性能數據和歷史問題總結經驗,這些數據沉淀為云原生服務器和處理器的設計提供了系統(tǒng)架構和微架構的指導。
今天,阿里巴巴豐富的業(yè)務場景和客戶需求對云計算技術基礎提出了極致性能和高能效的要求,而阿里云磐久M服務器發(fā)布則為全棧云基礎設施填補上了最基礎的一環(huán)。通過將服務器架構、軟硬件協同、操作系統(tǒng)、數據庫和中間件等基礎軟硬件能力有機結合,并通過阿里巴巴上層紛繁復雜的業(yè)務場景錘煉,必將為用戶提供更具性價比的云計算資源和更易落地的云服務解決方案,為客戶創(chuàng)造價值共同成長。
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲 粵ICP備2021121885號網站地圖