2021年10月,杭州云棲大會(huì),阿里云正式對(duì)外推出自研磐久服務(wù)器家族,將基礎(chǔ)硬件創(chuàng)新與上層云產(chǎn)品軟硬件一體化,從而為客戶提供更多選擇,助力客戶業(yè)務(wù)創(chuàng)新。
2021年雙11、雙12期間,全新自研磐久服務(wù)器M系列首次上線運(yùn)行,應(yīng)用于電商等多個(gè)重要核心場景,順利支撐了電商業(yè)務(wù)的峰值流量,性能和穩(wěn)定性均超預(yù)期。
從云棲首發(fā)到兩次電商流量洪峰考驗(yàn),阿里云加大底層基礎(chǔ)技術(shù)的自研邏輯是什么?磐久服務(wù)器M系列是什么?有何獨(dú)特技術(shù)優(yōu)勢?筆者帶您一起走進(jìn)磐久服務(wù)器M系列研發(fā)背后的故事。
從云棲大會(huì)首次發(fā)布,到順利通過雙11、雙12兩次電商流量洪峰考驗(yàn),磐久服務(wù)器M系列不僅證明阿里云實(shí)現(xiàn)業(yè)界最快的ARM架構(gòu)服務(wù)器自研和業(yè)務(wù)上線運(yùn)行,更是阿里云服務(wù)器研發(fā)團(tuán)隊(duì)多年來砥礪創(chuàng)新、深耕自研的結(jié)果。
2014年,阿里云服務(wù)器團(tuán)隊(duì)開始在內(nèi)部針對(duì)ARM架構(gòu)在數(shù)據(jù)中心上的應(yīng)用進(jìn)行探索,業(yè)內(nèi)所有面向數(shù)據(jù)中心的ARM處理器都在阿里的核心產(chǎn)品和業(yè)務(wù)場景中進(jìn)行過測試調(diào)優(yōu)和驗(yàn)證,當(dāng)時(shí),阿里積累了豐富的應(yīng)用經(jīng)驗(yàn)和大量性能數(shù)據(jù),成為國內(nèi)針對(duì)ARM架構(gòu)在數(shù)據(jù)中心應(yīng)用探索的先行者之一。
“研發(fā)最開始是一股熱情,但到后面發(fā)現(xiàn)困難重重”,阿里云服務(wù)器研發(fā)資深專家陳義全回憶研發(fā)初期說到。研發(fā)小組面臨的第一個(gè)挑戰(zhàn)是對(duì)如何對(duì)原有MySQL數(shù)據(jù)庫、ODPS、機(jī)器翻譯、電商交易等應(yīng)用進(jìn)行大規(guī)模代碼移植、適配和調(diào)優(yōu),當(dāng)時(shí)可沒有如今高級(jí)的AI工具幫忙,幾乎所有的代碼移植和適配工作都得靠研發(fā)小組手動(dòng)操作。例如,MySQL應(yīng)用驗(yàn)證初期遇到整機(jī)吞吐性能只有主流平臺(tái)50%問題,陳義全帶領(lǐng)團(tuán)隊(duì)幾乎從零開始,深入分析源碼和熱點(diǎn)函數(shù),結(jié)合ARM架構(gòu)特點(diǎn),快速找到瓶頸點(diǎn),并使用ARM匯編重寫了部分MySQL內(nèi)核時(shí)間、鎖等函數(shù),最終實(shí)現(xiàn)整機(jī)吞吐與主流平臺(tái)持平。
研發(fā)團(tuán)隊(duì)通過攻克一個(gè)個(gè)難題,積累了豐富的性能數(shù)據(jù)和寶貴的實(shí)踐經(jīng)驗(yàn),為后續(xù)自研服務(wù)器和處理器的設(shè)計(jì)鏟平了很多障礙,開創(chuàng)性地解決了眾多難題,并在2016年實(shí)現(xiàn)了部分自有業(yè)務(wù)在ARM架構(gòu)上小規(guī)模運(yùn)行,用很短的時(shí)間實(shí)現(xiàn)了阿里云服務(wù)器歷史性飛躍。
2021年云棲大會(huì)上,阿里云正式發(fā)布自研磐久服務(wù)器家族。其中包括磐久高性能計(jì)算、磐久高性能存儲(chǔ)和磐久大容量存儲(chǔ)三大系列。但磐久服務(wù)器-M系列又是什么呢?M系列是磐久服務(wù)器中ARM架構(gòu)專屬分類,未來會(huì)全面覆蓋高性能計(jì)算,高性能存儲(chǔ),和大容量存儲(chǔ)等機(jī)型。
阿里云為什么要全面自研磐久服務(wù)器呢?這應(yīng)該要從今天的云計(jì)算趨勢說起。
近幾年來,云原生業(yè)務(wù)呈現(xiàn)爆發(fā)式增長,給企業(yè)原有的基礎(chǔ)設(shè)施帶來了很大挑戰(zhàn)。廣義云原生是指因云而生的軟件、硬件和業(yè)務(wù)架構(gòu)。而落到基礎(chǔ)設(shè)施這個(gè)層面,主要的挑戰(zhàn)則是,基礎(chǔ)設(shè)施要真正具備敏捷、彈性、高穩(wěn)定性和高利用率等特性。
說起云原生大家都不陌生,但對(duì)于云原生硬件或云原生服務(wù)器基礎(chǔ)設(shè)施的解讀,業(yè)界說法不一。在陳義全看來,“說到底,云原生服務(wù)器基礎(chǔ)設(shè)施,就是面向云業(yè)務(wù)場景的需求,深挖IaaS層面,通過軟硬件一體化,實(shí)現(xiàn)極致性能和極致可靠性,真正做到硬件資源彈性,而不僅僅客戶看到的資源彈性?!?/p>
今天,數(shù)據(jù)中心的算力需求和2014年已完全不同。這幾年來,陳義全和其研發(fā)團(tuán)隊(duì)一路向前,如今已拉通業(yè)務(wù)、產(chǎn)品和硬件研發(fā)三線團(tuán)隊(duì),基于前端客戶對(duì)云原生業(yè)務(wù)的需求分析,以及最新的服務(wù)器架構(gòu)和芯片的潛心打磨,最終落地阿里云磐久服務(wù)器-M系列。
如何讓業(yè)務(wù)更加簡單,整個(gè)算力資源更加彈性和快速,整個(gè)基礎(chǔ)設(shè)施或者整個(gè)業(yè)務(wù)運(yùn)行更加穩(wěn)定,這正是阿里云一直追求的。而做到這一切,則需要打造適合云原生的服務(wù)器、網(wǎng)絡(luò)以及數(shù)據(jù)中心,大幅提升計(jì)算和存儲(chǔ)效率,實(shí)現(xiàn)云原生所需的極致彈性和性價(jià)比。作為云產(chǎn)品的基礎(chǔ)底座,過去幾年,阿里云基礎(chǔ)設(shè)施團(tuán)隊(duì)通過自主研發(fā)持續(xù)重構(gòu)軟硬件之間的系統(tǒng)接口,部件和整機(jī)系統(tǒng),打造最高效的服務(wù)器和網(wǎng)絡(luò)基礎(chǔ)設(shè)施。聚焦到服務(wù)器技術(shù)領(lǐng)域,阿里云基礎(chǔ)設(shè)施走過了小型機(jī)、行業(yè)標(biāo)準(zhǔn)服務(wù)器、規(guī)格定制服務(wù)器和自研云原生服務(wù)器這幾個(gè)時(shí)代,最新的磐久服務(wù)器-M系列則是目前云原生時(shí)代最新的服務(wù)器技術(shù)實(shí)踐之一。
如何設(shè)計(jì)最高效的服務(wù)器硬件系統(tǒng)和CPU以獲取最佳的處理能力和高能效比,是業(yè)界自研服務(wù)器所面臨的最大挑戰(zhàn),但這對(duì)于阿里云來說反而是最大的優(yōu)勢。
阿里云在自研云原生服務(wù)器和定制處理器上具有很長的歷史積累和技術(shù)沉淀。首先,基于云計(jì)算對(duì)云服務(wù)器和處理器的要求,阿里云聯(lián)合業(yè)內(nèi)主流處理器供應(yīng)商開展了多代的處理器定制,獲取了基于業(yè)務(wù)場景的遠(yuǎn)高于主流處理器的價(jià)值收益。其次,阿里巴巴百萬級(jí)在線服務(wù)器規(guī)模,有各種應(yīng)用場景下的性能模型和成本模型,而豐富的業(yè)務(wù)場景,如彈性計(jì)算,云存儲(chǔ),大數(shù)據(jù)及分布式系統(tǒng)等方面積累了海量的性能數(shù)據(jù)和歷史問題總結(jié)經(jīng)驗(yàn),這些數(shù)據(jù)沉淀為云原生服務(wù)器和處理器的設(shè)計(jì)提供了系統(tǒng)架構(gòu)和微架構(gòu)的指導(dǎo)。
今天,阿里巴巴豐富的業(yè)務(wù)場景和客戶需求對(duì)云計(jì)算技術(shù)基礎(chǔ)提出了極致性能和高能效的要求,而阿里云磐久M服務(wù)器發(fā)布則為全棧云基礎(chǔ)設(shè)施填補(bǔ)上了最基礎(chǔ)的一環(huán)。通過將服務(wù)器架構(gòu)、軟硬件協(xié)同、操作系統(tǒng)、數(shù)據(jù)庫和中間件等基礎(chǔ)軟硬件能力有機(jī)結(jié)合,并通過阿里巴巴上層紛繁復(fù)雜的業(yè)務(wù)場景錘煉,必將為用戶提供更具性價(jià)比的云計(jì)算資源和更易落地的云服務(wù)解決方案,為客戶創(chuàng)造價(jià)值共同成長。
您的電子郵件地址不會(huì)被公開,必填項(xiàng)已用 * 標(biāo)注。
提交評(píng)論
Δ
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲(chǔ) 粵ICP備2021121885號(hào)網(wǎng)站地圖