AWS首席雲計算企業戰略顧問張俠:談談AWS雲計算的深度和廣度
2020年03月31日18:11

原標題:AWS首席雲計算企業戰略顧問張俠:談談AWS雲計算的深度和廣度

【TechWeb】3月31日消息,在AWS專家論道上,AWS首席雲計算企業戰略顧問張俠發佈題為《談談AWS雲計算的深度和廣度》的署名文章。

在這篇文章中,張俠就AWS雲計算的特點、優勢等進行了深入闡述,試圖勾畫出AWS雲計算這一全球收入超350億美元業務的全貌。

以下為《談談AWS雲計算的深度和廣度》全文:

2019年,AWS全年收入超過350億美元。當前,AWS已經成為一項預期年收入超過400億美元的業務。從業務收入、客戶總量、行業頭部客戶數量多個方面來看,AWS的業務體量遙遙領先其它雲服務商。不太瞭解AWS的人經常會問,AWS跟別的雲服務商究竟有什麼不一樣?有些人甚至在心裡暗想,雲計算發展這麼多年,AWS能做到的,其它雲服務商也能做得差不多吧?AWS能夠保持這些優勢,會不會只是客戶慣性使然?

實際上,客戶的眼睛一定是雪亮的。客戶選擇雲服務商,是用金錢在投票,甚至要以CIO的職業生涯為賭注。AWS能夠得到這麼多客戶青睞,是因為它在很多方面有著獨特之處。

客戶為什麼上雲

客戶之所以上雲,主要有三個原因:一是雲計算帶來的敏捷性;二是雲計算帶來的彈性;三是節省成本。

雲計算的敏捷性主要是跟傳統IT方案相比。使用雲計算,當有業務需求時,幾分鍾就可以獲得所需要的IT資源,按需使用,不像傳統IT方案,需要立項、選型、招標、採購、發運、安裝、配置等複雜的流程;而且當業務不再需要時,馬上就可以退掉相關的IT資源,按使用付費,不像傳統IT方案,留下一堆IT設備,閑置浪費。

雲計算的彈性,跟敏捷性有類似之處,業務有淡季旺季,一天中有波峰和低穀,當業務量增加時,可以隨時增加IT資源,當業務量下降時,可以隨時縮減IT資源。

雲計算節省成本,則跟彈性和敏捷性都有關係。通過雲計算的敏捷性,可以減少資源閑置和浪費,節省成本,可以節省時間成本以及業務快速上市帶來的機會成本。通過雲計算的彈性,不用為了業務的潛在增長預留IT資源,節省IT資產投資成本和新技術折舊成本。在傳統IT模式下,IT基礎設施建設往往要考慮1-3年的成長。

您可能會想,這些節省下來的成本都被雲服務商賺走了吧。拿買房跟租房打個比方,租房的話,每月交了不少房租,若干年下來還是一無所有。首先,雲服務跟租房有一個本質的差別在於,房子通常是保值、增值的,而IT資產是加速貶值的。設想一下,如果有一天,我們可以預期到房子會不斷貶值,相信很多人都會選擇租房,而不是買房了。把買房的錢用於生產或投資,收益比付出去的房租高得多。

客戶為什麼選擇AWS

眾多客戶之所以選擇AWS,首先是因為AWS作為全球雲計算的開創者和領導者,在上述三個方面都到了當前的極致。例如敏捷性,AWS能夠讓客戶在雲的使用上更方便、更快捷;例如彈性,AWS能夠讓客戶能夠獲得更大、更自動化的彈性;例如,節省成本,AWS可以讓客戶獲得更高的性價比, AWS引領了雲服務商薄利多銷的潮流,主要依靠規模經濟獲得效益,並不斷降低價格,把節省下來的成本讓利給客戶。截至2020年1月24日,AWS已經降價80次。

此外,AWS還有另外三個優勢:一是AWS服務的廣度和深度;二是AWS的全球覆蓋;三是AWS的豐富經驗。

AWS服務的廣度和深度,是指AWS提供的雲服務非常多,雲服務的功能強大。企業和機構在IT建設和運維中遇到的重複性勞動, 只要具備一定的共性,也就是有客戶需求,AWS都會儘可能想辦法通過雲服務的方式,幫助客戶解決,減輕客戶的負擔,讓客戶集中精力開展業務。

全球覆蓋方面,以AWS為例,AWS的雲基礎設施遍及22 個地理區域的69個可用區(AZ),並已公佈計劃在印尼、意大利、日本、南非和西班牙新建5個AWS區域、16個可用區。在地理區域和可用區之外,AWS還有邊緣站點,進一步延伸AWS的全球覆蓋。截至2019年12月,AWS在全球有210 個邊緣站,分佈在 37 個國家/地區的 78 個城市。

在經驗方面,AWS做雲計算的時間比其它雲服務商早2年以上。AWS於2006年3月正式對外提供雲服務,而其它雲服務商最早在2008年才推出預覽版。推出的時間早,運營規模大,客戶、合作夥伴、開發者數量多,讓AWS積累了別人沒有的經驗。用AWS CEO Andy Jassy的話說,“經驗是沒有壓縮算法的”。例如,有些IT故障、軟件錯誤只有到了一定的規模才會出現,雲服務商如果沒有在那樣的規模運營過,就不會獲得避免如此故障的經驗。

獵豹移動是中國移動互聯網公司出海的成功者,也是AWS的深度用戶,總是樂意使用AWS的新服務、新功能,踐行“專業的人做專業的事”。所使用的AWS雲服務包括Amazon EC2、Amazon S3、Amazon EC2 Auto Scaling、Amazon ECS、Amazon EKS、Elastic Load Balancing (ELB)、AWS Lambda、Amazon Elastic Inference、AWS Shield Advanced、AWS WAF、Amazon CloudFront、AWS Global Accelerator、Amazon CloudWatch、AWS Systems Manager等。

作為資深用戶,獵豹移動運維總監朱軍對AWS的深刻體會是,AWS的API接口功能和文檔非常完善。他介紹說,獵豹移動使用了AWS全球幾乎所有的區域,信息基礎架構非常龐大,通常使用AWS多達幾千個實例的規模。通過調用AWS提供的標準API接口,可以把接口信息抓取到獵豹移動自己開發的運維平台,進行統一管理,便於在自己的運維平台進行資源的創建、運行監測和狀態顯示。相比之前遇到的接口信息經常變更的問題,運維團隊抓取信息不準確,很可能導致運維人員對資源的管控失效。“AWS的接口信息描述非常清晰,向下兼容,只需要在第一次使用時編寫相關代碼即可,運維管理非常方便。” 雲服務商的規模是一個很重要的考量因素。朱軍感慨地說,“獵豹移動的應用規模比較大,但AWS擁有服務眾多超大規模用戶的成功經驗,能夠為我們的使用和需求提供穩定保障。”

這裏我們以雲服務的廣度和深度為例,深入具體地看一看AWS跟其它雲服務商相比的不同之處。

廣度:IT需求一網打盡

所謂廣度,是指AWS提供的雲服務多,覆蓋範圍廣。目前AWS提供超過 175 項的雲服務,涵蓋計算、存儲、數據庫、網絡、大數據分析、機器人、機器學習與人工智能、物聯網、安全、虛擬現實與增強現實、媒體(音視頻)、衛星、量子技術等19大類。如果您有興趣,可以比較一下,就發現AWS的有些雲服務,其它服務商是沒有的。這些服務是基於客戶需求開發出來的,可以很好地滿足從新創公司到傳統企業的各種需求。客戶需求不斷髮展,AWS每一項服務都會不斷迭代新功能,也會根據客戶需求不斷推出新的服務。

AWS 2019年12月宣佈推出的量子計算服務Amazon Braket,可以說是AWS雲服務廣泛的一個典型代表。Amazon Braket(已發佈預覽版)是一項完全託管的雲服務,讓科學家、研究人員和開發者能夠在一個地方開始試驗來自量子硬件提供商(包括 D-Wave、IonQ 和 Rigetti)的計算機。

眾所周知,量子計算有可能解決經典計算機無法企及的計算問題,例如改變儲能、化學工程、材料科學、藥物發現、工藝優化和機器學習等領域的計算模式。不過,量子計算應用迄今主要局限於概念驗證研究階段,實際應用有限,但一些AWS客戶已經準備開始探索量子計算、獲取經驗。然而,客戶目前很難跟量子計算機打交道。特別是,如果他們想要評估不同的早期技術,每種技術都有自己的開發、仿真和測試環境,如果客戶沒有機會發展必要的技能,就很難確定量子計算何時能帶來好處,很難瞭解如何設計算法,很難發現新應用。為此,AWS 推出了 Amazon Braket 服務,還成立了亞馬遜量子解決方案實驗室,以便客戶能夠立即開始學習和試驗量子計算。

可以說,只要客戶有需求,AWS就會想辦法推出新的服務,降低客戶的技術門檻,簡化客戶的勞動。

深度:計算服務的例證

所謂深度,是指AWS雲服務的功能很強。這一點是最不容易說清楚的。當然,也還是能夠說清楚的。不過可能涉及到一些技術細節,需要您耐心看下去。

我們以計算服務為例,看看提供了多麼深入的雲服務。不太熟悉技術的人可能認為,雲計算就是提供虛擬的雲主機,或者叫雲服務器。實際上,僅就計算服務方面,AWS就提供了14大項服務,包括實例(雲主機)、容器和網絡等三個方面,每一項服務又包括很多功能。

一、275種實例:豐富的、功能強大的規格選擇

275種實例相當於275個不同的服務器型號。AWS總是創新地融合CPU、內存、存儲、GPU、網絡等方面的最新技術,甚至自己定製芯片,研發出新的實例類型,向客戶提供。從大的方面來說,這275種實例分為通用型、計算優化、內存優化、加速計算、存儲優化五個類別,適用於客戶不同的計算需求,每一個類別又分為不同的型號,更精準地滿足客戶需求,最大限度減少IT資源浪費。例如,某個應用只需要超大容量內存,就可以選擇超大內存的實例;需要GPU加速,就可以選擇不同規格的計算加速實例。

AWS第一時間採用內核頻率高達 4.0GHz、目前雲中速度最快的CPU處理器,推出了Amazon EC2 z1d 實例,它兼具高計算性能和高內存的特點,方便那些運行電子設計自動化 (EDA)、遊戲以及某些關係數據庫負載的客戶。

AWS第一時間採用新一代的NVIDIA T4 GPU和AWS定製的Intel Cascade Lake CPU,推出了Amazon EC2 G4dn實例,方便客戶部署機器學習模型。

講兩個AWS通過技術創新增加實例類型的例子:一個是AWS Nitro 系統; 一個是AWS定製芯片。

Amazon Elastic Compute Cloud (Amazon EC2) 實例是AWS最基礎的計算實例。2017年12月,AWS發佈AWS Nitro系統,它如今是新一代Amazon EC2實例的基礎平台。Nitro系統包含了定製的專用Nitro芯片、Nitro卡、Nitro虛擬機管理程式(Hypervisor)等一系列軟硬件創新。

基於AWS Nitro系統,AWS實現了計算實例的快速創新,實例類型比兩年前多了 4 倍,進一步為客戶降低了成本。此外,AWS Nitro系統還能帶來增強實例的安全性等一系列益處。去年12月,AWS推出了AWS Nitro Enclaves功能,在同一物理主機的不同實例之間創建額外的CPU和內存隔離,進一步保護Amazon EC2 實例中高度敏感的數據,例如個人身份信息、金融數據、醫療保健數據等。

AWS 還通過定製芯片,推出性能卓越、性價比高的實例。

AWS Inferentia是專用於機器學習推理的芯片,基於這款芯片推出的Amazon EC2 Inf1實例,讓客戶可以實現雲中成本低、高性能的機器學習推理應用,特別適合在生產環境中大規模運行機器學習推斷。

AWS Graviton2是AWS推出的新一代ARM芯片,基於這款芯片的Amazon EC2 M6g、R6g 和 C6g實例,跟當前基於 x86芯片的實例相比,性價比高出40%,如果客戶的應用可以運行在ARM上,就可以選擇這些類型的實例。

二、容器服務:高級的雲計算功能

容器技術是當前IT界比較熱門的技術,開發一個新應用的時候,通過使用容器技術,可以方便地把應用打包封裝在容器內,從開發測試環境部署到生產環境,直接運行,不需要費時費力地分別搭建安裝測試環境和生產環境。

但是,在基礎的計算實例上、基於開源的容器工具進行容器的編排和管理,仍然需要較強的技術能力,需要費不少功夫。AWS便開發了容器服務,幫助客戶簡化這一部分工作。

在Amazon EC2實例的基礎上,AWS提供了豐富的容器功能。容器有兩個主要的分支:一個是Docker,一個是Kubernetes (又稱K8s)。AWS的Amazon Elastic Container Service (Amazon ECS) 是深度集成Docker的容器服務, Amazon Elastic Kubernetes Service (Amazon EKS)是面向K8s的容器服務。

客戶在AWS申請Amazon EC2實例,然後在上面運行容器服務,讓部署和管理容器的工作大大簡化。因此,AWS提供的容器服務深受客戶歡迎。IDC一份報告顯示,雲中 81%的容器都在 AWS 上運行。而云原生計算基金會(CNCF)的統計,當今雲中 84% 的 K8s 工作負載在 AWS 上運行。

更進一步,AWS推出一項新服務AWS Fargate。它允許客戶運行容器時,服務器(Amazon EC2)集群也不需要操心了,直接把整個AWS當成一個透明的計算資源,通過AWS Fargate表明需要使用什麼樣的容器、使用多少容器就可以了。AWS Fargate 使得客戶的工作更加便捷,無需要在任務級別預置和管理服務 器,可以專注於構建應用程式。

三、高速網絡互聯:保障總體的應用體驗

把應用部署在雲上,應用和數據可能位於不同的可用區、不同的地理區域,相互之間要通信,網絡是一個關鍵。

北京雲中融信網絡科技有限公司(以下簡稱“融雲”)是AWS的客戶,在海外和中國都使用了AWS。融雲的主要業務是,為開發者和企業提供覆蓋全球的即時通訊和實時音視頻通信雲服務,覆蓋社交、直播、金融、交通運輸、教育、電商、醫療等多個行業領域。通信雲服務對網絡的要求非常高,網絡時延的任何波動馬上就可能引起用戶的量化投訴。在中國選擇雲服務商時,融雲曾經對主要雲服務商的網絡進行測試,測試雲服務商的內網,在幾十台機器間相互打流量,觀察網絡整體運行情況。融雲CTO楊攀介紹說,“如果雲服務商的內網連接質量差,意味著當流量比較大時,(融雲的服務)可能出現服務崩潰。”那一次,融雲將各家服務商的表現分為 Tier1、Tier2、Tier3, AWS 中國區域達到了 Tier1,AWS 在這方面表現很好。

近些年,AWS與供應商緊密合作,並且進行了巨額投資,在數據中心網絡設備的關鍵技術上持續進行創新。2018年11月,AWS推出了EFA(Elastic Fabric Adapter)。它是一種用於 Amazon EC2 實例的網絡接口,讓客戶能夠在 AWS 上大規模運行高性能計算應用程式,例如計算流體動力學、天氣建模和油藏模擬等,這些應用需要在實例之間進行高級別的通信。

目前,AWS已為計算實例提供標準的100 Gbps網絡。Amazon EC2 C5n是網絡優化的實例,專用於匹配利用100G高速網絡,具有多達四倍於C5的資源。

AWS Transit Gateway (TGW) 是一種區域雲路由服務,客戶可以在其中對多達五千個VPC虛擬私有雲、VPN虛擬專用網實現高速互聯。通過這項服務,客戶可以構建高性能的、安全的全球私有網絡,使用 軟件定義廣域網(SD-WAN),輕鬆地通過 AWS 實現分支機構的連接。新推出的AWS Transit Gateway (TGW) Network Manager網絡管理功能,使用戶能夠方便地構建、運營和監控自己的全球私有網絡。

四、無服務器服務:徹底不用操心基礎的IT工作

除此之外,AWS發明了無服務器服務,推出叫AWS Lambda的雲服務,讓客戶徹底不用操心服務器配置修補、操作系統維護、數據庫維護和容量預置等等這些基礎設施管理任務,只要開發應用就可以了。

通過以上四個方面的介紹,我們看到,圍繞計算這一IT需求,AWS就提供了豐富、全面、深入的服務和功能。如果您去深入瞭解AWS每一個大類的服務,都會發現一片新的天地。當然,每一個客戶的需求不同,未必您會用到所有的服務和功能,但是當您需要使用某項功能是,您會欣喜地發現,AWS已經有成熟的雲服務在那裡,馬上就可以使用。如果您在AWS也沒有找到相應的服務,那也許這種服務在市面還不存在,可以反饋給AWS,讓AWS開發出來。

這就是AWS雲計算的廣度和深度。AWS能夠持續保持大幅領先,獲得幾百萬客戶的選擇。重要的原因之一就是AWS雲計算的廣度和深度。當然,如果進一步追溯AWS為什麼能夠保持這樣的廣度和深度,而不讓其它雲服務商很快追趕上,這就涉及到AWS以至整個亞馬遜的創新文化和創新基因了。德魯克研究會(Drucker Institute)最新評選出的2019年度美國最佳管理成效公司(America’s Best-Run Companies) 250強榜單,亞馬遜不僅名列總評分榜首,而且其創新單項的評分高達212.3,比第二名的102.4分高出一倍多。由於篇幅有限,關於AWS的創新,我們以後專文介紹。

關注我們Facebook專頁
    相關新聞
      更多瀏覽