台灣 AI 雲建置推手!雙子星雲端如何串接起台灣最大的公有雲端平台?

Apr 7, 2022

台灣 AI 雲建置推手!雙子星雲端如何串接起台灣最大的公有雲端平台?


為了解決台灣近年國內發展人工智慧所需高速計算以及儲存資源不足的問題,國網中心(國家實驗研究院國家高速網路與計算中心)在國家前瞻基礎建設計畫支持下,建構「雲端服務及大數據運算設施暨整合式階層儲存系統建置案」,當中除了台灣首座 AI 超級電腦台灣杉二號之外,最令人注目的,就是國家級大數據人工智慧雲端平台 – TWCC,而雙子星雲端在此平台中扮演中堅技術角色! 近年來台灣的雲端建置案中,TWCC 的整合複雜性堪稱是最複雜的雲端系統建置案之一。雙子星雲端透過自行開發的 GOC PaaS 平台,整合了高速運算超級電腦(HPC)、容器運算服務(Kubernetes、Docker)、虛擬機器運算服務(OpenStack、VM)、分布式軟體定義儲存系統(Ceph)、平行檔案儲存系統(GPFS),以及國網中心本身的帳號服務系統(iService),在使用情境上也需要做上述資源的整合,才能夠提供使用者以最簡便的方式取得其資源。 但單純的整合還不夠,雖然說是公有雲使用情境,但仍需要考量資源有限的狀態,架構面上也需要考慮異地資源整合,以便未來在不同地區新建的運算、儲存資源,都可以一併在此平台上被使用者取得。如今TWCC已可以在平台上選取不同地域的機房資源,未來也可擴充到其他地域,提供各方客戶彈性選取資源!


頂尖橫向整合與資源調度技術力


在 TWCC 系統中,串起整個運算與儲存基礎建設的 GOC PaaS 與 API Gateway,就是由雙子星雲端負責。此案在運算服務上分為虛擬機、容器與高效能運算主機(High Performance Computing, HPC) ,儲存服務則為 GPFS 檔案系統、區塊與物件儲存,網路服務則整合了虛擬網路、附載平衡器、虛擬防火牆與 VPN。雙子星雲端整合了以上的運算、儲存與網路服務,讓這台灣最大的公有雲平台 - 內建高達 1500 片的 NVidia V100 GPU 與 120PB 物件儲存資源空間,可以像國際級的公有雲平台一樣,幫助使用者以 API 介面直接取得資源,來運行 AI 與大數據所需的服務。

雙子星雲端技術副總彭彥博表示:「整個 TWCC 系統是由多個不同廠商所負責的軟體模組堆疊而成,彼此之間有許多功能需要介接整合,而 PaaS 與 API Gateway 又是整個平台串接的核心。這兩個軟體模組對上承接從 Web Portal 而來的 API 請求,進行認證、稽核和流量管控,對下則根據商務邏輯,將 API 請求導向對應的 IaaS 系統,這中間有許多複雜的串接流程需要處理,我們需要廣泛了解各個模組的功能與介面規格,才能夠順利串接提供服務給使用者,這就是我們的技術能量。」

雙子星雲端早期注重在 OpenStack 這套以虛擬伺服器為主的開源雲端軟體上,至 2017 年開始支援 Kubernetes 容器管理系統,基於對這兩個平臺豐富的經驗,讓雙子星雲端得已在此建置案中扮演非常重要的角色。除此之外,為了讓 HPC 主機能夠在容器環境發揮更好的效能,雙子星團隊也特別研發了 HPC 專用的 PaaS 模組,內建 Slurm 與 Singularity 這兩套 HPC 主流的資源調度器與容器,讓習慣直接使用 HPC 的 AI 科學家們,可以用最貼近他們習慣的操作方式使用台灣首座 AI 超級電腦資源。

TWCC台灣AI雲,透過世界排名Top20的高速運算主機,提供產業界世界級的運算與儲存資源,是台灣發展 AI 技術的重要基石
TWCC台灣AI雲,透過世界排名Top20的高速運算主機,提供產業界世界級的運算與儲存資源,是台灣發展 AI 技術的重要基石


從不可能到實踐落地,透過軟體實力整合台灣最大公有雲平臺


建置公有雲平台,除了要考慮系統整合,以及資源調度問題之外,更重要的是有效的認證授權機制,包含身份驗證(Authentication)、授權(Authorization)、計費(Accounting)方面,都需要經過詳細的評估與檢驗,這部分則大多經由雙子星雲端的 API Gateway 來做第一線把關。當中驗證與授權部分必須搭配 GOC PaaS 整合各個子系統,在計價部分也需要整合用戶在不同資源上使用的狀況,推送相應的資料到國網中心 iService 帳務系統內,以便對用戶扣除費用,以及提供帳單等資訊。

雙子星一直以來均注重在雲端系統的建置上,而上述的 API Gateway 正是為了 TWCC 所催生出來的新服務。早在 2017 年時,雙子星雲端就與國網中心有了初步的接觸,當時台灣較少廠商釋出商用 API Gateway,因此雙子星提供了 API Gateway 諮詢與顧問服務,也成為了目前 TWCC 中的重要模組。現在 TWCC 的 Web Portal 中,大部分功能均透過 API Gateway 所提供的 API 進行開發,底下承接了 GOC PaaS 以及國網中心本身的 iService 帳號系統,若有任何客戶想在 TWCC 上營運 AI 服務,也可直接透過 API Gateway 串接,以最安全、有效率的方式對外提供服務。


連續三年持續提供服務,雙子星雲端為台灣 AI 雲締造最佳口碑


從 2018 年建置案啟動至今,雙子星雲端一直在 TWCC 內扮演重要的技術角色,從一開始的整合、建置,到現在的技術服務與諮詢,雙方一直都持續緊密的合作。彭彥博肯定地表示:「維運比建置更重要!TWCC 在正式營運的這幾年,功能仍不斷地在更新,如何在維持系統穩定度的前提之下,持續更新系統功能,是我們這幾年最重視的事情。」

TWCC 這座台灣最大的公有雲平台,透過簡便的 Web 介面向使用者提供世界級的運算服務,中小企業不需要花費高昂的成本建置昂貴的 GPU 運算中心,即可享受頂尖的運算與儲存服務。促成這樣便利使用情境的,正是雙子星雲端基於多年於雲端領域的經驗與技術,協助 TWCC 這座台灣最大的公有雲平台,透過簡便的 Web 介面向使用者提供世界級的運算服務,中小企業不需要花費高昂的成本建置昂貴的 GPU 運算中心,即可享受頂尖的運算與儲存服務。


關於雙子星雲端


雙子星雲端為 CNCF 會員,是 CNCF 所認證的 Kubernetes 服務提供商,在雲端技術擁有十多年以上的經驗,為台灣雲端技術早期領先者。目前為國家級 AI 雲平台 - TWCC 的軟體與 Kubernetes 技術與服務提供商,更是諸多企業與單位導入容器與管理平台的最佳夥伴。

雙子星雲端除了既有的產品 Gemini AI Console 與 GOC API Gateway 之外,也提供企業諮詢與導入雲原生與 Kubernetes 相關技術服務,協助企業擁抱 Cloud Natvive,達到數位轉型的目標。