<noframes id="qeu0y"><ul id="qeu0y"></ul>

<strike id="qeu0y"></strike>

<abbr id="qeu0y"></abbr>

<center id="qeu0y"></center>

當前位置：首頁 > 公眾號精選 > 架構(gòu)師社區(qū)

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

時間：2020-08-24 14:26:06

關(guān)鍵字：榮耀大數(shù)據(jù)

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]許振文騰訊游戲增值服務(wù)部后臺開發(fā)組組長從事游戲大數(shù)據(jù)相關(guān)領(lǐng)域8年多，負責游戲數(shù)據(jù)分析平臺iData的架構(gòu)設(shè)計和關(guān)鍵模塊開發(fā)，為騰訊超過400款游戲提供高效快速的數(shù)據(jù)分析服務(wù)。中國通信研究院發(fā)布的微服務(wù)行業(yè)標準和分布式消息隊列技術(shù)標準的核心制定者

許振文

騰訊游戲

增值服務(wù)部后臺開發(fā)組組長

從事游戲大數(shù)據(jù)相關(guān)領(lǐng)域8年多，負責游戲數(shù)據(jù)分析平臺iData的架構(gòu)設(shè)計和關(guān)鍵模塊開發(fā)，為騰訊超過400款游戲提供高效快速的數(shù)據(jù)分析服務(wù)。
中國通信研究院發(fā)布的微服務(wù)行業(yè)標準和分布式消息隊列技術(shù)標準的核心制定者之一，Linux內(nèi)核之旅開源社區(qū)的負責人，Istio社區(qū)Member。
在分布式存儲，調(diào)度、多維數(shù)據(jù)分析、實時計算、事件驅(qū)動決策系統(tǒng)、微服務(wù)、ServiceMesh領(lǐng)域有豐富的實戰(zhàn)經(jīng)驗。

大家好我是許振文，今天分享的主題是《基于Flink+ServiceMesh的騰訊游戲大數(shù)據(jù)服務(wù)應(yīng)用實踐》，主要會分為以下四個部分進行分享：

背景和解決框架介紹
實時大數(shù)據(jù)計算OneData
數(shù)據(jù)接口服務(wù)OneFun
微服務(wù)化&ServiceMesh

一、背景和解決框架介紹

1、離線數(shù)據(jù)運營和實時數(shù)據(jù)運營

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

首先介紹下背景，我們做游戲數(shù)據(jù)運營的時間是比較久的了，在13年的時候就已經(jīng)在做游戲離線數(shù)據(jù)分析，并且能把數(shù)據(jù)運用到游戲的運營活動中去。

但那時候的數(shù)據(jù)有一個缺陷，就是大部分都是離線數(shù)據(jù)，比如今天產(chǎn)生的數(shù)據(jù)我們算完后，第二天才會把這個數(shù)據(jù)推到線上。所以數(shù)據(jù)的實時性，和對游戲用戶的實時干預(yù)、實時運營效果就會非常不好。尤其是比如我今天中的獎，明天才能拿到禮包，這點是玩家很不爽的。

現(xiàn)在提倡的是：“我看到的就是我想要的”或者“我想要的我立馬就要”，所以我們從16年開始，整個游戲數(shù)據(jù)逐漸從離線運營轉(zhuǎn)到實時運營，但同時我們在做的過程中，離線數(shù)據(jù)肯定少不了，因為離線的一些計算、累計值、數(shù)據(jù)校準都是非常有價值的。

實時方面主要是補足我們對游戲運營的體驗，比如說在游戲里玩完一局或者做完一個任務(wù)后，立馬就能得到相應(yīng)的獎勵，或者下一步的玩法指引。對用戶來說，這種及時的刺激和干預(yù)，對于他們玩游戲的體驗會更好。

其實不單單是游戲，其他方面也是一樣的，所以我們在做這套系統(tǒng)的時候，就是離線+實時結(jié)合著用，但主要還是往實時方面去靠攏，未來大數(shù)據(jù)的方向也是，盡量會往實時方向去走。

2、應(yīng)用場景

1）游戲內(nèi)任務(wù)系統(tǒng)

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這個場景給大家介紹一下，是游戲內(nèi)的任務(wù)系統(tǒng)，大家都應(yīng)該看過。比如第一個是吃雞里的，每日完成幾局？分享沒有？還有其他一些活動都會做簡歷，但這種簡歷我們現(xiàn)在都是實時的，尤其是需要全盤計算或者分享到其他社區(qū)里的。以前我們在做數(shù)據(jù)運營的時候，都是任務(wù)做完回去計算，第二天才會發(fā)到獎勵，而現(xiàn)在所有任務(wù)都可以做到實時干預(yù)。

游戲的任務(wù)系統(tǒng)是游戲中特別重要的環(huán)節(jié)，大家不要認為任務(wù)系統(tǒng)就是讓大家完成任務(wù)，收大家錢，其實任務(wù)系統(tǒng)給了玩家很好的指引，讓玩家在游戲中可以得到更好的游戲體驗。

2）實時排行版

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

還有一個很重要的應(yīng)用場景就是游戲內(nèi)的排行榜，比如說王者榮耀里要上星耀、王者，其實都是用排行榜的方式。但我們這個排行榜可能會更具體一些，比如說是今天的戰(zhàn)力排行榜，或者今天的對局排行榜，這些都是全局計算的實時排行榜。而且我們有快照的功能，比如0點00分的時候有一個快照，就能立馬給快照里的玩家發(fā)獎勵。

這些是實時計算的典型應(yīng)用案例，一個任務(wù)系統(tǒng)一個排行榜，其他的我們后面還會慢慢介紹。

3、游戲?qū)?shù)據(jù)的需求

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

再說一下為什么會有這樣一個平臺，其實我們最初在做數(shù)據(jù)運營的時候，是筒倉式或者手工作坊式的開發(fā)。當接到一個需求后，我們會做一個資源的評審、數(shù)據(jù)接入、大數(shù)據(jù)的編碼，編碼和數(shù)據(jù)開發(fā)完后，還要做線上資源的申請、發(fā)布、驗證，再去開發(fā)大數(shù)據(jù)計算完成后的服務(wù)接口，然后再開發(fā)頁面和線上的系統(tǒng)，這些都完了后再發(fā)到線上去，做線上監(jiān)控，最后會有一個資源回收。

其實這種方式在很早期的時候是沒有問題的，那為什么說現(xiàn)在不適應(yīng)了？主要還是流程太長了。我們現(xiàn)在對游戲運營的要求非常高，比如說我們會接入數(shù)據(jù)挖掘的能力，大數(shù)據(jù)實時計算完成之后，我們還要把實時的用戶畫像，離線畫像進行綜合，接著推薦給他這個人適合哪些任務(wù)，然后指引去完成。

這種情況下，原來的做法門檻就比較高了，每一個都要單獨去做，而且成本高效率低，在數(shù)據(jù)的復(fù)用性上也比較差，容易出錯，而且沒有辦法沉淀。每一個做完之后代碼回收就扔到一塊，最多下次做的時候，想起來我有這個代碼了可以稍微借鑒一下，但這種借鑒基本上也都是一種手工的方式。

所以我們希望能有一個平臺化的方式，從項目的創(chuàng)建、資源分配、服務(wù)開發(fā)、在線測試、獨立部署、服務(wù)上線、線上監(jiān)控、效果分析、資源回收、項目結(jié)項整個綜合成一站式的服務(wù)。

其實這塊我們是借鑒DevOps的思路，就是你的開發(fā)和運營應(yīng)該是一個人就可以獨立完成的，有這樣一個系統(tǒng)能夠去支撐這件事。當一個服務(wù)在平臺上呈現(xiàn)出來的時候，有可能會復(fù)用到計算的數(shù)據(jù)，比說實時的登錄次數(shù)或擊殺數(shù)，那這個指標在后面的服務(wù)中就可以共用。

而且有了這樣一個平臺之后，開發(fā)者只需主要關(guān)注他的開發(fā)邏輯就行了，其余兩條運維發(fā)布和線上運營都由平臺來保證。所以我們希望有一個平臺化的方式，把數(shù)據(jù)計算和接口服務(wù)統(tǒng)一起來，通過數(shù)據(jù)的標準化和數(shù)據(jù)字典的統(tǒng)一，能夠形成上面不同的數(shù)據(jù)應(yīng)用，這個是我們的第一個目標。

其實我們現(xiàn)在都是這種方式了，第一是要在DevOps的指導(dǎo)思想下去做，尤其是騰訊去做的時候數(shù)據(jù)服務(wù)的量是非常大的，比如我們?nèi)ツ暌还沧隽?、6萬的營銷服務(wù)，在這種情況下如果沒有平臺支撐，沒有平臺去治理和管理這些服務(wù)，單靠人的話成本非常大。

4、思路

3個現(xiàn)代化，大數(shù)據(jù)應(yīng)用的DevOps。

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

我們的思路也是這樣，三個現(xiàn)代化，而且把大數(shù)據(jù)應(yīng)用的DevOps思路實現(xiàn)起來。

規(guī)范化：流程規(guī)范、數(shù)據(jù)開發(fā)規(guī)范和開發(fā)框架；
自動化：資源分配、發(fā)布上線、監(jiān)控部署（這是DevOps里不可缺少的）；
一體化：數(shù)據(jù)開發(fā)、數(shù)據(jù)接口開發(fā)、測試發(fā)布、運維監(jiān)控。

所以我們針對大數(shù)據(jù)的應(yīng)用系統(tǒng)，會把它拆成這樣三塊，一個是大數(shù)據(jù)的開發(fā)，另外一個是數(shù)據(jù)服務(wù)接口的開發(fā)，當然接口后面就是一些頁面和客戶端，這些完了后這些開發(fā)還要有一個完整的開發(fā)流程支持。

這樣我們就能夠為各種數(shù)據(jù)應(yīng)用場景提供一站式的數(shù)據(jù)開發(fā)及應(yīng)用解決服務(wù)、統(tǒng)一的活動管理、數(shù)據(jù)指標計算開發(fā)管理和各種數(shù)據(jù)應(yīng)用接口自動化生產(chǎn)管理的一站式的服務(wù)。

這樣的系統(tǒng)能保障這些的事情，而且我們這里也合理拆分，不要把大數(shù)據(jù)和接口混到一塊去，一定要做解耦，這是一個非常關(guān)鍵的地方。

5、數(shù)據(jù)服務(wù)平臺整體架構(gòu)

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

1）計算存儲

這個框架大家可以看一下，我認為可以借鑒，如果你內(nèi)部要去做一個數(shù)據(jù)服務(wù)平臺的話，基本上思路也是這樣的，底層的Iass可以不用管，直接用騰訊云或者阿里云或者其他云上的服務(wù)就可以了。

我們主要是做上層這一塊的東西，最下面的計算存儲這個部分我們內(nèi)部在做系統(tǒng)的時候也不是care的，這塊最好是能承包出去。現(xiàn)在Iass發(fā)展到這個程度，這些東西在云上可以直接像MySQL數(shù)據(jù)庫或者Redis數(shù)據(jù)庫一樣購買就行了，比如Kafka、Pulsar、Flink、Storm。

存儲這塊我們內(nèi)部的有TRedis、TSpider，其實就是Redis和MySQL的升級版本?；A(chǔ)這塊我建議大家如果自己構(gòu)建的話，也不需要太過于關(guān)注。

2）服務(wù)調(diào)度

系統(tǒng)核心主要是在中間的服務(wù)調(diào)度這個部分，它是統(tǒng)一的調(diào)度API，就是上層的一些服務(wù)能發(fā)下來，然后去統(tǒng)一調(diào)度。另外一個就是流程的開發(fā)，我們有一個不可缺少的調(diào)度系統(tǒng)，這里我們使用的是DAG調(diào)度引擎，這樣我們可以把離線任務(wù)、實時任務(wù)、實時+離線、離線+函數(shù)接口的服務(wù)能夠組合起來，來完成更復(fù)雜實時數(shù)據(jù)應(yīng)用場景。

比如我們現(xiàn)在做的實時排行榜，把實時計算任務(wù)下發(fā)到Flink后，同時會給Flink下發(fā)一個URL，F(xiàn)link拿到URL后，它會把符合條件的數(shù)據(jù)都發(fā)送到URL，這個URL其實就是函數(shù)服務(wù)，這些函數(shù)服務(wù)把數(shù)據(jù)，在Redis里做排序，最終生成一個排行榜。

再往下的這個調(diào)度器，你可以不斷地去橫向拓展，比如我可以做Storm的調(diào)度器、Flink的調(diào)度器、Spark的調(diào)度器等等一系列。在這塊可以形成自己算法庫，這個算法庫可以根據(jù)場景去做，比如有些是Flink的SQL的分裝，也就是把SQL傳進來，它就能夠計算和封裝的Jar包。另外比如一些簡單的數(shù)據(jù)出發(fā)、規(guī)則判斷也可以去做，直接把算法庫分裝到這塊就行。

其實這塊和業(yè)務(wù)場景沒有直接關(guān)系的，但算法庫一定是和場景是有關(guān)系的，另外下層我們會有寫文件通道，比如說一些jar包的分發(fā)，這里騰訊用的是COS，能夠去做一些數(shù)據(jù)的傳輸和Jar包的提交。

還有一個命令管道，它主要針對機器，比如提交Flink任務(wù)的時候一定是通過命令管道，然后在一臺機器去把Jar包拉下來，然后同時把任務(wù)提交到Flink集群里去。數(shù)據(jù)管道也是類似的一個作用。

3）各種管理

另外還要將一個蠻重要的內(nèi)容，右邊綠色這塊的運營監(jiān)控、集群管理、系統(tǒng)管理（用戶權(quán)限管理，業(yè)務(wù)管理，場景管理，菜單配置管理等等），還有消息中心、幫助文檔，這些都是配套的，整個系統(tǒng)不可缺少的。

還有一部分是組件管理，包括大數(shù)據(jù)組件管理、函數(shù)管理、服務(wù)的二進制管理都可以在這里能夠做統(tǒng)一的管理。

數(shù)據(jù)資產(chǎn)，比如我們通過Flink或者Storm能夠生成的數(shù)據(jù)指標，它的計算邏輯的管理都在這里面，包括我們計算出來后，把這些指標打上標簽或者劃后，我們也作為數(shù)據(jù)資產(chǎn)。

還有一個最重要的是數(shù)據(jù)表的管理，我們無論是Flink或Storm，它的計算最終的落地點一定是通過一個數(shù)據(jù)表能算出來的。其他都還好，數(shù)據(jù)報表，比如每天計算多少數(shù)據(jù)，成功計算多少，每天有多少任務(wù)在跑，新增多少任務(wù)，這些都在里面可以做，包括我們版本的發(fā)布變更。

還有一個是外部管理端，這個根據(jù)業(yè)務(wù)場景去做就行了，等會演示我們管理端的時候大家就可以看到，其實我們的菜單相對來說比較簡單，根據(jù)比如我們的數(shù)據(jù)接入，從源頭把數(shù)據(jù)接入到Kafka或者Pulsar里去。然后數(shù)據(jù)指標基于接入的數(shù)據(jù)表，進行數(shù)據(jù)指標的計算，比如一些特性的Jar包，它是多張表的數(shù)據(jù)混合計算，或者是加上的表的混合計算，等等一系列通過硬場景做的一些分裝。

我們最終把這些做完后，所有的大數(shù)據(jù)都是通過對外的服務(wù)API暴露出去的，比如最終游戲任務(wù)是否完成，用戶ID過來后我們能看這個用戶的任務(wù)是否完成，這樣的一些應(yīng)用場景可以直接使用API去操作。

這是整個流程，講得比較細后面大家才會更清晰。

二、實時大數(shù)據(jù)計算OneData

1、數(shù)據(jù)開發(fā)流程

這是我們整體的數(shù)據(jù)應(yīng)用流程：

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

我們的Game Server先把數(shù)據(jù)上傳到日志Server（數(shù)據(jù)接入部分），日志Server再把數(shù)據(jù)轉(zhuǎn)到Kafka或者Pulsar，就是消息隊列里。

接進來后是數(shù)據(jù)表，數(shù)據(jù)表是描述，基于描述的表去開發(fā)指標、數(shù)據(jù)。比如我們這里一共有三類，一類是SQL，另外一類是我們已經(jīng)分裝好的框架，你可以自己去填充它的個性代碼，然后就可以在線完成Flink程序的編寫。

還有一種是自己全新的在本地把代碼寫好，再發(fā)到系統(tǒng)里去調(diào)測。之前說了在大數(shù)據(jù)計算和數(shù)據(jù)接口一定要做解耦，我們解耦的方式是存儲，存儲我們用Redis。它這種做法是把Redis和SSD盤能夠結(jié)合起來，然后再加上RockDB，就是Redis里面它hold熱點數(shù)據(jù)，同時它把這些數(shù)據(jù)都通過這個RockDB落地到SSD盤里去，所以它的讀寫性非常好，就是把整個磁盤作為數(shù)據(jù)庫存儲，而不像普通的Redis一樣再大數(shù)據(jù)情況下智能把內(nèi)存作為存儲對象。

在大數(shù)據(jù)把數(shù)據(jù)計算存儲進去后，后面的就簡單了，我們提供查詢的服務(wù)有兩種，一種是計算的指標，點一下就可以生成接口，我們叫規(guī)則接口；然后我們另外一種，也提供特性化的存儲到介質(zhì)里，我可以自己去定義他的SQL或者查詢方式，然后在數(shù)據(jù)進行加工處理，生成接口。

還有一種方式，是我們在Flink和Storm直接把數(shù)據(jù)配置我們這邊的一個函數(shù)接口，比如我剛才講的排行榜的方式，就給一個接口，他直接在Flink這邊處理完成之后，把數(shù)據(jù)吐到函數(shù)接口里面，函數(shù)接口對這個數(shù)據(jù)進行二次處理。

這個是整個處理方式，所以我們前面講的就是，基于Flink和Storm構(gòu)建一個全面的、托管的、可配置化的大數(shù)據(jù)處理服務(wù)。主要消費的是Kafka的數(shù)據(jù)，Pulsar現(xiàn)在在少量的使用。

這樣做就是我們把數(shù)據(jù)的開發(fā)門檻降低，不需要很多人懂Flink或者Storm，他只要會SQL或者一些簡單的邏輯函數(shù)編寫，那就可以去完成大數(shù)據(jù)的開發(fā)。

2、數(shù)據(jù)計算統(tǒng)一

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

其實我們之前在做的時候，有一些優(yōu)化的過程，原來每一個計算任務(wù)都是用Jar包去寫，寫完之后就是編輯、打包、開發(fā)、發(fā)布。后來我們劃分了三種場景，一種是SQL化，就是一些我們能用SQL表示的我們就盡量分裝成SQL，然后有一個Jar包能去執(zhí)行這個提交的SQL就可以了。

還有一種是在線的WebIDE，是處理函數(shù)的邏輯，舉例子Storm里可以把blot和spout暴露出來，你把這兩函數(shù)寫完后，再把并行度提交就可以運行。但這里我們具體實現(xiàn)的時候是基于Flink去做的。

另一個是場景化的配置，我們個性化的Jar包能夠統(tǒng)一調(diào)度，根據(jù)調(diào)度邏輯去執(zhí)行。

3、數(shù)據(jù)計算服務(wù)體系

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這是我們整個OneData計算體系的過程，支持三種，一種的自研的SQL，一種是Flink SQL，還有是Jar包。

我們自研的SQL是怎么存儲，最早是使用Storm，但StromSQL的效率非常低，所以我們根據(jù)SQL Parser做的SQL的分裝，我們對SQL自己進行解析，自己形成函數(shù)，在SQL提交之后，我們用這樣的方式直接把它編譯成Java的字節(jié)碼，再把字節(jié)碼扔到Strom里去計算。

Flink這塊我們也繼承了這種方式，后面會講一下兩種方式有什么區(qū)別。其實我們自研SQL在靈活性上比Flink SQL要好一點。

這里是做平臺化，不能說直接放一個FlinkSQL去跑，因為我們想要在里面統(tǒng)計整個業(yè)務(wù)邏輯的執(zhí)行情況，比如SQL處理的數(shù)據(jù)量，正確的和錯誤的，包括一些衰減，都是要做統(tǒng)計。

這是基本的過程，完了后我們在上面形成的一些基本場景，比如實時統(tǒng)計的場景，PV，UV，用獨立的Jar包去算就行了，配置一下表就可以去計算。另外實時指標的服務(wù)，比如殺人書，金幣的積累數(shù)，游戲的場次，王者榮耀里下路走的次數(shù)，這種數(shù)據(jù)都可以作為實時指標。

還有一種是規(guī)則觸發(fā)服務(wù)，表里的某個數(shù)據(jù)滿足什么條件時，觸發(fā)一個接口。還有通訊實時排行榜和一些定制化的服務(wù)。

1）自研SQL

接下來說我們自研SQL的過程，我們早期為了避免像Hive一樣（函數(shù)棧調(diào)用），而我們自己通過SQL Paser的語法抽象后，把它生成一段函數(shù)，就不需要這么多的對賬調(diào)用。

這個是函數(shù)生成過程，最終生成的就是這樣一段代碼，它去做計算邏輯，一個函數(shù)完成，不需要函數(shù)棧的調(diào)用，這樣效率就會大大提升。我們原來單核跑八萬，放在現(xiàn)在可以跑二十多萬。

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

整個處理的時候，我們把sql編譯成字節(jié)碼，F(xiàn)link消費了數(shù)據(jù)后，把數(shù)據(jù)轉(zhuǎn)化成sql能夠執(zhí)行的函數(shù)，就是roll的方式。然后把Roll整個數(shù)據(jù)傳到class里去執(zhí)行，最后輸出。

這種場景適合于，比如flinksql它有狀態(tài)值，我們要統(tǒng)計某個最大值的話，要一直把用戶的最大值hold到內(nèi)存里去。而我們自研的SQL呢，自己寫的函數(shù)，它把數(shù)據(jù)借助第三方存儲，比如剛才說的TRedis存儲。每次只需要讀取和寫入數(shù)據(jù)即可，不需要做過多的內(nèi)存的hold。

當前做到狀態(tài)的實時落地，就算掛掉也能立馬起來接著去執(zhí)行，所以超過10G、100G的數(shù)據(jù)計算，都不成問題，但是Flinksql如果要算的話，它的狀態(tài)值就一直要hould到內(nèi)存里去了，而且掛掉后只能用它的check point去恢復(fù)。

所以這是這兩種SQL的應(yīng)用場景。

2）SQL化

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

另外SQL里我們還可以做些其他的事情。我們的數(shù)據(jù)是持久化保存在存儲里的，那存儲里如果是同一張表，同一個緯度，比如我們都是用QQ，在這個緯度上我們配置了兩個指標，那能不能一次算完？只消費一次把數(shù)據(jù)算完，然后存儲一次。

其實這種在大數(shù)據(jù)計算里是很多的，目前在我們在做的平臺化就可以，比如一個是計算登錄次數(shù)，另一個是計算最高等級，這兩個計算邏輯不一樣，但是消費的數(shù)據(jù)表是一樣的，然后聚合緯度也是一樣的，聚合關(guān)鍵字也是一樣。那這個數(shù)據(jù)就可以進行一次消費，同時把數(shù)據(jù)計算出來同時去落地，大大減少了存儲和計算成本。

我們現(xiàn)在整個游戲里面有一萬一千多個指標，就是計算出來的，存儲的緯度有兩千六百多，實際節(jié)省計算和存儲約有60%以上。

兩個SQL，甚至更多的SQL，我們一張表算十幾個指標很正常，原來要消費十幾次現(xiàn)在只需要一次就可以算出來。而且這種情況對用戶是無感知的。A用戶在這張表上配了指標是A緯度，B用戶在這張表上配了指標也是A緯度，那這兩個用戶的數(shù)據(jù)，我們在底層計算的時候就消費一次計算兩次存儲一次，最終拿到的數(shù)據(jù)也是一樣的。

3）在線實時編程

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

無需搭建本地開發(fā)環(huán)境；
在線開發(fā)測試；
嚴格的輸入輸出管理；
標準化輸入和輸出；
一站式開發(fā)測試發(fā)布監(jiān)控。

再介紹下剛才提到的在線實時編程，其實很多時候?qū)﹂_發(fā)者來說，搭建一個本地的Flink集群做開發(fā)調(diào)測也是非常麻煩的，所以我們現(xiàn)在就是提供一種測試環(huán)境，上層的代碼都是固定的，不能修改。比如數(shù)據(jù)已經(jīng)消費過來了，進行數(shù)據(jù)的加工處理，最終往存儲里去塞就可以了。

通過這種方式，我們可以對簡單邏輯進行分裝，需要函數(shù)代碼，但比SQL復(fù)雜，比自動的Jar包開發(fā)要簡單一些，可以在線寫代碼，寫完代碼直接提交和測試就能完成結(jié)果的輸出。而且這種的好處是，數(shù)據(jù)的上報邏輯，數(shù)據(jù)的統(tǒng)計邏輯，我都在這里面分裝好了。只要管業(yè)務(wù)邏輯的開發(fā)就好了。

4、Flink特性應(yīng)用

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

時間特性：基于事件時間水印的監(jiān)控，減少計算量，提高準確性；
異步化IO：提高吞吐量，確保順序性和一致性。

我們最早在Strom里做的時候，數(shù)據(jù)產(chǎn)生的時間和數(shù)據(jù)進到消息隊列的時間，都是通過這種消息里自帶的時間戳，每一個消息都是要對比的。有了Flink之后，有了watermark這個機制之后，這一部分的計算就可以減少了。

實際測試下來的效果也是比較理想的，我們原來在Storm里單核計算，大概是以前的QPS，加上讀寫和處理性能，單核五個線程的情況下。但是Flink的時候我們可以到一萬，還加上Redis存儲IO的開銷。

另一個我們原來數(shù)據(jù)想要從Redis里取出來，再去算最大值最小值，完了算了再寫到Redis里，這個都是同步去寫的，但是同步IO有一個問題就是性能不高。

所以我們現(xiàn)在在把它改成異步IO，但是異步IO也有個特點就是整個一條數(shù)據(jù)的處理必須是同步的，必須先從Redis里把數(shù)據(jù)取出來，然后再把值計算完，再塞到里面去，保證塞完后再處理下一個統(tǒng)一的數(shù)據(jù)。

我們再做這樣的一些優(yōu)化。Flink這里有些特性可以保證我們數(shù)據(jù)的一致性，而且提升效率。

5、統(tǒng)一大數(shù)據(jù)開發(fā)服務(wù)—服務(wù)案例

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

接著介紹下更多的案例，如果大家玩英雄聯(lián)盟的話，那這個任務(wù)系統(tǒng)就是我們設(shè)計的，下次玩做這個任務(wù)的時候，你就可以想起我。還有天龍八部、CF、王者榮耀LBS榮耀戰(zhàn)區(qū)（通過大數(shù)據(jù)實時計算+LBS的數(shù)據(jù)排行）、王者榮耀的日?；顒樱▽崟r數(shù)據(jù)+接口+規(guī)則計算）、有哪些好友是實時在線的，跟你匹配的。

三、數(shù)據(jù)接口服務(wù)OneFun

1、數(shù)據(jù)應(yīng)用的出口

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

下面介紹下函數(shù)，我們原來在做的時候也是存在著一些問題，把數(shù)據(jù)存到存儲里面，如果存儲直接開放出去，讓別人任意去使用的話，其實對存儲的壓力和管理程度都是很有問題的。所以后來我們采用了一種類似于Fass的的解決方式。我們把存儲在里面的元數(shù)據(jù)進行管理，完了之后接口再配置化的方式，你要使用我這個DB，這個DB最大QPS多少，我就進行對比，允許你之后才能使用這個量。

比如我這個DB的最大QPS只有10萬，你要申請11萬，那我就給你申請不了，我就只能通知DB把這個Redis進行擴容，擴容后才給你提供使用。

所以這里面牽扯到我們的指標數(shù)據(jù)的元數(shù)據(jù)管理和接口之間的打通。

2、一體化函數(shù)執(zhí)行引擎—OneFun

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這個和剛才OneData的方式是一樣的，比如這塊提供了快速的函數(shù)，還有一些在線函數(shù)編程的方式的接口，你可以在上面寫一點JavaScript或者 Golang代碼，然后就生成接口，接口里面可以直接對外提供服務(wù)，把他形成產(chǎn)品化的包裝，在上層根據(jù)接口衍生出更多其他的一些應(yīng)用系統(tǒng)。

3、基于ssa的在線golang函數(shù)執(zhí)行引擎

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這里重點介紹下golang，其實我們是基于golang語言本身ssa的特點去做的，我們有一個執(zhí)行器，這個執(zhí)行器已經(jīng)寫好的，它的作用就是可以把你寫的golang代碼提交過來，加載到它的執(zhí)行器里。

并且我們可以把我們寫的代碼作為函數(shù)庫，積累下來然后放進去，它可以在執(zhí)行的時候去調(diào)用這些函數(shù)庫，而這里面寫的代碼語法和golang是完全一樣的。

同時我們在這里面執(zhí)行的時候，指定了一個協(xié)程，每一個協(xié)程我們規(guī)定它的作用域，就是以沙箱機制的方式來去執(zhí)行，最先實現(xiàn)的就是外部context去實現(xiàn)的，我們就可以實現(xiàn)web化的golang開發(fā)，這種有點像lua那種腳本語言一樣，你在線寫完語言直接提交執(zhí)行。

4、基于V8引擎的在線函數(shù)服務(wù)引擎

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這是我們的javascript的執(zhí)行引擎，我們主要是做了V8引擎的池子，所有javascript寫完之后，丟到V8引擎上去執(zhí)行，這應(yīng)該大家都能夠理解，如果大家玩過JS的可以理解這種方式，就是V8引擎里直接去執(zhí)行。

5、一體化函數(shù)執(zhí)行引擎--函數(shù)即服務(wù)

這是我們的在線函數(shù)編寫過程：

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

右下角是我們的函數(shù)代碼編寫區(qū)，寫完后左邊的黑框是點擊測試，輸出可以在這里寫，點擊測試就會把結(jié)果輸出出來，通過這種方式，我們極大地擴張了我們數(shù)據(jù)平臺的開發(fā)能力。原來是本地要把golang代碼寫完，然后調(diào)試完再發(fā)到線上環(huán)境去測試，而現(xiàn)在我們可以很大的規(guī)范化，比如說數(shù)據(jù)源的引入，我們就直接可以在這里去規(guī)定了，你只能引入申請過的數(shù)據(jù)源，你不能隨便亂引入數(shù)據(jù)源，包括你數(shù)據(jù)源引入的時候，QPS放大我都可以通過這種方式知道。

降低啟動成本；
更快的部署流水線；
更快的開發(fā)速度；
系統(tǒng)安全性更高；
適應(yīng)微服務(wù)架構(gòu)；
自動擴展能力。

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這個是我們一站式，把函數(shù)開發(fā)完后，直接提交，我們用Prometheus + grafana可以里面看到實時報表。

6、案例介紹

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這是一個典型的應(yīng)用，F(xiàn)link里面去計算的時候，他對這個數(shù)據(jù)進行過濾，完了之后進行一個遠程的call，這個遠程調(diào)用執(zhí)行函數(shù)代碼，大多數(shù)這種情況就是一個開發(fā)就可以完成大數(shù)據(jù)的開發(fā)和這個函數(shù)接口的開發(fā)，就可以完成這樣一個活動的開發(fā)，整個活動開發(fā)的門檻就低了很多，真正實現(xiàn)了我們DevOps，就是開發(fā)能夠把整個流程自己走完。

四、微服務(wù)化&ServiceMesh

1、數(shù)據(jù)應(yīng)用必走之路—微服務(wù)化

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

上面講的是OneData和OneFun的實現(xiàn)原理和機制，我們在內(nèi)部是怎么去應(yīng)用的，這套系統(tǒng)我們在游戲內(nèi)部是大力推廣。

這里尤其是接口這塊，其實如果說要微服務(wù)化的話，大數(shù)據(jù)我們能做的也就是那樣了，能夠用yarn或者K8S去做資源的管控，和任務(wù)的管控，但真正去做服務(wù)治理還是在接口這塊。目前我們上下接口大概是三千五百個，每周新增50個接口。

所以我們在做的時候也考慮到。原來我們服務(wù)是一個個開發(fā)，但是沒有治理，現(xiàn)在我們加上服務(wù)還是一個個去開發(fā)，甚至有些服務(wù)我們會把它變成一個服務(wù)，但是我們加入了這個服務(wù)的治理。

好多人在提微服務(wù)，微服務(wù)如果沒有一個平臺去治理的話，將會是一種災(zāi)難。所以微服務(wù)化給我們帶來便利的同時，也會給我們帶來一些問題，所以在我們的場景里面，微服務(wù)是非常好的，每一個接口就可以作為一個服務(wù)，這種是天然的微服務(wù)。

2、一體化服務(wù)治理設(shè)計

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

但是這種微服務(wù)的治理將會是我們很大的一個問題，所以我們花了很大的精力去做了一個微服務(wù)的治理系統(tǒng)，從項目注冊的時候，他就把項目注冊的微服務(wù)中心，并且把API注冊上來，然后在服務(wù)發(fā)布的時候，發(fā)到集群里的時候，這些服務(wù)都要主動的注冊到我們的名冊服務(wù)，就是Consoul。

但注冊到服務(wù)里不是作為服務(wù)路由來用的，而是到服務(wù)里后，我們在普羅米修斯這塊去做它的健康檢查和狀態(tài)采集，只要注冊上來，我立馬就能感知和把狀態(tài)采集過來，然后主要做實時報表和告警。

首先在服務(wù)的穩(wěn)定性和健康度這塊我們有一個保障，另外一個就是服務(wù)的信息注冊到Consul里去后，我們有一個服務(wù)的網(wǎng)關(guān)，我們用的是envoy，其實內(nèi)部我們還把它作為SideCar使用，后面會介紹。

注冊完了之后，envoy會把這個所有的負載進信息加載到這塊來，它去做它服務(wù)的路由，同時我們會把整個日志上報到日志中心去，包括網(wǎng)關(guān)的日志也會上傳到日志中心去，日志中心再去做離線的報表和實時的一些報警監(jiān)控，

所以這里面我們還加了一個基于Consul的一個配置，就是我們包括server的實時控制都可以通過Consul去配置，配置完了后立馬能夠watch到，然后去執(zhí)行。

這個是基本的服務(wù)治理，但現(xiàn)在我們的服務(wù)治理升級了，比這個要更好一點，基本的原理是這樣。

3、南北流量+東西流量的統(tǒng)一管控

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

并且我們在這里面實現(xiàn)了一個對envoy的管控，我們說是服務(wù)治理，主要是對流量的一些治理，比如貧富負載策略，路由策略，熔斷，超時控制，故障注入等等一系列。

我們是通過Consul的配置管理，通過它能夠下發(fā)到我們的Agent，這個Agent再把這個數(shù)據(jù)能夠通過Istio的接口和 k8s的API能夠下發(fā)到envoy，這里面就是API GeteWay和SideCar都是envoy，所以我們通過Istio對他的XDS的接口寫入，就可以把所有的配置信息下發(fā)到這里。

這套系統(tǒng)能夠整個去管控整個集群，南北流量和東西流量的統(tǒng)一管控。這套系統(tǒng)我們未來準備開源，現(xiàn)在主要是內(nèi)部在使用，而且這里面我們也做了圖形化的配置，所有envoy和Istio的配置我們都經(jīng)過YAML轉(zhuǎn)Istio再轉(zhuǎn)UI的方式，把它圖形化了，在這塊能夠做統(tǒng)一的管控。

而且我們把Agent開發(fā)完了之后就是多集群的支持，就是多個K8s集群只要加入進來，沒問題可以去支持，我們管理API GeteWay。

還有一塊是SideCar的管理，就是ServiceMash里的SideCar管理。我們剛才說的函數(shù)接口也好，規(guī)則接口也好，是一個server。

當然這里面還提到一個chaos mesh的功能，我們現(xiàn)在還在研究，我們準備在這套系統(tǒng)里把它實現(xiàn)了。

4、基于ServiceMesh的全鏈路流量分析

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

這是一個我們通過ServiceMesh做的分析，我們雖然可以宏觀地看出來我們接口對DB的壓力有多大，但實際上我們把流量導(dǎo)進來是我們對壓力的監(jiān)控是不夠的，所以這種情況我們通過ServiceMesh，他對出口流量和進口流量的管控，然后可以把流量進行詳細的統(tǒng)計，統(tǒng)計完后可以生成一個快照，這次快照和下次快照之間的數(shù)據(jù)對比，入流量有多少的時候，對下面各個流量壓力有多少。

這是整個展示圖，我們有多個測試用例，這兩個測試用例之間我們可以算出來對下游的壓力的流量分析，后期對下游壓力的分析和下游資源的擴容、縮容都有非常大的價值。

5、案例介紹

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

最后再介紹下我們目前用這套系統(tǒng)實現(xiàn)的一些案例，大數(shù)據(jù)的游戲回歸，比如做一個游戲數(shù)據(jù)的回顧（生涯回顧）、任務(wù)系統(tǒng)、排行榜。

>>>>

Q & A

Q1：servicemesh是怎么部署的？主要用來解決什么問題？

目前我們在使用的ServiceMesh技術(shù)實現(xiàn)是istio，版本是1.3.6。這個版本還不支持物理機方式部署，所以我們是在k8s中部署使用，部署方式有2種，可以是直接使用istioctl命令安裝，或者是生成yaml文件后使用kubectl進行安裝。

Servicemesh的架構(gòu)主要解決的問題是集群內(nèi)東西流量的治理問題。同時servicemesh的Sidercar作為協(xié)議代理服務(wù)和可以屏蔽后面的服務(wù)開發(fā)技術(shù)棧，Sidercar后面的服務(wù)可以是各種語言開發(fā)，但是流量的管理和路由可以有統(tǒng)一的管控。

Q2：微服務(wù)治理架構(gòu)能介紹一下嗎？

微服務(wù)治理架構(gòu)在我看來可以分為兩類：

服務(wù)實例的治理，這個在目前的k8s架構(gòu)下，基本都是由k8s來管理了，包含了服務(wù)實例的發(fā)布，升級，闊所容，服務(wù)注冊發(fā)現(xiàn)等等；
服務(wù)流量的治理，這一個大家通常說的服務(wù)治理，目前主要是由微服務(wù)網(wǎng)關(guān)和服務(wù)網(wǎng)格兩種技術(shù)來實現(xiàn)。服務(wù)網(wǎng)關(guān)實現(xiàn)集群內(nèi)和集群外的流量治理，服務(wù)網(wǎng)格實現(xiàn)了集群內(nèi)的流量治理。

Q3：開發(fā)人員主要具有什么樣的技術(shù)背景？

針對大數(shù)據(jù)開發(fā)人員，要使用我們這套系統(tǒng)只需要會sql語句和基本統(tǒng)計知識就可以了。

針對應(yīng)用接口開發(fā)人員，要使用我們這套系統(tǒng)只需要會JavaScript或者Golang，會基本的正則表達式，了解http協(xié)議，會調(diào)試http的api接口就可以了。

Q4：實時計算，flink與spark選擇上有沒啥建議？

Spark在15，16年的時候我們也在大規(guī)模使用，也在實時計算中使用過，但是當時的版本在實時計算上還是比較弱，在500ms的批處理中還是會出現(xiàn)數(shù)據(jù)堆積，所以在實時性上會有一定的問題，Spark擅長在數(shù)據(jù)迭代計算和算法計算中。但是如果實時性要求不高而且有算法要求的場景中Spark還是不錯的選擇。

Flink在設(shè)計之初就是一種流失處理模型，所以在針對實時性要求較高的場景中Flink還是比較合適的，在我們內(nèi)部測試發(fā)現(xiàn)Flink的流失計算吞吐確實要比Storm好很多，比Spark也是好很多，而且Flink目前的窗口機制針對實時計算中的窗口計算非常好用。所以一般實時計算或者對實時性要求較高的場景Flink還是比較推薦的。

Q5：游戲回放數(shù)據(jù)服務(wù)端存儲場景有么？

這種場景也是有的，游戲回放一般有2種方式，一種是錄屏傳輸回放，這種成本非常高，但是簡單且及時性比較好，另外一種是控制指令發(fā)回Server，在另外的服務(wù)中去恢復(fù)當時的場景，這種方式在成本相對較小，但是使用復(fù)雜。

Q6：回放場景下客戶端走什么協(xié)議將數(shù)據(jù)發(fā)送到服務(wù)端？

一般是游戲的私有協(xié)議。

特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容，還沒關(guān)注的小伙伴，可以長按關(guān)注一下：

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

長按訂閱更多精彩▼

王者榮耀背后的實時大數(shù)據(jù)平臺用了什么黑科技？

如有收獲，點個在看，誠摯感謝

免責聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

延伸閱讀

[通信先鋒]

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動力與長三角投資達成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上，軟通動力信息技術(shù)（集團）股份有限公司（以下簡稱"軟通動力"）與長三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)

關(guān)閉

關(guān)閉