當前位置:首頁 > 芯聞號 > 充電吧
[導讀]選擇 NoSQL 數據庫需要考慮的 10 個問題

那我為什么要寫這個?

原因很簡單——幾年前,我見證了設計一個為遙測事件提供模式管理設施的系統(tǒng)。事實證明,這比最初計劃的要昂貴得多。為什么呢?因為選擇了錯誤的數據庫解決方案。

這個系統(tǒng)的一個要求是確保模式編輯是一致的,并且模式的最新版本被顯示給每個模式編輯器。它還應該支持并發(fā)編輯。

此外,同時訪問這個系統(tǒng)的用戶數量永遠不會超過幾百個。存儲的數據量不會是Tb級——最多幾百Gb。

因此,如果我們考慮了CAP定理的權衡,那么選擇應該是顯而易見的——使用RDBMS。這樣做的好處是支持系統(tǒng)的一致性和事務支持需求。

相反,選擇了NoSQL數據庫(Azure表存儲)來進行原型設計。這一選擇的官方原因是,它使原型設計更快,并提供了更大的靈活性,同時更新了單個遙測事件的模式。與Azure SQL相比,Azure表存儲的低成本被認為是另一個原因。

?

快進5個月……

該系統(tǒng)開始經歷許多關于維護CRUD操作完整性的問題。設計用來處理事務的瘦應用程序邏輯層已經不再那么薄了。升級和向后兼容性的故事開始變得更加復雜。

由于受到許多其他問題的困擾,工程師們又回到了繪圖板——這次是用Azure SQL替換存儲層!我不記得具體的細節(jié),但是這個改變增加了大約40%的額外時間和成本。

管理層很不高興,這個項目幾乎被砍掉了。但是團隊的工程師們非常優(yōu)秀,他們能夠完成這個項目,盡管有了一些延遲和最初的錯誤的技術決定。

這個項目有一個圓滿的結局——但它也可能不是這樣的。事實上,很多內部項目都被關閉了,因為他們不能在承諾的日期范圍內交付承諾的功能。

那么,您如何知道NoSQL解決方案適合您的下一個軟件項目呢?首先問問你自己和你的團隊這十個問題:

#1:您是否準備好接受開發(fā)人員/系統(tǒng)管理員的培訓成本?

如果你是一家成熟的IT軟件開發(fā)公司,那么你很有可能已經有了熟悉SQL的人。這個組不僅包括開發(fā)人員,還包括數據庫管理員(DBA)。

除非您打算為新的NoSQL項目進行招聘,否則將會有對現有開發(fā)人員和DBA的培訓成本。額外的培訓也可能會延長項目交付日期。

一種簡單的思考方式是:

  • 計算您的團隊成員(開發(fā)人員和DBA)擁有關系數據庫技術的總年數。

  • 計算出通過培訓或新招聘獲得經驗相同NoSQL經驗年數的成本。

  • 最后,弄清楚你從這個成本中得到了什么。你的投資回報率?

在這個特定的項目中,這個團隊的開發(fā)人員以前都沒有NoSQL經驗,但是有大量的SQL Server經驗。使用NoSQL解決方案在培訓中增加了大約1個sprint,當然,這也是由于缺乏經驗和設計上的失誤。

#2:您的數據事務是基于什么?或者,您需要什么級別的事務支持?

如果您的系統(tǒng)需要ACID屬性,那么您最好還是堅持使用RDBMS解決方案。否則,您將花費大量的時間試圖在您的應用程序/業(yè)務邏輯層復制ACID保證,并且您可能仍然沒有RDBMS解決方案那么高效。

#3: 您需要Web/高可伸縮性嗎?

總是在先計算出您需要什么樣的可伸縮性。在這個特殊的例子中,我們正在為微軟內部游戲工作室構建系統(tǒng)。

  • 有10到15個游戲工作室正在考慮中——這取決于有多少注冊用戶使用這個系統(tǒng)

  • 每個工作室最多有3-5個活躍的游戲標題。

  • 每個游戲標題為三個環(huán)境存儲遙測模式——開發(fā)、預生產(PPE)和生產

  • 對于每個標題,將會有2-5個數據科學家同時修改游戲標題數據

  • 每一個標題事件都有大約50 KB的max事件數據

  • 我們被要求存儲所有的版本——我們估計這個數字是1000除以一個標題的生命周期

有了以上粗略的估計,我們就可以計算并發(fā)性和存儲需求:

總并發(fā)數 = 工作室數量 * 標題數量每工作室 * 用戶數量每標題

=? 15 * 5 * 5 =?375 并發(fā)用戶

最大存儲 =??工作室數量 * 標題數量每工作室 * 環(huán)境數量 * 事件存儲大小每版本* 需要存儲的版本數

= 15 * 5 * 3 * 50 KB * 1000 = 11250000 KB =?11.25 GB最大存儲

SQL Azure支持1024個并發(fā)打開連接,并且能夠很容易地支持并發(fā)需求。另外,在考慮云計算時,11.25 GB實際上是一個非常小的數字。

這個系統(tǒng)并不是下一個FaceBook或必應——那么NoSQL的路線真的值得嗎?

#4:NoSQL解決方案真的能幫你省錢嗎?

在紙面上,Azure表存儲是一種更便宜的選擇,因為它的每Gb數據僅為美分,而SQL Azure則在此期間收取大約5美元的數據。

但是因為我們系統(tǒng)的存儲空間不會超過12 GB——這真的很重要嗎?每月60美元是我們在同一個系統(tǒng)上花30分鐘寫代碼的錢。

因此,在決定使用NoSQL僅僅是因為它的單位成本更低之前,先弄清楚節(jié)省下來的錢是否占了預算的很大一部分。

#5:你需要吸引風險投資嗎?

有趣的是,硅谷對NoSQL有偏見。這是因為感覺上NoSQL被認為具有內在的可伸縮性,并且RDBMS被認為是不可伸縮的。記住,關鍵字是“感覺上”!

這種可擴展性的感覺可能會讓投資者相信,你的軟件正處于正確的軌道上,準備好接受大規(guī)模的采用,從而吸引他們的投資資金。

許多NoSQL公司本身就是風投公司,這也給他們帶來了積極的偏見。

最后,圍繞“NoSQL”的所有營銷活動都有助于推動投資者對你的產品的正面情緒。

#6:你是在雇傭創(chuàng)業(yè)精神的人嗎?

如果你打算雇傭創(chuàng)業(yè)精神的人,他們中的很多人可能已經有NoSQL的知識了。

然而,如果你不在一個主要的科技中心,那么獲得這些人才的機會就很少了。您所在的區(qū)域可能有一個現成的RDBMS開發(fā)人員池——試圖在這樣的區(qū)域中招募NoSQL工程師和DBA可能會延遲項目交付日期,并且由于供應需求曲線,也會花費您更多的錢。

我的建議是與你的招聘機構/人力資源部門合作,對開發(fā)者進行市場調查,并將其納入你的技術選擇中。

#7:你的客戶在下游使用什么技術?

考慮這樣一個場景:您向客戶交付分析數據。您正在使用NoSQL來存儲分析數據。然而,您的一個客戶決定堅持使用基于SQL的報告系統(tǒng)。

這對你來說意味著什么?

這意味著您現在需要將所有NoSQL數據轉換為SQL格式,并通過Azure數據工廠等服務將其向下推到客戶的SQL數據庫。這是您需要承擔額外的開發(fā)和運營成本。如果您的所有下游客戶都在使用SQL,那么您需要認真地考慮是否使用NoSQL和做所有這些昂貴的數據轉換對您的系統(tǒng)有意義嗎?

#8:對于你的產品,可用性是否勝過一致性?

如果你正在建立一個像Facebook newsfeed這樣的系統(tǒng),你可能會希望這個系統(tǒng)是高可用性的,并且是最終一致。

另一方面,如果您正在構建一個銀行系統(tǒng)(或者像我們的案例那樣的模式存儲),您可能希望支持強一致性,并放棄高可用性。

無論采用哪種方式,您都應該首先考慮CAP定理的含義,然后決定您的系統(tǒng)是否需要SQL或NoSQL解決方案。

#9:您是否預期對數據庫模式進行大量更改?

如果您期望對數據庫模式進行大量更改,就像移動應用程序、實時分析、內容管理系統(tǒng)等經常發(fā)生的情況一樣,那么NoSQL解決方案可能就是一種方法。

您可以使用一個分區(qū)方案,它允許您以一種比大多數SQL數據庫允許的更方便的方式更新您的數據庫模式。

#10:你想用NoSQL來獲得個人的充實/滿足嗎?

請不要這樣做!

我曾見過一些人,他們只是迷戀于學習一個NoSQL系統(tǒng),并將其放入他們的簡歷中。這并沒有什么錯——我對NoSQL技術也很著迷。

但是,請不要讓這成為選擇技術堆棧背后的驅動因素(有意識的或下意識的)。如果你愿意的話,你可以在自己的時間里學習。

誰贏得了數據庫戰(zhàn)爭?

坦率地說 – 沒有哪個玩家能贏者通吃!

在很多情況下,您可能需要SQL和NoSQL技術在同一系統(tǒng)中并存。 例如,如果您正在構建像Instagram這樣的照片共享應用程序,則您的照片可能位于NoSQL數據庫中,而您的登錄/ ACL信息可能位于SQL數據庫中。


本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉