當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] “機器學習”這個術語賦予了神奇的光環(huán)。普通人通常不會采用機器學習,而數(shù)據(jù)科學家才是高度專業(yè)化的煉金術士,他們在研究部門和實驗室中將數(shù)據(jù)轉化為“黃金”,而只是簡單地說機器學習是一門科學,在此之外幾

機器學習”這個術語賦予了神奇的光環(huán)。普通人通常不會采用機器學習,而數(shù)據(jù)科學家才是高度專業(yè)化的煉金術士,他們在研究部門和實驗室中將數(shù)據(jù)轉化為“黃金”,而只是簡單地說機器學習是一門科學,在此之外幾乎沒有提供解釋。

當然,這可能是一個鮮為人知的事實,但多年來機器學習工具已經發(fā)展到這樣一個地步:幾乎任何人都可以按下按鈕,并啟動一些機器來學習有價值的東西。這并不是一件容易的事,但將數(shù)據(jù)整合并將其轉化為可操作見解的工作已經實現(xiàn)自動化,很多具有這種動機的組織可以做到這一點。

這種緩慢的復興是由商業(yè)世界中許多非程序員已經相當精通數(shù)據(jù)的現(xiàn)實所推動的。加載數(shù)字的電子表格是各級業(yè)務決策者的通用語言,機器學習算法也像表格中數(shù)據(jù)清晰定義的行和列一樣。機器學習的新工具基本上只是另一組策略和選項,用于將表格數(shù)據(jù)轉換為有用的答案。這些工具的優(yōu)勢在于能夠處理收集數(shù)據(jù)、添加結構,并保持一致性,然后開始繁重的計算工作。它們簡化了數(shù)據(jù)收集過程,簡化了將信息保存在行和列中的工作。

這些工具還不夠智能,無法為用戶完成所有這些學習。用戶必須提出正確的問題并找到合適的地方。但是這些工具加速了對答案的搜索,因此可以覆蓋更多的范圍,并在進行更多的搜索。

AutoML:機器學習的民主化

最近,新的流行術語“AutoML”開始出現(xiàn),表示機器學習算法附帶了一個額外的自動化元層。標準算法一直被設計用于自行查找模式和規(guī)則,但傳統(tǒng)算法帶有許多選項和參數(shù)。數(shù)據(jù)科學家經?;ㄙM80%到99%的時間致力于找到最具預測性的規(guī)則。

AutoML通過嘗試一系列選項,測試它們然后嘗試更多來自動化這個階段。它不是采用機器學習算法運行一次,而是運行N次,進行一些調整,再次運行N次,如此反復,直到用戶的預算、時間、耐心耗盡。

AutoML工具非常適合云計算,因為它們在云中可以啟動足夠的機器并行運行,然后在完成后將它們返回池中。用戶只需在峰值計算時間支付費用。

一般來說,AutoML算法是人們開始自己探索機器學習的一個良好選擇。自動化通過處理一些設置參數(shù)和選項的基本工作來簡化工作,然后再為用戶測試結果。隨著用戶變得更加復雜,并開始理解結果,他們可以承擔更多這些工作,并自行設置價值。

最新的系統(tǒng)還可以讓用戶更輕松地了解機器的學習方式。如果經典編程將規(guī)則和數(shù)據(jù)轉化為答案,那么機器學習算法將會反向工作,并將答案和數(shù)據(jù)轉換為規(guī)則。這些規(guī)則可能會告訴用戶業(yè)務發(fā)生的事情。這些簡化工具的開發(fā)人員還創(chuàng)建了解釋算法發(fā)現(xiàn)的規(guī)則的接口,更重要的是如何復制結果。他們想打開黑盒以促進理解。

使機器學習更容易的6種工具

所有這些功能都為那些使用數(shù)字、電子表格和數(shù)據(jù)的人們開啟了機器學習的世界,消除了對編程和數(shù)據(jù)科學的巨大需求。下面的六個選項簡化了用戶使用機器學習算法在數(shù)字海洋中找到答案。

1. Splunk

Splunk的原始版本最初是作為一種工具,通過現(xiàn)代Web應用程序創(chuàng)建的大量日志文件進行搜索或“窺探”。它已經發(fā)展成為可以分析所有形式的數(shù)據(jù),特別是時間序列和其他按順序生成的數(shù)據(jù)。該工具將結果顯示在具有復雜可視化例程的儀表板中。

最新版本包括將數(shù)據(jù)源與TensorFlow等機器學習工具和一些最佳Python開源工具集成的應用程序。它們提供快速解決方案,用于檢測異常值、標記異常,并生成對未來值的預測。它們經過優(yōu)化,可以在非常大的數(shù)據(jù)集中搜索文件。

2. DataRobot

DataRobot內部的堆棧是一些用R、Python或其他幾個平臺編寫的開源機器庫的集合。用戶將只處理一個Web界面,該界面顯示用于設置管道的類似流程圖的工具。DataRobot連接到主要數(shù)據(jù)源,其中包括本地數(shù)據(jù)庫、云數(shù)據(jù)存儲和下載的文件或電子表格。用戶構建的管道可以清理數(shù)據(jù),填充缺失值,然后生成標記異常值,并預測未來值的模型。

DataRobot還可以嘗試提供關于為什么進行某些預測的“人性化解釋”, 這對于理解人工智能的應用非常有用。

它可以部署在云端和內部部署解決方案的混合體中。云計算可以通過共享資源提供最大的并行性和吞吐量,而本地安裝可以提供更多的隱私和控制能力。

3. H2O

H2O喜歡用“無驅動的人工智能”來描述其探索各種機器學習解決方案的自動化堆棧。它將數(shù)據(jù)源(數(shù)據(jù)庫、Hadoop、Spark等)聯(lián)系在一起,并將它們輸入到具有廣泛參數(shù)的各種算法中。用戶可以控制用于該問題的時間和計算資源,并測試各種參數(shù)組合,直到完成預算。其結果可以通過儀表板或Jupyter筆記本進行瀏覽和審核。

H2O的核心機器學習算法以及與Spark等工具的集成是開源的,但所謂的“無驅動” 選項是銷售給企業(yè)客戶的專有包之一。

4. RapidMiner

RapidMiner生態(tài)系統(tǒng)的核心是一個用于從可視圖標創(chuàng)建數(shù)據(jù)分析的工作室。它將清理用戶的數(shù)據(jù),然后通過各種統(tǒng)計算法運行它。如果用戶想使用機器學習而不是更傳統(tǒng)的數(shù)據(jù)科學,自動模型將從多種分類算法中進行選擇,并搜索各種參數(shù),直到找到最佳匹配。該工具的目標是生成數(shù)百個模型,然后確定最佳模型。

創(chuàng)建模型后,該工具可以部署它們,同時測試它們的成功率,并解釋模型如何做出決策??梢允褂每梢暬ぷ髁骶庉嬈鳒y試和調整對不同數(shù)據(jù)字段的敏感度。

最近的改進包括更好的文本分析、用于構建可視化儀表板的各種圖表以及用于分析時間序列數(shù)據(jù)的更復雜算法。

5. BigML

BigML儀表板提供了數(shù)據(jù)科學的基本工具,用于識別可以構成機器學習更復雜工作基礎的相關性。例如,他們的深度網(wǎng)絡提供了用于測試和優(yōu)化更精細的神經網(wǎng)絡的復雜機制。可以將模型的質量與其他算法進行比較,并使用標準化的比較框架,幫助用戶在經典數(shù)據(jù)科學和更復雜的機器學習之間進行選擇。

BigML的儀表板在瀏覽器中運行,其分析可以在BigML云平臺中運行,也可以在服務器機房中運行。其云計算版本的價格較低,以鼓勵早期應用,甚至還有一個免費套餐。其成本主要取決于數(shù)據(jù)集大小的限制以及可以調用的計算資源量。免費套餐將使用不超過兩個并行運行的進程分析最多16MB的數(shù)據(jù)。規(guī)模較小的付費賬戶的定價非常合理,每月賬單只需30美元,但隨著資源需求的增加,其價格會上升。

6. R Studio

對于非程序員來說,R并不是一種容易使用的語言,但它仍然是進行復雜統(tǒng)計分析的最基本工具之一,因為它深受核心數(shù)據(jù)科學家的歡迎。R Studio是一個工具,為用戶提供一組菜單和點擊選項,使其更容易與深入內部運行的R層進行交互。

能夠處理電子表格的高級管理人員可以使用最簡單的選項來運行基本分析,甚至是一些復雜的分析。但有些部分會讓一些用戶感到困惑,但它正處于開放的邊緣,每個對其感興趣的人員都可以訪問。雖然仍然會有一些困惑,但對于想要探索前沿工具的人來說,這是值得的。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉