微軟機(jī)器學(xué)習(xí)的發(fā)展從測(cè)謊儀開(kāi)始
最近,微軟的Jennnifer Marsman 在他自己的老板身上測(cè)試了一下自己設(shè)計(jì)的測(cè)謊儀。
“你覺(jué)得你所在的公司是全世界最好的公司嗎?”
“當(dāng)然”
“哈!根據(jù)測(cè)謊儀的反應(yīng),這話有點(diǎn)心虛。”
“今年會(huì)提拔我嗎?”
“當(dāng)然”
“這話聽(tīng)起來(lái)倒不假。”
不過(guò),微軟可不是在玩執(zhí)法游戲。37 歲的Marsman是個(gè)“重量級(jí)技術(shù)布道者”(principal developer evangelist),她的工作就是不遺余力地推廣機(jī)器學(xué)習(xí)——人工智能的一種形式,利用數(shù)據(jù)預(yù)測(cè)所有事,從季度銷量到奶牛什么時(shí)候懷孕等等。(譯者注:技術(shù)布道師是最前線也是最重要的“翻譯者”,他們能夠把技術(shù)以易懂的方式解釋給來(lái)自不同領(lǐng)域的人,以此獲得他們對(duì)產(chǎn)品或技術(shù)的支持。這需要又懂技術(shù)又能挖掘出技術(shù)背后故事的人才,他們能夠激發(fā)起人們對(duì)于一個(gè)產(chǎn)品的激情。)
Marsman 設(shè)計(jì)的測(cè)謊儀將算法和 14 個(gè)分列排布的用來(lái)監(jiān)測(cè)腦電腦的頭戴式設(shè)備結(jié)合起來(lái)一起工作,這就像是聚會(huì)上的一個(gè)小把戲。Marsman 借此向軟件開(kāi)發(fā)者展示如何使用微軟 Azure 機(jī)器學(xué)習(xí)(Azure Machine Learning)工具。Marsman 在微軟扮演著重要角色,微軟在機(jī)器學(xué)習(xí)領(lǐng)域起步早,但是現(xiàn)在面臨著來(lái)自Google 和亞馬遜機(jī)器學(xué)習(xí)商業(yè)化的競(jìng)爭(zhēng)。
這樣的風(fēng)險(xiǎn)相當(dāng)高。接下來(lái)的幾年,機(jī)器學(xué)習(xí)將會(huì)改變世界——會(huì)使得計(jì)算機(jī)智能程度呈指數(shù)級(jí)增長(zhǎng),并幫助削減公司成本,預(yù)測(cè)哪些值得投資,哪些值得大筆投資。彭博社智庫(kù)(Bloomberg Intelligence)分析員 Anurag Rana 稱這項(xiàng)技術(shù)“是區(qū)分軟件公司發(fā)展好壞的最重要因素。”離開(kāi)機(jī)器學(xué)習(xí),他說(shuō):“你都無(wú)法賣出產(chǎn)品。”
雖然微軟已經(jīng)在機(jī)器學(xué)習(xí)領(lǐng)域耕耘了至少 20 年,但是 Office 和 Windows 這類部門一度小心謹(jǐn)慎地利用其預(yù)測(cè)功能。“很多人的反應(yīng)就是‘我們知道怎么去做,為什么你還要用數(shù)據(jù)質(zhì)疑我的觀點(diǎn)?’”華盛頓大學(xué)計(jì)算機(jī)科學(xué)教授 Pedro Domingos 如此表述,他寫(xiě)了一本關(guān)于機(jī)器學(xué)習(xí)的書(shū)——《算法大師》(The Master Algorithm)。
當(dāng)微軟嘗試用 Bing 搜索趕超 Google 的時(shí)候,微軟才真正擁抱機(jī)器學(xué)習(xí)技術(shù)。兩年前,Satya Nadella擔(dān)任微軟 CEO,在此之前,他就為搜索部門定下了工程和技術(shù)戰(zhàn)略,并把機(jī)器學(xué)習(xí)技術(shù)向魔法粉一樣灑落在公司涉及的所有產(chǎn)品中。“機(jī)器學(xué)習(xí)深深嵌入了微軟公司,微軟現(xiàn)在處于這樣的位置,”Domingos 說(shuō)。“他們正大力投資機(jī)器學(xué)習(xí),以使得該領(lǐng)域不那么荒蕪。”
與 Google 和蘋(píng)果使用機(jī)器學(xué)習(xí)改善自家產(chǎn)品一樣,微軟將這項(xiàng)技術(shù)融入到自身的運(yùn)營(yíng)中。這不僅僅是節(jié)省成本,幫助公司更好運(yùn)作;微軟自身使用這技術(shù)越多,向客戶解釋和銷售就更容易。“客戶很困惑,”Joseph Sirosh 說(shuō),2013 年,微軟把他從亞馬遜挖來(lái),負(fù)責(zé)微軟機(jī)器學(xué)習(xí)工程。“在一片不解聲中前行頗具挑戰(zhàn)。同時(shí),內(nèi)部也困難重重,銷售人員要說(shuō)服消費(fèi)者并向他們講解所有的使用場(chǎng)景。”
微軟首席財(cái)務(wù)官 Amy Hood 的財(cái)務(wù)部門已經(jīng)開(kāi)始依賴算法——使用算法預(yù)測(cè)銷售數(shù)據(jù),預(yù)測(cè)在給定時(shí)間段內(nèi)的授權(quán)數(shù)量。“結(jié)果表明非常非常精準(zhǔn),”Sirosh 說(shuō),“Amy Hood 是機(jī)器學(xué)習(xí)的超級(jí)粉絲,知道機(jī)器學(xué)習(xí)模型預(yù)測(cè)地季度數(shù)據(jù)后,她也能睡個(gè)好覺(jué)。”
微軟還用算法預(yù)測(cè)隨著數(shù)據(jù)中心的快速擴(kuò)張,還需要采購(gòu)多少服務(wù)器,并幫助銷售人員確定重點(diǎn)客戶。Sirosh表示,甚至之前的老產(chǎn)品,如 2002 年收購(gòu)的一款財(cái)會(huì)軟件都得到了機(jī)器學(xué)習(xí)的加持。微軟的 Cotrana 分析套件(Cotrana AnalyTIcs Suite)可以讓用戶自己動(dòng)手打造這樣一類工具。
25 歲的Ram Shankar Siva Kumar自稱自己是數(shù)據(jù)牛仔(data cowboy),是 Azure 安全數(shù)據(jù)科學(xué)(Azure Security Data Science)團(tuán)隊(duì)的一員。他使用機(jī)器學(xué)習(xí)算法來(lái)預(yù)測(cè)微軟網(wǎng)絡(luò)中的可疑行為。一旦知曉需要尋找的目標(biāo),微軟的安全團(tuán)隊(duì)能很快找到攻擊源,而 Kumar 必須在任何人知道這一情況之前找到他們。
為了訓(xùn)練算法識(shí)別有害行為的能力,他有償鼓勵(lì)微軟紅色團(tuán)隊(duì)(Microsoft’s Red Team)的黑客去攻擊網(wǎng)絡(luò)以及來(lái)自微軟安全中心的危險(xiǎn)報(bào)告,用實(shí)際的攻擊去訓(xùn)練算法。這能幫助他建立模型以識(shí)別真正的漏洞。
各行各業(yè)正在使用微軟的技術(shù)。日本農(nóng)民用技術(shù)追蹤奶牛,奶牛準(zhǔn)備受孕時(shí)走動(dòng)會(huì)更頻繁,所以他們能讓奶牛在最佳的時(shí)間受孕。一家澳大利亞的酒廠也使用類似的算法預(yù)測(cè)葡萄產(chǎn)量。一家距離微軟大約 1 小時(shí)車程的醫(yī)院使用 Azure 工具找出哪些心臟病患者更有可能需要再住院檢查。挪威 eSmart 系統(tǒng)利用 Azure 機(jī)器學(xué)習(xí)預(yù)測(cè)能源網(wǎng)使用量,并在需求高的時(shí)候關(guān)閉家用供暖。
Matt McIlwain 是西雅圖 Madrona 風(fēng)險(xiǎn)投資集團(tuán)(Madrona Venture Group)總經(jīng)理,他認(rèn)為微軟的機(jī)器學(xué)習(xí)技術(shù)不比競(jìng)爭(zhēng)對(duì)手的技術(shù)差,甚至更好。但是他也認(rèn)為微軟仍然缺乏品牌感知,目前正在迎頭趕上。“人們?nèi)绾伟l(fā)現(xiàn)微軟真的有很棒的機(jī)器學(xué)習(xí)技術(shù)?”他說(shuō)。“微軟必須將自己推銷出去。”
這正是 Jennifer Marsman 的切入點(diǎn)。她遍歷全球,展示她的測(cè)謊儀并大力宣傳機(jī)器學(xué)習(xí)的潛在用途。其中醫(yī)療應(yīng)用討論頗多。人們已經(jīng)問(wèn)到使用該技術(shù)預(yù)測(cè)癲癇、監(jiān)控依賴輔助生活設(shè)施的老人并決定在比賽中受傷的運(yùn)動(dòng)員是直接去醫(yī)院還是回到場(chǎng)上繼續(xù)比賽。“我在公司有著最酷的工作。”