AI技術(shù)需深耕落地,是大數(shù)據(jù)基礎(chǔ)
隨著以人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)和云計算為代表的前沿技術(shù)的快速發(fā)展,新一輪的產(chǎn)業(yè)變革正在進(jìn)行,傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級勢在必行,各行各業(yè)智能化趨勢越來越明顯,同時為社會創(chuàng)造出巨大的經(jīng)濟(jì)效益。在智能化浪潮中,人工智能是核心驅(qū)動力,賦能人類生活、醫(yī)療、交通、安防和工業(yè)生產(chǎn)等多個領(lǐng)域。其中,安防是AI在中國最火熱的領(lǐng)域,安防與我們的社會治安息息相關(guān),同時它也關(guān)系到每個人的安全和法治。
2018年6月1日,首屆“中新人工智能高峰論壇”在新加坡·南京生態(tài)科技島舉辦,論壇以“深度視野,對話未來”為主題,匯聚了全球人工智能領(lǐng)域優(yōu)秀的企業(yè)家、專家學(xué)者、政府機(jī)構(gòu)以及中國和新加坡代表,圍繞著人工智能當(dāng)前發(fā)展現(xiàn)狀、機(jī)遇及最新技術(shù)與應(yīng)用方案等話題進(jìn)行了深入的探討。
依圖——深耕技術(shù)落地的獨角獸
依圖科技是中國AI領(lǐng)域一個獨角獸級別的公司,成立于2012年。據(jù)吳雙介紹,依圖科技不是一個單一技術(shù)的公司,依圖科技覆蓋了人工智能方面的計算機(jī)視覺、圖像處理、語音識別、還有硬件、人工智能芯片等不同的領(lǐng)域,這是技術(shù)上的覆蓋。同時,從行業(yè)來看依圖科技也覆蓋了不同的行業(yè)。
當(dāng)談及依圖科技的核心技術(shù)和競爭力產(chǎn)品時,吳雙說:“依圖科技作為一家人工智能創(chuàng)業(yè)公司,被行業(yè)人士熟知是因為我們能夠?qū)I真正落地,我們所有工作都是圍繞著怎么把AI技術(shù)用到產(chǎn)品中去,而不是說追求發(fā)表論文的數(shù)量。2012年的時候,AI還沒有熱起來,我們就選擇要去做人臉識別。現(xiàn)在我們的人臉識別技術(shù)已經(jīng)做到世界領(lǐng)先水平,去年我們拿到了美國舉辦的一個叫人臉識別挑戰(zhàn)賽的第一名,而且這個賽制評判標(biāo)準(zhǔn)是國際上人臉識別領(lǐng)域的金標(biāo)準(zhǔn),是所有的安防廠家都會考慮的標(biāo)準(zhǔn)。此外,我們的自然語言處理、云識別技術(shù)在業(yè)界也都處于領(lǐng)先的水平,我們著力于把這些技術(shù)應(yīng)用到了產(chǎn)品中,而不是單一強(qiáng)調(diào)技術(shù)多厲害。”
人工智能從2016年逐漸火起來到現(xiàn)在,整個產(chǎn)業(yè)已經(jīng)走過了概念熱炒、盲目跟風(fēng)的階段,現(xiàn)在如何讓技術(shù)落地應(yīng)用是整個行業(yè)都需要冷靜思考和解決的問題。
AI發(fā)展——小公司大優(yōu)勢
人工智能作為科技行業(yè)的熱門領(lǐng)域,很多國內(nèi)外的大企業(yè)都在研發(fā),比如亞馬遜、微軟、谷歌、百度。與小公司相比,這些大企業(yè)具備無可匹敵的人力、財力、資源等各方面的優(yōu)勢。但是,就AI的發(fā)展特點來看,吳雙認(rèn)為小的創(chuàng)業(yè)公司也有大公司沒有的大優(yōu)勢。
他認(rèn)為,技術(shù)并不能成為一個人工智能創(chuàng)業(yè)公司的核心競爭力。“其實我們有一個非常強(qiáng)的觀點,就是算法必要,但不充分。一個人工智能的算法要應(yīng)用到公司核心競爭產(chǎn)品的話,它其實是受到算法、工程、產(chǎn)品這三個因素共同影響的。我們依圖的系統(tǒng)有多集群的互動,所有的這些事情在工程上有非常強(qiáng)的挑戰(zhàn)性。因為工程決定了算法落地的結(jié)果。只有這三個因素結(jié)合起來,才能做好一個產(chǎn)品。這個時候它們怎么結(jié)合起來又是另外一個問題,因為做算法的會討論算法的性能,它的召回率,它的精確度,它的速度。但是做工程考慮的是系統(tǒng)的穩(wěn)定性、可擴(kuò)展性、延時。雙方會用完全不同的指標(biāo)來衡量系統(tǒng),這個時候就需要兩個團(tuán)隊能夠非常好的溝通。等產(chǎn)品團(tuán)隊進(jìn)來之后,考慮的又是完全不一樣的指標(biāo),產(chǎn)品考慮的是用戶體驗和功能的實際價值。當(dāng)三方結(jié)合在一起的時候,大家會發(fā)現(xiàn)這個溝通的鏈條變得越來越長。很多人工智能大公司里都會存在這種團(tuán)隊溝通的困難。”
吳雙接著說:“我們會覺得這正好是一個人工智能創(chuàng)業(yè)公司的優(yōu)勢所在,因為相對一個大公司,人工智能創(chuàng)業(yè)公司具有非常高效率跨團(tuán)隊的溝通和不停學(xué)習(xí)的能力,此時反而覺得算法的學(xué)習(xí)能力其實不如團(tuán)隊本身的學(xué)習(xí)能力重要。”
反直覺——AI是大數(shù)據(jù)的基礎(chǔ)
據(jù)吳雙介紹,人臉識別是一個非常具體的技術(shù),但是它的應(yīng)用又有各種各樣不同的形態(tài),這些形態(tài)是需要不同角色的團(tuán)隊來發(fā)掘的。例如,在兩個月前的數(shù)字中國的大會上,依圖科技就把人臉識別的技術(shù)用在了整個福州市,游客一下火車就會收到“歡迎來到福州”的通知,到了酒店直接可以人臉入住,還可以去無人店購買東西,去到會場也不用再刷卡,門可以自動打開,所有的技術(shù)都是應(yīng)用在場景之下,這些場景都是由技術(shù)發(fā)掘出來的。
此外,依圖科技做的一個醫(yī)療影像輔助診斷系統(tǒng),已經(jīng)在國內(nèi)大概30家三甲醫(yī)院使用。依圖科技整個醫(yī)療產(chǎn)品線,大概有六款產(chǎn)品,有基于圖像做的X光、CT、超聲波等等,也有基于文本做的病歷處理等。
至于這其中的技術(shù)處理原理,吳雙也做了詳細(xì)介紹:“首先一個行業(yè)要信息化,就得把這個行業(yè)所用到的信息存到電腦里。其次,如果這些信息只是存在電腦里面,沒能非常有效地處理它,就沒辦法被很好的使用。所以這個信息要數(shù)據(jù)化。只有這兩個滿足了之后,算法才可以發(fā)揮作用,才進(jìn)入到人工智能的下一個階段——算法信息化。”
吳雙還舉了一個例子,他說:“例如電子病歷,每天醫(yī)生在里面輸入那么多文字。這些文字其實是寫給人看的,不是給電腦看的,是大段的文本,這個時候讓電腦對它進(jìn)行使用,做一個診斷是很難的。我們做了一個什么事情呢?我們把文本變成結(jié)構(gòu)化的數(shù)據(jù),這個是簡單的,非常直接的一個自然語言處理的方法。這就是所謂的從信息化到數(shù)據(jù)化的轉(zhuǎn)變。只有把數(shù)據(jù)轉(zhuǎn)換成了電腦非常容易理解和處理的信息之后,再做一個簡單的分類器就非常容易了。所以學(xué)過機(jī)器學(xué)習(xí)的人就知道我們這個數(shù)據(jù)已經(jīng)非常好用了,直接開始做模型的優(yōu)化,就可以得到結(jié)果。”
“醫(yī)療大數(shù)據(jù)的基礎(chǔ)其實是人工智能,而不是反過來的。沒有人工智能,醫(yī)療大數(shù)據(jù)是沒法兒做的,而不是說有了醫(yī)療大數(shù)據(jù)之后人工智能才可以做,這個邏輯是非常反直覺的。但是一旦做了這個事情,就會發(fā)現(xiàn)原來是這樣的,這是我們一個非常強(qiáng)的觀點。”吳雙對大數(shù)據(jù)和人工智能的關(guān)系提出了獨到的見解。
吳雙說,人工智能落地是需要深耕去做的,不是大家拿著一個計算機(jī)沖進(jìn)一個行業(yè),瞬間革命。聯(lián)想集團(tuán)副總裁、人工智能實驗室負(fù)責(zé)人徐飛玉也說:“中國AI的發(fā)展碰到一個天時地利人和的時機(jī),從天時來講我們從移動互聯(lián)網(wǎng)的時代進(jìn)入到智能互聯(lián)網(wǎng)的時代,從地利來講我們有很多人好的工智能企業(yè),人和的話,我們有很多聰明的人才。而且國家去年7月20號發(fā)布了新一代人工智能的規(guī)劃,要求從中小學(xué)開始就要有人工智能的課程。”希望在天時地利人和的大環(huán)境下,人工智能領(lǐng)域所有的企業(yè)都可以深耕技術(shù)落地。