人工智能與大數(shù)據(jù)你需要了解一下
首先要厘清數(shù)據(jù)的來源,數(shù)據(jù)的主要來源是形形色色的企業(yè)、人和各種機器。以行業(yè)劃分比如醫(yī)院、電力、交通等等。只要是以數(shù)據(jù)的形式存儲記錄物或人的行為、規(guī)則、方式、過程、結果等,無論聯(lián)網(wǎng)或者不聯(lián)網(wǎng),就是數(shù)據(jù)。
引自百度百科。大數(shù)據(jù)(big data)是指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。
這個解釋,只是說明了為什么是“大”和對“大”的解決利用辦法??梢舱f明了“大數(shù)據(jù)”的目的性,提取、分析、優(yōu)化,找到對某個行業(yè)或者某種場景利用價值的“數(shù)據(jù)”。
然后把找到的數(shù)據(jù),提供給“人工智能機器人”,作為它們的“學習資料”。
舉個例子,讓智能機器認識并記住一直花貓。給它三只貓,一只黑色的,一只白色的,一只黑白花色的。你給它說,圓眼睛的是花貓。他會告訴你這幾只都是花貓。然后,你告訴它圓眼睛、有黑顏色和白顏色的是花貓,它會告訴你,黑色的和白色以及黑白斑點的都是花貓。你再告訴它,圓眼睛和有黑色斑點和白色斑點的是花貓,它就會告訴你白色的和黑色都是花貓。你再告訴它圓眼睛、有黑色圓形斑點、有白色圓形斑點的而且在一直貓的身體上的是花貓,它就會正確指出哪只是花貓。
這幾只貓就是大數(shù)據(jù)經過“數(shù)據(jù)挖掘”的算法后得出某個應用場景或某個企業(yè)想要得到的具有某種特征的結果“訓練數(shù)據(jù)集”,這個過程就是機器學習,學習之后的認知結果體現(xiàn)在機器上就是人工智能。只不過智能機器的學習過程實際遠比舉的這個例子要復雜的多。
智能機器人就是通過這樣不同的訓練數(shù)據(jù)集,從而在里面利用各種學習(算法)找到一定的特征、規(guī)律,識別、總結出各種各樣所需要的結果,然后運用到實際的場景應用中,為消費者、企業(yè)、社會組織提供不同的服務。
這里面,除了智能設備的運算支持外,“算法”起到核心的技術支撐作用。
用來反復學習的數(shù)據(jù)叫“訓練數(shù)據(jù)集”;“訓練數(shù)據(jù)集”中,一類數(shù)據(jù)區(qū)別于另一類數(shù)據(jù)的不同方面的屬性或特質,叫“特征”;智能機器在“大腦”中總結規(guī)律的過程,叫“建?!保恢悄軝C器在“大腦”中總結出的規(guī)律,就是我們常說的“模型”;而智能機器通過反復“學習”總結出規(guī)律,然后學會的過程,就是“機器學習”。
通過人工智能專家持續(xù)的不懈努力,人工智能的“算法”也在很快的發(fā)展。人工智能的發(fā)展硬件和軟件是一堆孿生兄弟,你追我趕。從“CPU”到“GPU”,從“大數(shù)據(jù)”到“訓練數(shù)據(jù)集”、“深度學習”、“人工神經網(wǎng)絡”,再到視覺識別、智慧醫(yī)療、智能制造等場景的應用,人工智能的“智能化”在不斷的進化發(fā)展。
來源:微觀視角