人工智能AI要來(lái)了,記者的飯碗如何保得???
9月28日,在業(yè)內(nèi)舉足輕重的科技巨擘Google、Facebook、IBM、亞馬遜和微軟共同宣布成立一家非營(yíng)利機(jī)構(gòu)——AI合作組織(Partnership on ArTIficial Intelligence to Benefit People and Society),首次在人工智能領(lǐng)域建立合作關(guān)系。
這一組織的成立旨在對(duì)有關(guān)人工智能具體如何影響社會(huì)的倫理問(wèn)題展開(kāi)研究,令人工智能技術(shù)的開(kāi)發(fā)更加可控和透明,同時(shí)也是為了遏制人們對(duì)這項(xiàng)日益精進(jìn)的技術(shù)產(chǎn)生的擔(dān)憂。
這是為“邪術(shù)”出籠前準(zhǔn)備好的“十字架與圣水”,有悲觀人士如斯評(píng)價(jià)。
我們已經(jīng)自覺(jué)或不自覺(jué)地開(kāi)始步入人工智能時(shí)代了。
幾天前的Google硬件發(fā)布會(huì)上,CEO劈柴花大量時(shí)間介紹了Google Assistant(谷歌面向消費(fèi)者的人工智能虛擬助手,其核心能力包括:知識(shí)圖譜、自然語(yǔ)言處理、翻譯、語(yǔ)音識(shí)別、圖像識(shí)別)的進(jìn)步和價(jià)值。 Google已將這一服務(wù)植入到了Google手機(jī)Pixel和Google Home以及更多的應(yīng)用領(lǐng)域當(dāng)中,甚至包括智能穿戴以及智能汽車(chē)。透露出Google領(lǐng)跑人工智能時(shí)代的野心。
科技巨頭的野心預(yù)示著AI發(fā)展將進(jìn)入更廣更深的領(lǐng)域,產(chǎn)生更大的影響,使工業(yè)生產(chǎn)、金融、律師、管理顧問(wèn)、記者等眾多行業(yè)從業(yè)人員都面臨被AI 替代的失業(yè)風(fēng)險(xiǎn)。英國(guó)BBC電視臺(tái)甚至預(yù)測(cè),將近一半的普通職業(yè)從業(yè)者面臨著50%被人工智能取代的危險(xiǎn)。AI對(duì)新聞媒體行業(yè)從業(yè)者也將會(huì)帶來(lái)前所未有的強(qiáng)烈沖擊。
比如Google最新開(kāi)發(fā)出的“神經(jīng)機(jī)器翻譯”(Neural machine translaTIon),已經(jīng)非常接近人類(lèi)的翻譯。話說(shuō),新聞翻譯的活兒是不是就可以直接交給機(jī)器來(lái)干了?
隨著人工智能程序AlphaGo完勝九段棋手李世石,自動(dòng)化新聞寫(xiě)作機(jī)器人的成功開(kāi)發(fā),不久的將來(lái),新聞媒體記者是不是就要被替代呢?
什么是AI?
在探討AI帶給媒體行業(yè)的影響前,我們先要了解AI的正確含義。
AI是人工智能(ArTIficial Intelligence)的英文縮寫(xiě),是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。
CrowdFlower眾包數(shù)據(jù)處理公司的CEO Robin Bordoli在《關(guān)于人工智能的七大常見(jiàn)誤解》一文中提出了人工智能的有3個(gè)互相連鎖的關(guān)鍵概念:
1.訓(xùn)練數(shù)據(jù)(TrainingData,TD)訓(xùn)練數(shù)據(jù)是機(jī)器可以用來(lái)學(xué)習(xí)的起始數(shù)據(jù)來(lái)源集。訓(xùn)練數(shù)據(jù)有輸入值和帶有答案的輸出值,這樣機(jī)器學(xué)習(xí)模型可以從答案中尋找模式。比如,輸入可以是客服單,帶有客戶和公司的客服代表之間的電子郵件。輸出可以是基于公司某個(gè)分類(lèi)定義的從1到5的分類(lèi)標(biāo)簽。
2.機(jī)器學(xué)習(xí)(MachineLearning,ML)機(jī)器學(xué)習(xí)是軟件從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到某種模式,并把它應(yīng)用到新的輸入數(shù)據(jù)中。比如,一個(gè)新的客服單,帶有某位客戶和某位公司客服代表的郵件來(lái)了,機(jī)器學(xué)習(xí)模型可以預(yù)測(cè)出一個(gè)分類(lèi),并告訴你它對(duì)該分類(lèi)的把握有多大。機(jī)器學(xué)習(xí)的關(guān)鍵特征是,它不是通過(guò)固定的規(guī)則來(lái)學(xué)習(xí)。因此,當(dāng)它消化新的數(shù)據(jù)后會(huì)調(diào)整其規(guī)則。
3.人機(jī)回圈(Human-in-the-Loop,HITL)人機(jī)回圈是人工智能的第三個(gè)核心部分。我們不能指望機(jī)器學(xué)習(xí)萬(wàn)無(wú)一失。一個(gè)好的機(jī)器學(xué)習(xí)模型大約只有70%的準(zhǔn)確性。因此你需要一個(gè)人機(jī)回圈流程,當(dāng)模型的可信度低時(shí),還可以依靠人。
于是我們可以得到AI的基本公式:AI = TD + ML + HITL
由此我們可以總結(jié)出有關(guān)AI的3個(gè)關(guān)鍵信息:
1.人工智能不是一開(kāi)始就具有高超智能的,而是需要一個(gè)數(shù)據(jù)樣本集對(duì)其進(jìn)行訓(xùn)練。
2.機(jī)器獲得智能本質(zhì)上是從大量的樣本數(shù)據(jù)中學(xué)會(huì)了一種模式,并隨樣本數(shù)據(jù)的更新不斷更新其對(duì)模式的認(rèn)識(shí)。
3.至少在當(dāng)今,人工智能要做到萬(wàn)無(wú)一失還少不了人工把關(guān)。
AI會(huì)給新聞業(yè)帶來(lái)怎樣的影響?
了解了AI的含義,讓我們來(lái)看看AI在新聞?lì)I(lǐng)域的應(yīng)用。
抓取歷史數(shù)據(jù)并生成圖表
2016年8月30日,路透社與語(yǔ)義技術(shù)公司Graphiq宣布合作,旨在讓數(shù)據(jù)可視化變得觸手可及。Graphic公司有一個(gè)集結(jié)了50多位研發(fā)人員和數(shù)據(jù)專家的團(tuán)隊(duì),專門(mén)負(fù)責(zé)收集經(jīng)濟(jì)、體育、娛樂(lè)等各個(gè)領(lǐng)域的數(shù)據(jù)。路透社借此利用AI實(shí)現(xiàn)了迅速抓取歷史數(shù)據(jù)并生成圖表,增強(qiáng)了新聞的實(shí)效性和可視性。
篩選“熱門(mén)話題”
Facebook在8月26日宣布趨勢(shì)話題撤掉人工編輯,完全依靠算法篩選熱門(mén)新聞的趨勢(shì)話題,做出了擁抱AI的勇敢嘗試。但打臉的是,還不到3天,就讓一則關(guān)于美國(guó)福克斯新聞主播梅根?凱利的假新聞登上了版面。
據(jù)報(bào)道,這是由于Facebook機(jī)器篩選“熱門(mén)話題”依賴于該話題的相關(guān)文章和貼文數(shù)量,而非對(duì)于內(nèi)容的判斷。由此可見(jiàn)在當(dāng)前技術(shù)情況下想要避免假新聞還得要人工把關(guān)。
制作視頻
2016年6月,原論壇報(bào)集團(tuán)(Tribune Publishing)宣布將公司更名為T(mén)ronc,并專注于使用人工智能制作內(nèi)容。在接受CNBC電視臺(tái)采訪時(shí),公司CEO Michael Ferro表示Tronc將會(huì)使用人工智能制作大量視頻。但就目前的AI技術(shù)來(lái)說(shuō),利用AI是否能作出高質(zhì)量的視頻引起業(yè)界人士的質(zhì)疑。
撰寫(xiě)新聞
人工智能寫(xiě)新聞已經(jīng)不是一件新鮮事了。
2015年7月,美聯(lián)社和科技公司Automated Insights合作,采用人工智能技術(shù)來(lái)報(bào)道商業(yè)領(lǐng)域的企業(yè)財(cái)報(bào)新聞。從300份一季度到3000份一季度,這次合作幫助美聯(lián)社大大地提高了財(cái)報(bào)數(shù)量,據(jù)顧客反映正確率也大大提高。
2015年9月10日,騰訊網(wǎng)財(cái)經(jīng)頻道發(fā)出題為《8月CPI同比上漲2.0% 創(chuàng)12個(gè)月新高》的第一篇由自動(dòng)化新聞寫(xiě)作機(jī)器人完成的稿件,引起新聞界關(guān)注。
在今年的里約奧運(yùn)會(huì)上,今日頭條實(shí)驗(yàn)室自助研發(fā)的AI機(jī)器人張小明通過(guò)兩種文本生成技術(shù)產(chǎn)出新聞:一是針對(duì)數(shù)據(jù)庫(kù)中表格數(shù)據(jù)和知識(shí)庫(kù)生成自然語(yǔ)言的比賽結(jié)果報(bào)道,即簡(jiǎn)訊;二是利用體育比賽文字直播精煉合成比賽過(guò)程的總結(jié)報(bào)道,即資訊。奧運(yùn)會(huì)期間通過(guò)對(duì)接奧組委的數(shù)據(jù)庫(kù)信息,實(shí)時(shí)撰寫(xiě)新聞稿件,在 6天共生成超200篇簡(jiǎn)訊和資訊。
用戶分析,個(gè)性化推送
在信息爆炸,用戶需求多樣化個(gè)性化的時(shí)代, 媒體如果想為100萬(wàn)讀者制作100萬(wàn)個(gè)他們需要的個(gè)性化頭版,就只能依靠人工智能(算法)了。Youtube、SmartNews、今日頭條等新聞媒體都依靠人工智能算法獲得了成功。
由此可見(jiàn),AI在抓取歷史數(shù)據(jù)并生成圖表;篩選“熱門(mén)話題”;制作視頻;撰寫(xiě)新聞;用戶分析,個(gè)性化推送等方面都發(fā)揮著強(qiáng)大的作用,引領(lǐng)著新聞媒體行業(yè)走向一場(chǎng)深刻的變革。
但由于技術(shù)限制,當(dāng)今的AI還有很多缺陷,短期內(nèi)不可能完全取代新聞?dòng)浾撸S著技術(shù)不斷進(jìn)步,AI逐步趨于完善,也許在不久的將來(lái)就會(huì)取代很多新聞?dòng)浾摺?/p>
尤其是通訊稿式的新聞,很快就可以只靠機(jī)器人加上簡(jiǎn)單的人工把控輕易而高效率的完成了,這就要求新聞業(yè)工作者不能只求時(shí)效性和數(shù)量,更要追求內(nèi)容的質(zhì)量與深度。簡(jiǎn)單傳達(dá)信息的工作將會(huì)被機(jī)器人取代,我們要轉(zhuǎn)而傳達(dá)思考與文化。
ColdFusionTV在《阿爾法狗背后的谷歌DeepMind:能自我學(xué)習(xí)的人工智能》中深入分析AI對(duì)未來(lái)的影響后得出結(jié)論:“人工智能可以接管很多信息密集型的專業(yè)工作,只為我們留下創(chuàng)造力和情感為本質(zhì)的工作,這些或許是人工智能永遠(yuǎn)無(wú)法習(xí)得的。”
這樣的結(jié)論讓我們感到些許欣慰,畢竟創(chuàng)造力和情感是機(jī)器無(wú)法與人比擬的。但是機(jī)器真的無(wú)法做出創(chuàng)造性的工作么?
AI有創(chuàng)造性么?
藝術(shù)領(lǐng)域一直被視為人類(lèi)情感和感性的領(lǐng)域,但連這樣的領(lǐng)域AI都開(kāi)始涉足。
Oscar Schwartz在題為《電腦能寫(xiě)詩(shī)嗎?》的TED演講中證明了電腦是可以寫(xiě)詩(shī)的。
現(xiàn)在我們來(lái)做一個(gè)小測(cè)試,下圖的兩首詩(shī)一首是人類(lèi)詩(shī)人創(chuàng)作的,而另一首是由機(jī)器生成的,你能猜出哪一個(gè)是機(jī)器所作么?
這是講師在演講現(xiàn)場(chǎng)給觀眾提出的問(wèn)題。
但當(dāng)時(shí)只有個(gè)別幾個(gè)觀眾猜對(duì)了。
答案是,詩(shī)歌1是人類(lèi)詩(shī)人格特魯?shù)滤固┮驅(qū)懗傻?,而第二首則是由RKCP的算法所寫(xiě)的。RKCP是由谷歌設(shè)計(jì)師總管雷科茲威爾設(shè)計(jì)的演算法。原理是你給RKCP一個(gè)原文本,而它通過(guò)原文本了解到人類(lèi)如何使用語(yǔ)言,然后創(chuàng)造出一種和該文本相似的語(yǔ)言。即為在本文開(kāi)頭所提到的訓(xùn)練數(shù)據(jù)+機(jī)器學(xué)習(xí)原理。詩(shī)歌2其實(shí)是受到詩(shī)人艾美莉迪金森的影響寫(xiě)成的。
怎么樣?你猜對(duì)了么?
其實(shí)早在20世紀(jì)50年代,計(jì)算機(jī)科學(xué)和密碼學(xué)的先驅(qū)阿蘭?麥席森?圖靈就設(shè)計(jì)出了有名的圖靈測(cè)試,其內(nèi)容是,如果電腦能在5分鐘內(nèi)回答由人類(lèi)測(cè)試者提出的一系列問(wèn)題,且其超過(guò)30%的回答讓測(cè)試者誤認(rèn)為是人類(lèi)所答,則電腦通過(guò)測(cè)試。2014年6月8日,一臺(tái)計(jì)算機(jī)成功讓人類(lèi)相信它是一個(gè)13歲的男孩,成為有史以來(lái)首臺(tái)通過(guò)圖靈測(cè)試的計(jì)算機(jī)。這被認(rèn)為是人工智能發(fā)展的一個(gè)里程碑事件。
除了會(huì)寫(xiě)詩(shī),AI最近又開(kāi)始進(jìn)軍音樂(lè)領(lǐng)域。
最近,索尼音樂(lè)的計(jì)算機(jī)科學(xué)研究實(shí)驗(yàn)室(Sony CSL)發(fā)布了兩首完全由人工智能作曲的流行歌曲,稱這是有突破性的第一次。無(wú)數(shù)網(wǎng)友表示本以為會(huì)效果感人,但親測(cè)真的很好聽(tīng)。旋律易記的《Daddy‘s Car》,是人工智能模仿The Beatles樂(lè)隊(duì)的風(fēng)格創(chuàng)作的,有種陽(yáng)光明媚在路上吹風(fēng)的感覺(jué),大家有興趣可以試聽(tīng)感受一下。
詩(shī)歌、音樂(lè)、語(yǔ)言。曾近被我們認(rèn)為最需要人類(lèi)感性的領(lǐng)域,實(shí)踐證明AI同樣也可以做的很好。
照這個(gè)邏輯,在人工智能不斷發(fā)展下,不久的將來(lái)機(jī)器人寫(xiě)分析性預(yù)測(cè)性的文章,寫(xiě)深度長(zhǎng)文報(bào)道,復(fù)雜選題的特稿是否也能得心應(yīng)手呢?這不得不讓眾多媒體人感到恐慌。
機(jī)器人會(huì)取代媒體人么?
別著急,讓我們先來(lái)仔細(xì)想想機(jī)器人是怎么創(chuàng)作詩(shī)和歌曲的吧。
在這兩個(gè)案例中,機(jī)器人都是通過(guò)輸入大量的源樣本,從中進(jìn)行模式學(xué)習(xí),進(jìn)而創(chuàng)作出有某人風(fēng)格的作品,有的時(shí)候(如歌曲的最終完成)還需要加以人工輔助來(lái)完成的。
其實(shí)完全符合AI = TD + ML + HITL的公式。
即使是隨著技術(shù)的進(jìn)步,人機(jī)回圈的必要性越來(lái)越小,AI是否就可以取代新聞媒體記者,寫(xiě)出比人類(lèi)更好的新聞報(bào)道呢?
也許你會(huì)說(shuō)是的,畢竟阿爾法狗就戰(zhàn)勝了人類(lèi)。
但是圍棋比賽和做新聞?dòng)斜举|(zhì)區(qū)別。
記者的不斷創(chuàng)新才是AI創(chuàng)作的源泉
圍棋與創(chuàng)作最大的區(qū)別在于圍棋有勝負(fù),并且只有圍棋本身的規(guī)律,不隨時(shí)代而改變。在阿爾法狗的訓(xùn)練過(guò)程中,是先讓其學(xué)習(xí)無(wú)數(shù)的人類(lèi)下棋模式后,再讓不同版本的阿爾法狗之間進(jìn)行比賽,并對(duì)新的比賽過(guò)程進(jìn)行學(xué)習(xí),使其不斷超越機(jī)器自身,最終才得以超越人類(lèi)。
而創(chuàng)作領(lǐng)域沒(méi)有輸贏之分,好壞也是很主觀的事情,所以沒(méi)有辦法讓其自身不同版本之間進(jìn)行競(jìng)爭(zhēng),也就很難想到方法讓其只靠學(xué)習(xí)以前的文章就能持續(xù)提高水平,寫(xiě)出比人類(lèi)記者更優(yōu)秀的文章。
要寫(xiě)出好文章,就要輸入大量?jī)?yōu)秀的的樣本,而這些優(yōu)秀的樣本創(chuàng)造需要無(wú)數(shù)記者充分發(fā)揮創(chuàng)造力,如果沒(méi)有無(wú)數(shù)記者的不斷創(chuàng)新,只有機(jī)器人在現(xiàn)有的文章中不斷學(xué)習(xí),很難想象怎么能與時(shí)俱進(jìn)地寫(xiě)出越來(lái)越好的文章以及新聞報(bào)道。
也許隨著技術(shù)進(jìn)步AI能寫(xiě)出比大多數(shù)普通記者都好的文章,這就對(duì)記者提出了更高的要求,但AI最終無(wú)法超越不斷創(chuàng)新的廣大記者群體。
AI的前進(jìn)方向由媒體人決定
另外,更重要的是,在為AI機(jī)器人訓(xùn)練時(shí),給它們?cè)鯓拥臉颖救Q于人類(lèi)對(duì)這一工作本質(zhì)的認(rèn)識(shí)。
Oscar Schwartz講師在演講中提到,人工智能的發(fā)展是一面鏡子,AI機(jī)器人并非會(huì)創(chuàng)作,它們只會(huì)通過(guò)學(xué)習(xí)來(lái)做的無(wú)限像人的某一個(gè)方面。而我們則需要決定“要讓人工智能像人類(lèi)的哪一個(gè)方面”。
這一決定需要我們對(duì)人本身,對(duì)新聞和媒介本身有更深的理解。
例如,如果要利用AI為用戶個(gè)性化篩選新聞,我們首先要想明白作為一個(gè)用戶最需要怎樣的新聞,如何避免僅靠用戶的瀏覽記錄來(lái)推送文章時(shí)可能引發(fā)的信息娛樂(lè)化和狹窄化。
如果想要利用AI寫(xiě)出好的新聞深度報(bào)道,我們需要想明白究竟什么堪稱優(yōu)秀的新聞報(bào)道,需要從我們自己平時(shí)寫(xiě)深度報(bào)道時(shí)如何收集材料,如何歸納分析,如何創(chuàng)新中總結(jié)出一種規(guī)律。
如果寫(xiě)分析預(yù)測(cè),我們則需要知道需要考慮到哪些因素,收集哪些數(shù)據(jù)來(lái)進(jìn)行分析預(yù)測(cè)。
需要與用戶進(jìn)行互動(dòng),建立關(guān)系時(shí),我們首先要知道用戶需要怎樣的關(guān)系,這個(gè)關(guān)系隨時(shí)代怎么改變。
也就是說(shuō),AI說(shuō)到底是增強(qiáng)人類(lèi)某一方面能力的輔助,而需要增強(qiáng)哪一方面能力,需要怎么增強(qiáng),這個(gè)最關(guān)鍵的方向性問(wèn)題需要我們來(lái)思考。
正如ColdFusionTV所說(shuō)“人工智能研究的原點(diǎn)是人腦,是人類(lèi)對(duì)于自己大腦的理解的反映”,所有的規(guī)律和奧秘其實(shí)都在我們自身。
所以對(duì)于每一個(gè)媒體人來(lái)說(shuō),只有我們更深入地了解新聞媒體行業(yè)的本質(zhì)和人類(lèi)通過(guò)媒介獲得信息、人的思考方式的本質(zhì),加深A(yù)I領(lǐng)域的人文探索,才能使AI更好的為我們所用。這是AI對(duì)所有媒體人全新的挑戰(zhàn)。