大力推進(jìn)人工智能行業(yè)應(yīng)用落實和可持續(xù)發(fā)展
最近的數(shù)據(jù)顯示,可持續(xù)發(fā)展正躍升為企業(yè)議程的重要事項——近一半(48%)的全球首席執(zhí)行官表示,提高可持續(xù)性是他們的首要任務(wù)之一,較 2021 年以來增長了 37%。2023 年對企業(yè)的期待不僅是要制定雄心勃勃的可持續(xù)發(fā)展目標(biāo),還要將可持續(xù)發(fā)展目標(biāo)轉(zhuǎn)化為行動。然而僅有 23% 的 CEO 表示他們正全面實施跨企業(yè)的可持續(xù)發(fā)展戰(zhàn)略,他們同時表示,缺乏可靠的數(shù)據(jù)洞察阻礙了他們采取行動。2023 年,人工智能至少可以從以下三方面,助力企業(yè)加速落實其可持續(xù)發(fā)展目標(biāo)。
企業(yè)領(lǐng)導(dǎo)不能忽視氣候變化所帶來的日益增長的風(fēng)險。根據(jù) 2021 年世界經(jīng)濟(jì)論壇全球風(fēng)險報告,極端天氣、氣候行動失敗和人為帶來的環(huán)境破壞是未來十年企業(yè)最有可能面臨的三大風(fēng)險。
在接下來的一年,企業(yè)將越來越多地尋求利用天氣和氣候數(shù)據(jù)來應(yīng)對氣候風(fēng)險,而人工智能將是關(guān)鍵。 今天,有大量有價值的氣候相關(guān)數(shù)據(jù)還沒有被企業(yè)充分利用起來,包括有關(guān)天氣和業(yè)務(wù)運營的實時和持續(xù)觀測等信息。
人工智能技術(shù)可以在幫助企業(yè)應(yīng)對氣候變化的影響方面發(fā)揮關(guān)鍵作用。通過結(jié)合人工智能、天氣、氣候和運營數(shù)據(jù),企業(yè)可以更輕松地管理影響業(yè)務(wù)運營的氣候風(fēng)險,也能夠更好地推進(jìn) ESG 目標(biāo)。例如,通過用人工智能分析具有一致性的天氣和氣候數(shù)據(jù),企業(yè)能夠深入研究一些特定問題,例如確定哪些地區(qū)、建筑物或資產(chǎn)可能貢獻(xiàn)了不成比例的碳排放,以優(yōu)先考慮改進(jìn)工作。
截至2022年9月,我國智慧教育場景申請AI專利近2萬件,其中發(fā)明專利占比超過九成,好未來、小天才、松鼠課堂等智能教育領(lǐng)域企業(yè)專利申請活躍,好未來專利申請超過280余件,其余兩位也均達(dá)百余件,智慧教育主要依托的AI技術(shù)為計算機視覺、知識圖譜、深度學(xué)習(xí)、自然語言處理和智能語音。智慧農(nóng)業(yè)場景中,我國同期申請AI專利約6.7萬件,其中發(fā)明專利占比超過90%,浙江大學(xué)以590余件專利排名首位,騰訊以550余件專利緊隨其后。智慧農(nóng)業(yè)主要涉及的AI技術(shù)主要為智能云、大數(shù)據(jù)、計算機視覺、深度學(xué)習(xí)等。
這份《報告》認(rèn)為,人工智能“頭雁效應(yīng)”持續(xù)彰顯,作為傳統(tǒng)產(chǎn)業(yè)升級轉(zhuǎn)型的核心驅(qū)動,人工智能技術(shù)正成為催生新產(chǎn)業(yè)新業(yè)態(tài)新模式的重要引擎。從生產(chǎn)方式的智能化改造,生活水平的智能化提升,到社會治理的智能化升級,都體現(xiàn)出對人工智能技術(shù)、產(chǎn)品、服務(wù)及解決方案的旺盛需求。我國人工智能領(lǐng)域?qū)@e累深厚,產(chǎn)業(yè)規(guī)模龐大,創(chuàng)新技術(shù)應(yīng)用場景加速落地,具備良好創(chuàng)新優(yōu)勢和產(chǎn)業(yè)基礎(chǔ)。未來一段時間內(nèi),應(yīng)加快AI技術(shù)創(chuàng)新產(chǎn)業(yè)化應(yīng)用,運用AI專利不斷開辟新領(lǐng)域新賽道,全面實現(xiàn)人工智能創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,賦能傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級,推動我國數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。
在盲人視覺問答任務(wù)研究領(lǐng)域,VizWiz-VQA是卡內(nèi)基梅隆大學(xué)等機構(gòu)的學(xué)者們共同發(fā)起的全球多模態(tài)頂級盲人視覺問答挑戰(zhàn)賽,采用"VizWiz"盲人視覺數(shù)據(jù)集訓(xùn)練AI模型,然后由AI對盲人提供的隨機圖片文本對給出答案。在盲人視覺問答任務(wù)中,浪潮信息前沿研究團(tuán)隊解決了盲人視覺問答任務(wù)常見的多個難題。
首先,由于盲人所拍攝圖片模糊、有效信息少,問題通常也會更主觀、模糊,理解盲人的訴求并給出答案面臨挑性。團(tuán)隊提出了雙流多模態(tài)錨點對齊模型,將視覺目標(biāo)檢測的關(guān)鍵實體及屬性作為連結(jié)圖片及問題的錨點,實現(xiàn)多模態(tài)語義增強。其次,針對盲人拍攝圖片難以保證正確方向的問題,通過自動修正圖像角度及字符語義增強,結(jié)合光學(xué)字符檢測識別技術(shù)解決"是什么"的理解問題。最后,盲人拍攝的畫面通常是模糊、不完整的,這導(dǎo)致一般算法難以判斷目標(biāo)物體的種類及用途,需要模型需具備更充分的常識能力,推理用戶真實意圖。為此,團(tuán)隊提出了答案驅(qū)動視覺定位與大模型圖文匹配結(jié)合的算法,并提出多階段交叉訓(xùn)練策略。推理時,將交叉訓(xùn)練后的視覺定位和圖文匹配模型用于推理定位答案區(qū)域;同時基于光學(xué)字符識別算法確定區(qū)域字符,并將輸出文本傳送到文本編碼器,最終通過圖文匹配模型的文本解碼器得到盲人求助的答案,最終多模態(tài)算法精度領(lǐng)先人類表現(xiàn)9.5個百分點。