您所在的位置:紅商網 >> 天下匯頻道 >> 正文
年終盤點:2022年,人工智能帶給人類更多驚喜

  即將過去的2022年,對于人工智能來說是值得銘記的一年。大批人工智能相關應用走出實驗室,向著大范圍落地實踐不斷邁進。AI“黑科技”加持下的北京冬奧會異彩紛呈;無人駕駛開啟多城試點,未來交通更進一步;AI繪畫以假亂真令人著迷,藝術創(chuàng)作或許不再是人類專屬……

  無論是底層技術不斷突破,還是各類應用百花齊放,在過去的一年,人工智能向我們展示了它的無限可能。我們相信這只是人工智能的冰山一角,未來它還有更多潛力等待我們去挖掘。

  隨著技術的不斷成熟,落地應用不斷創(chuàng)新,人工智能或將真正改變你我的生活。

  AI“黑科技”照亮北京冬奧會

  助力天氣預報、比賽轉播和手語播報等

  2月4日,全球矚目的2022年北京冬奧會正式拉開帷幕。人工智能等技術的應用為本屆冬奧會增添了別樣的“科技之美”。

  在此次冬奧會上,由中國科學院院士、北京大學副校長、北京大學重慶大數據研究院首席科學家張平文領銜研制的人工智能MOML算法賦能天氣預報模型,使冬奧會天氣預報更加精準。人工智能算法在融合、處理信息中的先天優(yōu)勢,使其在一定程度上可以代替預報員在會商中進行信息整合、分析,通過數據挖掘與學習,將預報員的經驗內化在算法中,在提高天氣預報效率的同時,也進一步提高了預報的準確率。

  在本屆冬奧會自由式滑雪女子大跳臺決賽中,中國選手谷愛凌以“逆天”的精彩表現獲得個人首金。在比賽轉播過程中,百度智能云通過“3D+AI”技術打造出的“同場競技”系統,將單人比賽項目變成“多人比賽”,實現冠、亞軍比賽畫面的三維恢復和虛擬疊加,方便觀眾看到不同選手的實時動作;同時,通過技術手段對運動員動作進行量化分析,將滑行速度、騰空高度、落地遠度、旋轉角度等一系列運動數據與原始畫面疊加起來,使觀眾可以更直觀地從流暢性、完成度、難度、多樣性和美觀度等角度看懂選手之間的技術動作差異。

  在北京冬奧會開幕的同一天,央視新聞AI手語主播也正式上崗,她在冬奧會新聞播報、賽事直播和現場采訪中,為聽障人士送上了實時手語翻譯服務。憑借精確的手語翻譯引擎,該AI手語主播可懂度達85%以上,可將冰雪賽事的文字及音視頻內容,快速精準地轉化為手語。

  騰訊“混元”AI大模型登頂VCR榜單

  展現了其在多模態(tài)理解領域的強大實力

  5月31日,騰訊“混元”AI大模型在多模態(tài)理解領域國際權威榜單VCR(Visual Commonsense Reasoning,視覺常識推理)中登頂,兩個單項成績和總成績均位列第一。這是繼在跨模態(tài)檢索領域大滿貫、CLUE自然語言理解分類榜及CLUE總榜登頂后,“混元”AI大模型的又一重大突破,展現了其在多模態(tài)理解領域的強大實力。

  與跨模態(tài)理解任務不同的是,多模態(tài)理解任務要求計算機除了能夠做到識別層次的感知(如分類檢測等),還需要達到認知層次的感知(如判斷意圖、邏輯推理等)。

  此次登頂VCR榜首的“混元”AI大模型由騰訊廣告多媒體AI團隊自主研發(fā),同時借助騰訊太極機器學習平臺的圖形處理器算力和訓練加速框架,在預訓練任務、訓練方式上進行了諸多創(chuàng)新改進和設計,有效提升了模型性能。

  截至目前,“混元”AI大模型在MSR-VTT、MSVD、CLUE、VCR等多個領域的AI權威榜單中取得了第一名的成績,并刷新多項行業(yè)歷史紀錄。這意味著,“混元”在自然語言理解、多模態(tài)理解、跨模態(tài)理解等領域的技術實力已得到驗證。

  谷歌工程師鬧烏龍,稱AI存在意識

  人工智能所謂的“人格”更多只是模仿人類罷了

  谷歌AI工程師鬧烏龍,稱LaMDA語言模型有意識,引發(fā)業(yè)界對“AI是否擁有自主意識”的討論。

  今年6月,谷歌公司AI工程師萊莫因認為對話應用語言模型LaMDA具有了“自主意識”,并對此出具了長達21頁的證據。萊莫因認為LaMDA具有意識的原因有三:一是LaMDA以前所未有的方式高效、創(chuàng)造性地使用語言;二是它以與人類相似的方式分享感覺;三是它會表達內省和想象——既會擔憂未來,也會追憶過去。

  LaMDA是谷歌在2021年開發(fā)者大會上公布的大型自然語言對話模型,它可以模擬任何帶有知識屬性的實體,通過“擬人”的方式,在與人類親切自然的對話中為用戶答疑解惑,傳遞更多知識。

  萊莫因的觀點和證據引起了業(yè)內的廣泛關注。不久后,谷歌發(fā)表聲明稱,萊莫因違反了“就業(yè)和數據安全政策”,將其解雇。谷歌表示,經過廣泛地審查,他們發(fā)現萊莫因關于LaMDA是有生命的說法是完全沒有根據的。

  專家普遍認為,當下人工智能具有的所謂“人格”,更多只是模仿人類的語言風格,有自我意識、有感知能力的AI應該具備能動性,并具有獨特的視角看待人和事,但目前AI還只是人們設計的一個計算機系統,作為工具來做一些特定之事。

  全球首個圖、文、音三模態(tài)大模型誕生

  “紫東太初”實現“以圖生音”和“以音生圖”

  9月1日,在上海舉辦的2022世界人工智能大會上,由武漢人工智能研究院、中國科學院自動化研究所和華為技術有限公司聯合研發(fā)的“紫東太初”多模態(tài)大模型項目獲得了此次大會的最高獎項。“紫東太初”是全球首個圖、文、音三模態(tài)大模型,開創(chuàng)性地實現了圖像、文本、語音三模態(tài)數據間的“統一表示”與“相互生成”,實現了“以圖生音”和“以音生圖”,理解和生成能力更接近人類,為打造多模態(tài)人工智能行業(yè)應用提供創(chuàng)新基礎,向通用人工智能邁出了重要一步。

  “紫東太初”三模態(tài)間的相互轉換和生成,其核心原理是視覺、文本、語音不同模態(tài)通過各自編碼器映射到統一語義空間,然后通過多頭自注意力機制學習模態(tài)之間的語義關聯以及特征對齊,形成多模態(tài)統一知識表示;之后,再利用編碼后的多模態(tài)特征,通過解碼器分別生成文本、圖像和語音。

  “紫東太初”憑借四大突破,有效助力以多模態(tài)認知為核心的通用人工智能發(fā)展。一是首次提出多層次、多任務跨模態(tài)自監(jiān)督學習框架,支持從詞條級走向模態(tài)級、樣本級的三級預訓練自監(jiān)督學習方式;二是首次完成弱關聯多模態(tài)數據語義統一表示,減少數據收集與清洗代價;三是首次實現多模態(tài)理解與生成任務的統一建模,支持跨模態(tài)檢索、多模態(tài)分類、語音識別、圖像生成等理解與生成任務;四是首次實現無監(jiān)督超越有監(jiān)督方法,基于5%—10%的數據標注,實現100%的有監(jiān)督學習效果。

  AI打破矩陣乘法計算速度紀錄

  解決了50年來數學領域一個懸而未決的問題

  10月,英國《自然》雜志封面以“矩陣游戲”為題,發(fā)表了人工智能公司“深度思維”團隊的最新發(fā)現:AI可以解決矩陣乘法問題。這款名為“AlphaTensor”的AI系統能自行發(fā)現新算法,從而解決了50年來數學領域一個懸而未決的問題——找到兩個矩陣相乘最快的方法。這是第一個可為矩陣乘法等基本任務發(fā)現新穎、高效且正確算法的AI系統。

  數學在計算機編程中經常出現,通常作為描述和操縱現實世界現象表示的一種手段。例如,它可用于表示計算機屏幕上的像素、天氣狀況或人工網絡中的節(jié)點。在這種情況下,使用數學的主要方式之一,就是對矩陣進行計算。矩陣越大,工作量也越大,計算機科學家開始花費大量時間和精力開發(fā)更加有效的算法來完成相關工作。

  在此次最新成果中,“深度思維”團隊研究人員探究了是否有可能使用基于強化學習的AI系統來創(chuàng)建新算法,從而使計算步驟比現有算法更少。

  為了找到答案,他們從游戲系統中尋找靈感。在構建了一些初步系統之后,研究團隊將重點轉向了樹搜索,這是系統在特定情況下查看各種方案的一種方法。

  接下來,研究人員將允許系統創(chuàng)建自己的算法,進一步提高效率。他們發(fā)現,在許多情況下,系統選擇的算法比人類創(chuàng)建的算法更好。“深度思維”團隊希望,未來AI能更多地用來幫助攻克數學和科學領域的一些重要的難題。

2頁 [1] [2] 下一頁 

搜索更多: 人工智能

東治書院2024級易學文士班(第二屆)報名者必讀
『獨賈參考』:獨特視角,洞悉商業(yè)世相。
【耕菑草堂】巴山雜花土蜂蜜,愛家人,送親友,助養(yǎng)生
解惑 | “格物致知”的“格”到底是什么意思?
❤❤❤【拙話】儒學之流變❤❤❤
易經 | 艮卦究竟在講什么?兼斥《翦商》之荒謬
大風水,小風水,風水人
❤❤❤人的一生拜一位好老師太重要了❤❤❤
如何成為一個受人尊敬的易學家?
成功一定有道,跟著成功的人,學習成功之道。
關注『書仙笙』:結茅深山讀仙經,擅闖人間迷煙火。
研究報告、榜單收錄、高管收錄、品牌收錄、企業(yè)通稿、行業(yè)會務
★★★你有買點,我有流量,勢必點石成金!★★★