您現在的位置:首頁 > 經濟 > 正文

天天最資訊丨科大訊飛動真格:星火大模型七大維度評測,率先落地應用

時間:2023-05-07 13:18:33    來源:紅星資本局    

(原標題:科大訊飛動真格:星火大模型七大維度評測,率先落地應用)

5月6日,科大訊飛(002230.SZ)正式發布訊飛星火認知大模型(下稱“星火”)。

當有的廠商為大模型不確定的商業化落地前景感到焦慮時,科大訊飛迎頭趕上,不僅現場收集問題進行測試,還針對大模型推出七大評測維度。


(資料圖片僅供參考)

更重要的是,紅星資本局注意到,科大訊飛成為了國內率先將大模型落地應用的廠商,并推出了推出面向教育、辦公、車載等行業的解決方案。

科大訊飛在AI領域十年如一日的積累,在此時成為了可以燎原的星火。

現場收集問題進行測試

科大訊飛動真格,七大維度評測

科大訊飛一上來就是動真格。

5月6日,在發布會現場,科大訊飛的董事長劉慶峰、研究院院長劉聰在發布會現場用幾分鐘收集了上千個問題,并隨機抽取了5個問題現場測試。

——“外星人感冒了需要戴口罩嗎?”

——“我想把40㎡的房子裝修成70㎡的感覺,請給出可行的方案。”

——“公眾場合大聲喧嘩會影響別人的心情,那小聲講話是不是就不會影響?”

如果只靠回答這些問題來證明星火的能力,那科大訊飛恐怕又會落入俗套,劉慶峰顯然看得更加長遠,不是從企業、而是從整個行業的角度去看待問題。

“我特別想說的是,如果我們要讓認知智能真的解決社會剛需(問題),而不是簡單地做PR、做宣傳的話,我們就要建立一套實實在在的用科學系統來評測的體系。”劉慶峰說。

作為人工智能領軍之一,科大訊飛通過認知智能全國重點實驗室牽頭設計了評測體系,并與相關聯盟共同探討形成了覆蓋七大維度的481個細分任務對通用認知大模型進行評測。

其中,七大維度指的是文本生成、語言理解、知識問答、邏輯推理、數字能力、編程能力和多模態,星火在此次的發布會上被現場考驗了每一個維度的問題。

——“請問孔子在2008年的奧運會上說了些什么?”

——“等腰三角形的頂角是底角度數的2倍,請問這個三角形的底角是多少度?”

——“俗話說,男子漢大丈夫寧死不屈;但俗話又說,男子漢大丈夫能屈能伸。這兩種說法應該怎么理解呢?”

紅星資本局在現場注意到,星火在個別維度上的表現偶有瑕疵,但整體表現優秀,尤其是在最后一個維度多模態上,它的表現可謂是驚艷。

先是劉聰語音輸入要求,讓星火以“立夏”為題寫一篇200字散文,然后又要求星火以溫柔的男聲朗讀,每個任務星火都完美達成。甚至,在被提出生成女性形象的虛擬人朗讀時,星火只用不到10秒的時間成功生成虛擬人的視頻。

從接受語音需求到文本生成,再從語音朗讀到實時生成虛擬人,星火展現了大模型能達到的豐富形態和能力,讓我們認識到大模型在生活中存在的另一種無限可能。

業界尚愁落地不確定性

科大訊飛一口氣推出多款落地產品

當前,業界普遍還認為,通用認知大模型的商業化前景尚不明確,行業落地存在不確定性。而科大訊飛憑借在AI領域的多年積累,此次一口氣推出了搭載大模型的多款產品。

以教育領域為例,搭載星火的科大訊飛AI學習機T20系列實現了中英文作文類人批改。

劉慶峰認為,在語言學習的過程中,作文能力很難得到提升。因為針對性的指導和批改耗時耗力,老師很難對每一個學生的情況進行深度的分析、教導,而星火帶來了全新的體驗。

從現場實時演示來看,和傳統學習機一樣,該學習機也能進行針對字詞標點糾錯、識別句式修辭錯誤等基礎批改,同時,該學習機還能圍繞寫作要求分析全篇結構和文采,如某一句可以優化、建議加入動作描寫和神態描寫等。

相對來看,學習機可能只調用了星火在文本生成、語言理解等維度的能力,另一產品更能綜合地體現星火多維度的能力——“大模型+數字員工”。

在發布會上,劉聰要求星火復盤科大訊飛的“飛凡計劃”(招收優秀應屆畢業生的招聘項目),在無人操作的情況下,星火自動登錄HR系統,并根據要求導出數據、分析數據、生成PPT。

紅星資本局注意到,在整個過程中,星火或動用了語言理解、邏輯推理、數字能力、編程能力和多模態等多維度的能力完成指令。

星火正在對科大訊飛的“飛凡計劃”進行復盤

事實上,除了上述兩個領域外,科大訊飛還發布了星火在辦公和汽車等領域的行業應用成果,如“大模型+智能辦公本”、“大模型+訊飛聽見”和“大模型+智能座艙”等。

從目前推出的大模型進度來看,科大訊飛毫無疑問是率先應用落地的廠商。可以說,星火的現在,或許可能就是不少投身AI創業浪潮之人還在暢想的未來。

科大訊飛的多年積累

從數據、算法到模型、算力均有優勢

為什么科大訊飛能成為率先將大模型應用落地的廠商?

正如劉慶峰在此次發布會上說的,“這一次認知大模型本質上是一次對話式的通用智慧的涌現,語音和語言的核心能力是一個基礎條件。”

紅星資本局注意到,科大訊飛最早在2011年就承建了語音及語言信息處理國家工程實驗室,而且在認知智能領域中不斷投入進行研發,有長達十幾年的積累。

以數據為例,劉聰今年曾對媒體透露,在嚴格遵守適用法律法規前提下,科大訊飛在多年認知智能系統研發推廣中積累了超50TB的行業語料和每天超10億人次用戶交互的活躍應用。

當然,光有數據積累是不夠的,還需要優秀的算法和模型。

科大訊飛財報曾披露,其在認知智能大模型最核心的Transformer深度神經網絡算法方面擁有豐富的經驗,且已廣泛應用于科大訊飛的語音識別和圖文識別等,已達到國際領先水平。

另外,科大訊飛現已開源6個大類、超過40個通用領域的系列中文預訓練語言模型,相關模型庫月均調用量超1000萬,在Github平臺獲得星標數位列同類中文預訓練語言模型前列。

這也體現在科大訊飛連年增長的研發費用中。紅星資本局翻閱財報發現,在過去五年中,科大訊飛的研發費用分別為12.63億元、16.40億元、22.11億元、28.30億元和31.11億元。

更為重要的是,科大訊飛在算力上占據優勢。

科大訊飛在今年4月曾通過投資者關系活動記錄表披露稱,其在總部自建有業界一流的數據中心,且已建成4 城7中心深度學習計算平臺,為大模型訓練平臺建設奠定了硬件基石。

這些或許是科大訊飛喊出“10月底整體趕超ChatGPT”的底氣,我們拭目以待。

(唐浩)

標簽:

相關新聞

凡本網注明“XXX(非現代青年網)提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和其真實性負責。

特別關注

熱文推薦

焦點資訊