6月9日,科大訊飛在24周年司慶當天,發布訊飛星火認知大模型V1.5,這也是繼5月6日科大訊飛大模型公開以來的第一次迭代。短短的一個月零三天,這個升級版本做得到底怎么樣?是否能按照先前公布的時間表實現對標ChatGPT的目標?這就是它的第一次摸底考。
此前我們體驗了這款大模型V1.0版本,并對比了它與ChatGPT對中文自然語義的理解能力。得益于其本身作為一款中國本土市場的AI模型,能夠基于海量中文文本語料進行訓練,同時在相關的核心算法上也更貼近中文的使用環境和習慣,在對中文自然語義的理解方面,訊飛星火認知大模型擁有先天的優勢。
按照訊飛官方公布的迭代節點,6月9日的升級,星火將突破開放式問答,多輪對話能力明顯提升,數學能力再上一個新的臺階。在體驗過V1.5后,我發現,除了對中文自然語義的理解能力,其甚至還升級了語義表達中的情感色彩認知能力。
比如:“女孩子對男孩子說,你是一個好人”,訊飛星火V1.5給出的理解是:
在對這句話做出情感傾向的分析之后,訊飛星火V1.5最后還提醒到:“雖然這句話本身代表了積極情感,但并不代表就一定發展到了戀愛程度,人們用‘好人’來形容某個人,只是單純地表示欣賞和尊重,并沒有其他深層次的感情含義。”
顯然,訊飛星火V1.5對于“發好人卡”這件事還是有所領悟的。
而在多輪對話能力上,除了對上下文理解的加深,訊飛星火V1.5同樣能夠在這當中加入情感傾向的分析。
例如將“女孩子哭著對男孩子說,你這個大笨蛋”這句話輸入訊飛星火V1.5,它認為這句話可能包含憤怒、失望、沮喪等消極情緒。但換成“女孩子邊笑邊哭對男孩子說,你這個大笨蛋”,訊飛星火V1.5則會告訴你,這個女孩可能喜歡你。
不得不說,在理解女生這件事上,訊飛星火V1.5可能已經超過了一部分人了。
當然,相對于這些單一的自然語言的理解能力,能夠幫助我們寫郵件、做策劃的文本生成能力,更是這類語言大模型在當下最具“生產力”的特性。在之前的測試中,訊飛星火大部分時候生成的文本,都能夠做到“拿來即用”的水平。
除此以外,文本總結能力同樣也是其當下極具生產力特性的場景。對于AI可能帶來的改變,科大訊飛劉慶峰就曾提到,“可以成為科研工作的加速器,把年輕、優秀的工作人員的大量收集資料、邊緣工作的時間節省下來,AI for Science也可以再上臺階。”
為了測試訊飛星火V1.5的文本總結能力,我將《入手必看!教你怎么選最實用的中端機》這篇文章輸入了進去,全文共3500字,主要分析了中端手機市場的細分趨勢,以及面對這種“專機專用”的情況,消費者該如何選擇的問題。
可以看到,訊飛星火V1.5將這篇文章總結到了350字左右,是原文的十分之一,四個分段正好對應文章的四個部分。更讓我驚訝的是,它還準確地提煉出了針對不同用戶需求,可以選擇的具體手機型號,這部分正是整篇文章的精華所在,為用戶給出了直接的答案。
我們都知道,訊飛這些年在教育領域一直都有深入的拓展,后續借助訊飛星火大模型的能力,科研類產品也將會得到飛速提升,將資料收集、信息處理的時間大量節省下來,將會給科研行業帶來更多的賦能。除此外,從長遠來看,這方面的創新和布局,在很多領域也都擁有很廣闊的應用前景和想象空間。
在5月份星火認知大模型的發布會上,劉慶峰也表示,“今天要看一個大模型系統到底好不好,首先要看它是不是能解決剛需、是不是真的有用,而不是一個簡單的單點測試”。
這次訊飛星火V1.5除了提升各項能力指標之外,也變得更走進千家萬戶了。發布會上,科大訊飛推出了“星火助手中心”,星火APP(iOS、安卓)和小程序。這意味著,每個人接觸AI大模型的門檻都更低了,只需要在手機上就能實現與大模型的交互體驗。
同時,星火APP還支持全語音對話、多模態輸入等。只需長按輸入框中的語音輸入按鈕,APP會實時將語音轉化為文字,語音說完后松手,文本問題隨即發送。
大模型給出答案后,點擊對話框下方“播放按鈕”,即可實現對文本內容的朗讀。在“設置”中還可以選擇發音人體驗不同音色合成播報效果。在語音的一問一答中,獲得更符合使用習慣的交互體驗。
另外,在多模態輸入方面,星火APP中的數學解題助手已可以自動識別上傳圖片上的問題,并支持手動選中具體的問題,從而給出更加精準的答案,以及解題步驟。
“星火助手中心”的出現更是大大簡化了大模型的交互方式。以文本生成為例,過去我們需要為AI模型賦予身份、描述背景、提出需求,然后生成文本,比如我們想讓AI模型創作一個故事,需要賦予它故事創作者的身份,然后描述出故事背景,再由AI進行文本生成。
現在只需要用星火助手中心的“故事創作助手”,給到它一句故事思路,它就能把故事編寫下去。
同樣,你可以直接輸入PPT的核心內容,“PPT大綱助手”會提供PPT大綱;輸入周報的提示內容或關鍵詞,“周報小助理”可以幫你潤色周報……
本次發布的星火助手中心,官方上線了200+小助手,涵蓋了職場、營銷、學習、點評、創作、生活、出行、趣味等多種應用場景。在官方提供的助手之外,還同步上線了助手創作中心,支持用戶新建助手。
用戶還可以選擇將自己創建的助手在助手市場上架分享,向所有用戶開放使用,實現星火助手規模的快速規模增長,同時激發更多用戶創建助手的靈感。根據實測,6月9日發布會介紹時助手數量為200+,6月14日數量已經達到近600個,增長非常迅速!
不僅是在電腦端,在APP端,用戶也可以直接調用星火助手中心,在文本輸入框中,輸入@,可以很方便地調用進入需要的助手模式。同一個賬號下,電腦端和APP端的歷史對話以及使用過的助手及對話內容都是實時同步的,真正做到了隨時隨地想用就用。
可以說,訊飛打造的這種新的Prompt“應用開發”場景,通過大模型降低應用開發門檻,讓創意即想即用。也正如劉慶峰所說的那樣,大模型不是為測試而生,而是要真正解決有用、好用的問題,訊飛星火V1.5的到來,讓AI大模型進入人人可用的時代。
在星火大模型發布之際,科大訊飛董事長劉慶峰給出了星火年內的三個關鍵里程碑,以達到今年10月通用模型能力對標ChatGPT的目標。這也是國內大模型廠商唯一明確給出升級時間表的。
我們知道,今年以來AI大模型爆火,國內已有數十家企業入局,“百模大戰”的序幕已經拉開,在大戰之初,訊飛是不是顯得太著急?但從一個月前星火大模型的第一次測試,到今天對星火V1.5的深入體驗,我們可以清晰的得知,訊飛星火并非蒙眼狂奔。
從星火V1.0到星火V1.5,不僅是版本升級,更顯示出在產品能力升級、產品應用以及共建生態方面,訊飛大模型的有序快速迭代。
星火助手中心的到來,將幫助訊飛開放平臺降低技術開發門檻,有助于更多開發者完成諸多智慧涌現的工作,同時集成越來越多的專業插件,讓生態體系更加繁榮。
據了解,截至5月份,訊飛開放平臺已有400多萬實名認證的開發者、500多萬的合作伙伴。同時訊飛已經與36個行業、超3000家企業達成明確合作意向。
劉慶峰談道,“星火大模型,就是寓意星星之火、必將燎原。”訊飛的“燎原行動”也并非科大訊飛一家來做,還將與全國的創新平臺共同合作,把能力開放給訊飛開放平臺的開發者生態、羚羊工業互聯網平臺等,共同形成比較優勢,助力所有人在人工智能全新平臺上創新創業、對外合作,帶來人工智能開放生態的全面升級。
訊飛的時間表,正是其一步一個腳印,朝著最終的目標——讓人工智能造福全人類邁去。中國版ChatGPT絕不是訊飛星火的終點,而是逐漸從萌芽破局到落地轉化,最終成長為一顆為服務民生剛需、產業發展的參天大樹。
長期主義的夢想需要一個又一個階段里程碑來實現。8月15日,星火大模型聚焦于代碼能力升級以及多模態交互能力提升的二次迭代,讓我們一起期待見證它的下一個里程碑。