如果說2023年是大模型技術的元年,那2024年,則是國產大模型全面爆發(fā)的一年。
相信大家已經多多少少了解或者使用過大模型應用,但并不一定知道,如今的多數大模型技術,都是基于英偉達算力底座實現的,就算是國內科技公司的大模型技術,也很少能夠實現完全國產。
其實,在去年底的全球1024開發(fā)者節(jié)上,科大訊飛率先在行業(yè)內提出一條全新的道路:在自主創(chuàng)新的軟硬件基礎上,使用純國產算力平臺——飛星一號,同時帶來了訊飛星火認知大模型V3.0,在工業(yè)、醫(yī)療、教育等專業(yè)領域以及個人應用方面實現了全面提升,并提出了在2024年對標GPT-4的目標。
如今3個月過去了,這個完全由國產算力平臺飛星一號訓練出來的訊飛星火認知大模型也已經升級到了V3.5版本,不僅在對話邏輯、數學能力、代碼編寫等各方面實現了新的突破,還首次發(fā)布了語音大模型,為國內乃至世界的大模型技術帶來了革命性的提升。
作為國內人工智能領域的頭部企業(yè),科大訊飛也成為首批宣布入局大模型的科技公司。據統計,2023年在國內發(fā)布了上百個大模型平臺,質量自然是參差不齊,為此,也有不少權威機構對這些大模型進行了對比。
在去年8月份的《麻省理工科技評論》中國就準備了8個一級大類,共計600道題目對國內的訊飛星火、百度文心一言、商湯商量、阿里通義千問等中文大模型平臺展開系統、科學的測評。
在當時,訊飛星火是以V2.0參與的測試,就以81.5%獲得了綜合得分第一的好成績,其中更是在語言、數學、理科綜合、邏輯思維、編程能力等單項測試中名列第一,得分遠高于平均值,因此,被評為“最聰明”的國產大模型。
在隨后的訊飛星火V3.0,在多次升級后,在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態(tài)能力等七大能力均持續(xù)提升。特別是大模型代碼能力,實現全面對標ChatGPT-3.5,中文超越,英文相當。另外,還新增了虛擬人格功能,AI不僅要能夠回答問題,還要能夠提出問題,不僅要有知識,還要有個性,AI人設為訊飛星火注入了“靈魂”。
至于剛剛發(fā)布的訊飛星火V3.5,七大能力再次升級,其中語言、數學能力已經超過了GPT-4 Turbo,代碼達到了GPT-4 Turbo的96%,多模態(tài)理解也達到了GPT-4V的91%,有了全面對標GPT-4的實力。
以本次訊飛星火V3.5最重要的一個發(fā)布:語音大模型為例,它可不只是在對話中使用語音輸入,據我實測,訊飛星火V3.5的超擬人語音合成效果,聲音非常逼真流暢,還有停頓和一些語氣詞,已經能夠像打電話一樣正常和用戶溝通。
我還注意到,訊飛星火V3.5的語音反饋幾乎脫離了“機器人”的機械感,已經很像真人正常講話了,它能正確使用人類講話的語音語調,在交談時也擁有不同的語氣、斷句等口語特征,偶爾出現的語氣詞、停頓也十分自然,完全沒有傳統聊天機器人的冰冷感,不光能懂我,還能給出積極的正向回復,這讓我很愿意跟它繼續(xù)聊下去。
據了解,訊飛的語音大模型技術已經全面領先于國際同行,落實到具體應用上,首批37個主流語種的效果已經超過了OpenAI Whisper V3,特別是超擬人語音合成度更是達到了83%以上,在大多數場景都能模擬人類真實語音,快速且正確地給出反饋。
值得一提的是,訊飛語音大模型的多語種識別能力,大幅提升了外語的交互能力,并且在訊飛翻譯機中實現了英語、西班牙語、法語、德語、日語等外語的自動識別及翻譯功能,不需要用戶在不同語種之間反復錄入、翻譯,大大提升了使用效率。而且,在中英文的語境中,翻譯機搖身變成一個能夠生成對話內容的“助理”,增強式翻譯技術可以用中英文快速回答我的提問。
顯然,訊飛星火已經將大模型技術轉化成為了用戶能夠親身體驗到的終端產品/應用,在競爭激烈的“百模大戰(zhàn)”中,為什么訊飛能夠如此快地將技術落地,特別是在大模型技術中引入全新的語音交互呢?
我想,這也是因為科大訊飛從公司成立以來,就一直在智能語音技術領域深耕,在語音識別、語音合成等方面全面領先于競爭對手,在全球范圍內都是數一數二的存在。在技術驅動之下,語音大模型的發(fā)布自然就是厚積薄發(fā)的成果了。
得益于此,星火語音大模型完全能夠改變各種智能硬件的交互方式,比如訊飛已經在2022年啟動了訊飛超腦2030計劃,就是要讓懂知識、會學習、能進化的通用人工智能技術,以機器人的實體形態(tài)或虛擬形態(tài)能夠進入到每一個家庭。讓用戶能夠通過自然語言跟各種智能硬件產品直接溝通,擺脫傳統輸入方式的限制,也不用專門學習機器語言,甚至不限語種,只要會說話,就能使用這些人工智能設備,真正實現萬物互聯,讓科幻電影里的賈維斯、MOSS等人工智能機器人,進入我們的生活,帶來顛覆性的行業(yè)變革。這不僅解決了人們的生活剛需,同時也帶來了巨大的商業(yè)價值以及社會價值,讓人工智能技術徹底改變我們的生活習慣,在智能語音技術方面,還得看科大訊飛。
正如前面提到的,訊飛星火認知大模型已經在技術上處于行業(yè)領先地位,那么對于普通消費者來說,它又有什么作用呢?
目前,我們可以通過Web端頁面(地址:https://xinghuo.xfyun.cn/)或者“訊飛星火”App進行體驗,它已經能實現聊天、寫作、編程、繪畫等諸多功能,話不多說,我們直接來看看它的實際水平到底如何。
代碼較長,未完整展現
我們直接上強度,讓它幫我們寫代碼——這是一項大模型技術的重要評判標準,屬于“硬碰硬”的能力,對大模型的理解能力和代碼編寫能力都有很高的要求。
比如我直接用自然語言說出需求,就能讓星火大模型寫出一段完整的小游戲代碼。值得一提的是,生成過程非常快,幾乎是我剛說完一兩秒鐘之后,系統就會開始輸出結果,整個過程不到半分鐘就搞定了。
代碼較長,未完整展現
這也是因為早在訊飛星火V3.0中,就已經大幅提升了大模型代碼能力,在中文領域超越了GPT-3.5,英文也達到了和GPT-3.5相當的水平。如今訊飛星火升級到了V3.5,已經達到了GPT-4 Turbo的96%,更是遙遙領先于其他大模型平臺。
它不僅能寫小游戲,還能制作網頁等。比如我讓它用Java寫一個電商頁面,訊飛星火就給出了一個比較常見的頁面代碼,然后還能解釋這段代碼的原理,并詳細說明調用了哪些函數、用戶需要補充哪些信息等,換個說法就是,不光給出了答案,還有詳細的解題過程,這對于初學者來說是極為友好的。
我認為,這一點才是最重要的。畢竟現在許多傳統行業(yè)都在向數字化轉型,比如有不少醫(yī)療、金融、工業(yè)等領域的業(yè)界精英,他們可能完全不懂編程,而懂編程的程序員也不了解這些專業(yè)領域的工作,而且有許多專業(yè)詞語及每個人的表述方式可能都不太一樣,這就容易導致工作難以推進。之前的解決方案一般都是通過產品經理等在中間進行“翻譯”,但仍然需要大量的溝通時間,整個流程效率仍然不高。
但是現在我們可以通過訊飛星火的大模型技術,直接用自然語言發(fā)出指令,系統就能讀懂并快速給出反饋,省去了很多溝通以及代碼編寫過程,這對各行各業(yè)數字化建設的幫助是極大的。
對了,從現在到2024年底,程序員還能免費使用智能編程助手iflycode協助自己完成大量的編程工作,大幅提高工作效率,感興趣的程序員可訪問訊飛開放平臺獲取(
https://passport.xfyun.cn/login)。
解題過程較長,未完整展現
也許你會說,我平時也用不上代碼啊,訊飛星火還有什么用呢?
像是大家熟悉的日常聊天、畫圖等功能就不說了,在此前的版本中就已經實現,還能結合前文語境,實現連續(xù)對話,基本的日常溝通完全難不倒它,再加上新增的語音交互功能,可玩性和實用性都很高。在這一環(huán)節(jié),我直接將難度拔高,用去年的高考題來試試訊飛星火V3.5的數學答題能力。
實測可以看到,訊飛星火V3.5不僅能手動、語音輸入題目,還能實現OCR圖片識別,快速“讀題”,還是挺方便的。我繼續(xù)實測了許多高考題,它都能正確、快速地給出答案和解題過程,根本難不倒它。而且反饋也非常迅速,能夠迅速給出答案以及詳細的過程,并且提供了完整的解題思路,這可比那些只能給答案的作業(yè)輔助軟件強多了。
就算你已經從學校畢業(yè),開始工作,最近應該都在寫年度總結吧,我預設了自己的身份是一名初三英語老師,然后簡單說明了本學期的教學成績,訊飛星火大模型不光總結了我提出的要求,還豐富完善了細節(jié),比如考試平均分、英語競賽情況等,可能我們自己在寫總結的時候都會忘記的內容,它都幫我們想到了。
另外,訊飛星火還給出了我完全沒有提到的教學策略與方法,在其中詳細寫明了自己在教學工作中的創(chuàng)新以及學生的反饋、評估結果等,最后也完善了在未來的職業(yè)規(guī)劃及展望,整體來看,是一篇非常完整且符合人物設定的年度總結,接下來我們只需要根據實際情況進行修改微調就可以了。
顯然,無論是寫代碼、文章,還是閑聊、做題,訊飛星火V3.5都能快速準確地做出反饋,大幅減少工作量,同時也能在創(chuàng)意類工作上提供不少的思路。比如大家經常都要制作PPT,訊飛這次也發(fā)布了一個全新工具——訊飛智文,它運用了星火大模型技術,用戶只需選擇PPT主題、大綱和模板之后,就能快速生成一個圖文并茂的PPT文件,同時還能生成一個虛擬形象來進行講解,能夠大幅減少繁瑣、枯燥的工作流程,甚至能快速且智能地夠精準修改局部細節(jié),堪稱打工人的最佳助手。
這也是因為科大訊飛一直堅持“技術頂天、應用落地”,用領先于行業(yè)的技術實力,將人工智能以及大模型轉化成為了用戶看得見摸得著,并且能夠真正提供幫助的落地應用。
從星火V3.5的實際表現來看,訊飛真的做到了。
這些基礎應用,能夠為用戶提供實打實的幫助,這一切的背后,也反映出了訊飛星火大模型,以及飛星一號算力平臺的實力。其實除了功能強大,訊飛星火還一直非常強調數據安全,目前主流大模型算力都是來自于英偉達,但是只有將算力平臺牢牢把控在自己手里,才能真正保證用戶的數據安全。
為此,訊飛星火通過一整套的內容安全機制,保證用戶能夠得到完整的體驗,這背后就非常考驗大模型技術的理解和概括摘要能力。
在算力安全上,訊飛聯合華為打造了一套自主可控的大模型算力底座平臺——飛星一號,該平臺基于昇騰生態(tài),將高算力AI芯片及多卡高速互聯、分布式存儲等結合起來,同時訓練和數據也實現了閉環(huán)全流程設計,整個訓練和推理設計過程都源自于自研的訓練平臺,這也讓訊飛星火大模型的技術和落地產品,都架構在了安全可控的國產平臺上。
其實在2019年,科大訊飛就被美國列入了實體清單,隨后立刻開始在內部實施國產化替代方案,這也是因為訊飛一直堅持只有自己掌握節(jié)奏才能實現真正破局。去年上半年,訊飛和華為的合作就已經進行了多次升級,下半年在訓練和推理能力上有了大幅進步,也讓訊飛星火大模型在技術和落地應用方面,都做到了領先于行業(yè)。
飛星一號問世之初,訊飛內部也有過討論,畢竟直接采用已經成型的英偉達平臺,早期版本的星火大模型效果可能會好一些。但是最終仍然選擇了國產方案,為此,劉慶峰說道:“如果誰都不往前走一步,而且沒有能夠堅定地提供底座的廠商,這個國家始終是沒有辦法自立自強。”
訊飛星火以及飛星一號算力平臺的成功,也讓我們看到了國產算力平臺趕超英偉達的希望,這對于中國大模型技術,乃至整個科技行業(yè)都是一個振奮人心的消息。
訊飛AI學習機作文批改界面
實際應用方面,不光有訊飛星火Web端及App這樣的軟件應用,訊飛還推出了不少基于大模型技術的智能硬件產品。比如科大訊飛AI學習機就提供了“精準學”功能,可迅速判斷學生的知識薄弱點,然后再進行針對性訓練;另外,還提供了中英文作文批改功能,不僅會批注出錯別字、修改建議等,最后還會根據作文里出現的問題和章節(jié)習作要求,給出針對性的建議,在完成修改的同時,還能學到更多的寫作技巧,用在今后的學習中。
這只是其中一個例子,訊飛還在自家的錄音筆、翻譯機、辦公本等智能硬件上適配了大模型技術,同時也發(fā)布了國產軟硬件一體化的大模型解決方案訊飛一體機,軟件方面,更是推出了訊飛語伴、訊飛智作、iFlyCode等應用,無論是軟硬件層面,訊飛星火大模型都為科研、工業(yè)、民生等領域帶來了全新的模式,用大模型技術賦能之后,我們的生產生活方式自然有了翻天覆地的變化。
目前,在訊飛的大模型生態(tài)下,已經聚集了35萬的開發(fā)者,企業(yè)服務、教育培訓、智能客服、醫(yī)療健康等各個領域的企業(yè)開發(fā)者也達到了22萬。同時,訊飛也與諸多知名的頭部企業(yè)達成了合作,將大模型技術應用在了各行各業(yè)。
可以預見的是,科大訊飛還會推出更多基于訊飛星火大模型技術的人工智能產品及應用,在各行各業(yè)為我們的生產、生活帶來便利。純國產的訊飛星火認知大模型和飛星一號大模型平臺,也無需擔心外在的限制,以自身強大的實力,引領技術創(chuàng)新,在不同的領域發(fā)揮大模型技術的優(yōu)勢,為行業(yè)的發(fā)展帶來顛覆性的變化,擁抱光明的未來。