
發(fā)力AI大模型訓(xùn)練服務(wù),火山引擎原動(dòng)力大會(huì)引關(guān)注
4月18日,字節(jié)跳動(dòng)旗下的云服務(wù)平臺(tái)火山引擎在其舉辦的“原動(dòng)力大會(huì)”上重磅發(fā)布了多款云產(chǎn)品,其中,全新升級(jí)的機(jī)器學(xué)習(xí)平臺(tái)憑借領(lǐng)先的性能和基于抖音大規(guī)模機(jī)器學(xué)習(xí)工程實(shí)踐的經(jīng)驗(yàn)而格外受到外界關(guān)注,也顯示出火山引擎致力于成為AI大模型訓(xùn)練發(fā)動(dòng)機(jī)的決心。

火山引擎自研DPU發(fā)布
作為云計(jì)算和數(shù)字化領(lǐng)域的頭部盛會(huì),火山引擎原動(dòng)力大會(huì)延續(xù)了“敏捷迭代”“數(shù)據(jù)驅(qū)動(dòng)”“體驗(yàn)創(chuàng)新”的增長(zhǎng)三要素。除了技術(shù)驅(qū)動(dòng)極致性?xún)r(jià)比,開(kāi)放共享和業(yè)務(wù)價(jià)值驅(qū)動(dòng)也是火山引擎始終堅(jiān)持的做云服務(wù)的理念。
值得注意的是,火山引擎此次發(fā)布的多款技術(shù)產(chǎn)品已經(jīng)被實(shí)際應(yīng)用到這場(chǎng)發(fā)布會(huì)中,貫穿整個(gè)大會(huì),并取得了較為驚艷的效果。火山引擎原動(dòng)力大會(huì)上究竟采用了哪些科技與狠活兒,電腦報(bào)記者帶你一探究竟。
技術(shù)成果與應(yīng)用零距離接觸
在這次大會(huì)開(kāi)始之前,電腦報(bào)作為受邀人,在填寫(xiě)報(bào)名信息后就可以自動(dòng)生成漫畫(huà)風(fēng)格頭像邀請(qǐng)函。盡管對(duì)科技圈人士來(lái)說(shuō),這已經(jīng)是比較普遍的多模態(tài)生成技術(shù)的應(yīng)用了,市面上基于AI算法、輸入文字或圖片即可生成相應(yīng)的高質(zhì)量圖片的產(chǎn)品并不少,但火山引擎的優(yōu)勢(shì)在于這一智能繪圖產(chǎn)品性能更強(qiáng)可以更快速的出圖。
火山引擎AI團(tuán)隊(duì)基于Stable Diffusion模型,利用自研Diffusion Model蒸餾算法,減少了采樣步數(shù),顯著降低了推理耗時(shí),因此其智能繪圖相對(duì)于官方基準(zhǔn)模型的出圖速度可以提升4~8倍,且效果更加精細(xì)穩(wěn)定。
火山引擎在生成式AI賽道的應(yīng)用

經(jīng)過(guò)AI算法生成的漫畫(huà)風(fēng)格圖片
這種效率的提升首先就應(yīng)用在了字節(jié)旗下的社交短視頻平臺(tái)上——去年在抖音上走紅的“AI繪畫(huà)”特效,從啟動(dòng)到上線只有一周左右,模型訓(xùn)練僅由一名算法工程師完成,生成圖片的速度已經(jīng)能控制在5秒左右。通過(guò)采用DataFinder增長(zhǎng)分析平臺(tái)為邀請(qǐng)函埋點(diǎn),火山引擎還能通過(guò)數(shù)據(jù)分析,了解受邀客戶(hù)對(duì)最新技術(shù)及火山引擎產(chǎn)品的關(guān)注度。
拍視頻、拍Vlog是網(wǎng)絡(luò)原住民們記錄生活的最佳方式之一,在大會(huì)現(xiàn)場(chǎng),媒體參與者可以直接通過(guò)“智能硬件拍攝+云端剪輯”的方式,享受高精度“自動(dòng)打卡”視頻成片。不僅降低了用戶(hù)拍攝Vlog的硬件和技術(shù)門(mén)檻,還可以直接連接抖音集團(tuán)旗下的短視頻平臺(tái),發(fā)布成片,這也是火山引擎音視頻云端一體解決方案的充分展示,對(duì)于文旅、營(yíng)銷(xiāo)、城市文化等行業(yè),這一方案有助于提升游客和用戶(hù)的場(chǎng)景體驗(yàn),打造文化IP,提升品牌宣傳效果。
音視頻技術(shù)降低Vlog拍攝門(mén)檻
在一些不經(jīng)意的角落也可以看出火山引擎在算力調(diào)度上的經(jīng)驗(yàn)優(yōu)勢(shì)。會(huì)場(chǎng)中,參會(huì)者可以隨時(shí)看到展區(qū)即時(shí)的人流熱力圖、曲線等,這都是利用展區(qū)部署的攝像頭對(duì)展區(qū)人流量及重點(diǎn)區(qū)域停留時(shí)間進(jìn)行識(shí)別與分析得到的,利用的都是邊緣云基礎(chǔ)設(shè)施。據(jù)了解,以上技術(shù)未來(lái)可以面向更多邊緣領(lǐng)域的業(yè)務(wù)場(chǎng)景,比如物聯(lián)網(wǎng)提供服務(wù)等等。

邊緣云的應(yīng)用
本次大會(huì)十幾場(chǎng)主題演講和論壇分享會(huì)的直播更能展示出火山引擎在音視頻技術(shù)上的積累。大會(huì)的直播間里,火山引擎視頻云、火山同傳、全站加速等產(chǎn)品相繼上陣,無(wú)論是在現(xiàn)場(chǎng)還是在線上都能獲得高清流暢的參會(huì)體驗(yàn)。
火山引擎總裁譚待認(rèn)為,我們現(xiàn)在所處的時(shí)代,可以被劃分為“超視頻”時(shí)代,互聯(lián)網(wǎng)用戶(hù)對(duì)視頻有了更極致的需求,不再僅僅滿足于清晰流暢的觀看體驗(yàn),而是對(duì)高清化、交互性、沉浸式的體驗(yàn)有了更多訴求。
據(jù)了解,在2022年抖音世界杯直播中,火山引擎支持了累計(jì)106億人次的直播觀看,決賽直播觀看人數(shù)更是高達(dá)2.3億;更高清方面,火山引擎通過(guò)自研BVC編碼器與智能編碼方式,大幅提升直播畫(huà)質(zhì);互動(dòng)方面,火山引擎通過(guò)RTC開(kāi)拓了邊看邊聊互動(dòng)模式,通過(guò)SFU+MCU融合方案,同時(shí)兼顧好了用戶(hù)規(guī)模和互動(dòng)體驗(yàn);更沉浸方面,火山引擎支持了PICO的VR直播,基于全真超清顯示技術(shù),讓觀影清晰度提升50%。
隨著需要處理的數(shù)據(jù)體量不斷攀升,音視頻應(yīng)用對(duì)計(jì)算和存儲(chǔ)架構(gòu)性能的要求也日益嚴(yán)苛。尤其在高吞吐量、大數(shù)據(jù)量請(qǐng)求的場(chǎng)景下,需要尋求一種可以經(jīng)濟(jì)高效地?cái)U(kuò)展容量同時(shí)又不影響系統(tǒng)性能的方案。
火山引擎則在架構(gòu)探索出了一條創(chuàng)新路徑——通過(guò)端云一體的整體架構(gòu),從邊緣基礎(chǔ)設(shè)施的支撐、計(jì)算+網(wǎng)絡(luò)的數(shù)字基礎(chǔ)服務(wù)到視頻云的應(yīng)用解決方案提供生產(chǎn)、存儲(chǔ)、處理到分發(fā)的全棧能力。
在大會(huì)中,火山引擎也帶來(lái)6款音視頻方向的新產(chǎn)品和相關(guān)升級(jí):火山引擎云游戲產(chǎn)品,提供面向云游戲渲染、試玩和互動(dòng)的一站式服務(wù);創(chuàng)意互動(dòng)Vlog,提供全新高精度拍攝和自動(dòng)成片技術(shù);升級(jí)AR互動(dòng)營(yíng)銷(xiāo)方案,優(yōu)化AR try-on和AR互動(dòng)能力,打通抖音廣告和電商;WTN(WebRTC傳輸網(wǎng)絡(luò)),幫助客戶(hù)實(shí)現(xiàn)高清、實(shí)時(shí)的線上互動(dòng)體驗(yàn);升級(jí)數(shù)字人產(chǎn)品,增加支持十多種“外語(yǔ)”,生成趨近于真人的數(shù)字分身;音視頻云端一體解決方案veVOS,周級(jí)別內(nèi)即可完成應(yīng)用上線。

文物修復(fù)同樣需要視頻云的算法技術(shù)支撐
以近期火山引擎攜手PICO技術(shù)支持古籍活化的VR互動(dòng)紀(jì)錄片《古籍尋游記》為例,為了保護(hù)文物,火山引擎視頻云可以采用神經(jīng)輻射場(chǎng)技術(shù),在不傷害文物的低噪情況下,掃描重建出文物的三維結(jié)構(gòu)。
據(jù)了解,這類(lèi)VR視頻制作中,空間建圖是行業(yè)的一個(gè)難題,除了模型本身的結(jié)構(gòu)會(huì)更復(fù)雜,質(zhì)感想做好也很難。在重建敦煌石窟場(chǎng)景的過(guò)程中,火山引擎視頻云團(tuán)隊(duì)由于具備基于視覺(jué)、RGBD數(shù)據(jù)集,以及多模態(tài)數(shù)據(jù)作為支撐,只需要掃描視覺(jué)數(shù)據(jù),再融合應(yīng)用SLAM、深度學(xué)習(xí)等技術(shù),就能對(duì)場(chǎng)景及其細(xì)節(jié)進(jìn)行更快速和精準(zhǔn)的復(fù)刻。
與火山引擎發(fā)布的機(jī)器學(xué)習(xí)平臺(tái)經(jīng)過(guò)抖音等海量用戶(hù)業(yè)務(wù)長(zhǎng)期打磨的邏輯相同,火山引擎原動(dòng)力大會(huì)上各項(xiàng)技術(shù)的落地亮相,很好地呼應(yīng)了火山引擎對(duì)自己的介紹:將字節(jié)跳動(dòng)快速發(fā)展過(guò)程中積累的增長(zhǎng)方法、技術(shù)能力和應(yīng)用工具開(kāi)放給外部企業(yè),幫助企業(yè)構(gòu)建用戶(hù)體驗(yàn)創(chuàng)新、數(shù)據(jù)驅(qū)動(dòng)決策和業(yè)務(wù)敏捷迭代等數(shù)字化能力,實(shí)現(xiàn)業(yè)務(wù)可持續(xù)增長(zhǎng)。
作為一朵“新云”,火山引擎區(qū)別于其他廠商的路徑其實(shí)很明晰,如譚待所言:“不管是今天還是未來(lái),我們都會(huì)圍繞著敏捷迭代、數(shù)據(jù)驅(qū)動(dòng)和體驗(yàn)創(chuàng)新這三個(gè)要素去構(gòu)建產(chǎn)品服務(wù)體系”。秉持這樣的理念,在AI大模型推動(dòng)云上創(chuàng)新的大趨勢(shì)下,火山引擎能否借力彎道超車(chē),讓我們拭目以待。