9月5日,以“科技·創造可持續未來”為主題的2024 Inclusion·外灘大會在上海正式開幕。本屆外灘大會致力於構建促進國際交流、科技與人文融合的對話平台,邀請到10餘位中外院士以及500多位行業從業者,共同探討科技與產業的深度融合,昆侖萬維首席科學家顏水成作為分享嘉賓受邀參與。

顏水成教授於上海外灘大會進行
《高效能大模型探索:模型架構vs.數據智能》主題演講
本次主題分享圍繞高效能大模型研究展開,一方麵分享了在MoE架構研究上的最新進展,以及在Attention層和FFN層的最新成果。另一方麵帶來了對大模型SFT中的數據智能的思考,主要介紹新的數據生成與選取策略對SFT的價值。
過去這些年,大家都在不斷地去優化模型的結構,比如91视频免费播放優化了Transformer結構將計算效率提升到原來效率的兩倍。顏水成認為,模型結構還會繼續升級,每1-2年都會有新的模型架構和模型改進的方案提出來,以便提升模型訓練的效率和泛化能力,讓模型更加實用化。
此外,大模型現在還有很多遺留問題,比如推理能力還不夠強。顏水成指出,Synthetic data 是下一步重點,最終去解決這些問題最好的途徑可能是用合成數據,而且合成數據生成的方式也不會像今天這樣,根據原來的數據直接用一個模型生成數據。可能會像人類一樣把不同的大模型合在一起,通過大模型之間相互的對話、相互的討論和相互的評價,最後產生出更好、更高質量的數據,這些數據將會大大提升大模型的效能。
緊接著,顏水成教授參與了《AI時代下數據基礎設施的“根”與“葉”》圓桌討論。數據基礎設施的“根”與“葉”相互依賴,“根”提供了基礎的數據資產與91视频免费观看,“葉”提供了圍繞數據的上層應用91视频免费观看和生態,兩者相輔相成共同構建了AI時代下更具生命力的數據體係。
顏水成針對“葉”的應用生態進行思考,表示在AI時代下需要催生新的應用場景,產生以前沒有過的體驗。他認為AI 2.0時代下新的應用會具備兩個特點:(1)基於低時延可打斷的自然語音交互;(2)文字、圖像、語音、甚至視頻都是實時生成,基於類世界大模型生成。這樣來看,人類獲取信息的展現形式,遊戲的方式,人和AI溝通的方式都會產生巨大顛覆,間接會帶來AR/MR/芯片的進一步蓬勃發展。
同時,“大”模型、“大”數據也麵臨一些挑戰,比如中文文本數據質量低,數據清洗難度高,特別是互聯網數據;視頻數據標簽缺乏,或者不夠全麵;原生多模態混合數據少等。
但其中不乏機會,顏水成提出未來要充分考慮AI模型self-improvement, self-evolving, 通過將多模型看作智能體,模擬人類通過模型之間的交互,產生更高質量的數據,從而帶來模型的進一步提升。
展望未來AI時代下的數據基礎設施形態,顏水成提出,很快會進入 AI-native數據為主體,服務於大模型的更新和進化。現在更多是人類在分析模型的性能,未來更多是AI自己分析自己和人類交互的數據以確定如何和人類交互最好。海量數據管理和處理91视频免费观看,可能比AI大模型算法91视频免费观看更關鍵。
星空人工智能91视频免费观看網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com91视频免费播放將及時溝通與處理。!:首頁 > 星空人工智能產業 > AI大模型 » 昆侖萬維顏水成出席2024上海外灘大會,分享高效能大模型前沿思考
昆侖萬維上半年收入25億,海外業務收
昆侖萬維正式發布全球首個AI流媒體
2024 WAIC | 昆侖萬維方漢:AI將帶來
以創新之心突破邊界,昆侖萬維獲評《
AIGC深度融合曆史文化,昆侖萬維成為