【TechWeb汽車】4月12日消息,在HAOMO AI DAY上,HAOMO發布業內首個自動駕駛生成式大模型DriveGPT,中文名“雪湖•海若”,毫末智行CEO顧維灝表示,DriveGPT將重塑汽車智能化技術路線。據介紹,DriveGPT雪湖•海若首發車型是新摩卡DHT-PHEV,即將量產上市。
毫末智行董事長張凱表示:“2023年智駕產品進入全線爆發期,大模型開啟在車端的落地應用,車主的使用頻率和滿意度成為產品競爭力的重要衡量標準。”
顧維灝介紹,DriveGPT通過引入駕駛數據建立RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續優化,現階段主要用于解決自動駕駛的認知決策問題,終極目標是實現端到端自動駕駛。
目前,拿仔灶毫末DriveGPT雪湖•海若實現了模型架構與參數規模的升級,參數規模達到1200億,預訓練階段引入4000萬公里量產車駕駛數據,RLHF階段引入 5萬段人工精選的困難場景接管Clips。
DriveGPT雪湖•海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預訓練大模型,與ChatGPT使用自然語言進行輸入與輸出不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動駕駛場景文本序列,即將自動駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規控、障礙物預測以及決策邏輯鏈的輸出等任務。
顧維灝進一步闡釋,DriveGPT雪湖•海若具有三個能力:
1. DriveGPT雪湖•海若可以按概率生成很多個場景序列,每個場景都是一個全局的場景,每個場景序列都是未來有可能發生的一種實際情況;
2.在所有場景序列都產生的情況下,DriveGPT雪湖•海若能把場景中最受關注的自車行為軌跡量化出來,也就是生成場景的同時,會產生自車未來的軌跡信息;
3. 有了自車未來的軌跡信息之后,希望這條軌跡是可解釋的,而GPT模型最擅長的領域便是對話和推理,DriveGPT雪湖•海若也很好地繼承了這種特性,在生成場景序列、軌跡的同時,也會把整個決策邏輯鏈給輸出。
顧維灝介紹,毫末在2023年1月發布的中國自動駕駛行業最大的智算中心MANA OASIS(雪湖• 綠洲)此次從算力優化等層面升級了三大能力,進一步支持DriveGPT雪湖•海若的算力。
首先,毫末與火山引擎全新搭建了“全套大模型訓練保障框架”,實現了異常任務分鐘級捕獲和恢復能力,可以保證千卡任務連續訓練數個月沒有任何非正常中斷,有效保證了大戚察模型訓練穩定性;
其次,毫末研發出以真實數據回傳為核心的增量學習技術,并將其推廣到了大模型訓練,構建了一個大模型持續學習系統,自主研發任務級彈性伸縮調度器,分鐘級調度資源,集群計算資源利用率達到95%;
最后,MANA OASIS通過提升數據吞吐量來降本增效,滿足Transformer大模型訓練效率,通過引入火山引擎提供的Lego算子庫實現算子融合,端到端吞吐提升84%。
談到DriveGPT雪湖•海若的實現過程,顧維灝介紹稱,首先在預訓練階段通過引入量產駕駛數據,訓練初始模型,再通過引入駕駛接管Clips數據完成反饋模型(Reward Model)消扮的訓練,然后再通過強化學習的方式,使用反饋模型去不斷優化迭代初始模型,形成對自動駕駛認知決策模型的持續優化。
DriveGPT雪湖•海若的一個關鍵設計,就是場景的Token化表達,顧維灝把這種方式叫做Drive Language。
同時,DriveGPT雪湖•海若還會根據Drive Language輸入端的提示語以及毫末CSS自動駕駛場景庫的決策樣本去訓練模型,讓模型學習推理關系,從而將完整駕駛策略拆分為自動駕駛場景的動態識別過程,完成可理解、可解釋的推理邏輯鏈生成。
另外,顧維灝提到,DriveGPT雪湖•海若可以逐步應用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。有了DriveGPT雪湖•海若的加持,車輛行駛會更安全;動作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動作。對于普通用戶來說,車輛越來越像老司機,用戶對智能產品的信任感會更強,理解到車輛的行為都是可預期、可理解的。
當前,毫末在使用數據過程中,逐步建立起一套基于4D Clips駕駛場景識別方案,具備極高性價比。在行業上,給出正確的標注結果,一張圖片需要約5元;如果使用DriveGPT雪湖•海若的場景識別服務,一張圖片的價格將下降到0.5元。單幀圖片整體標注成本僅相當于行業的1/10。接下來,毫末會將圖像幀及4D Clips場景識別服務逐步向行業開放使用,這將大幅降低行業使用數據的成本,提高數據質量,從而加速自動駕駛技術的快速發展。
目前,毫末DriveGPT雪湖•海若已正式對外開放,開啟對限量首批客戶的合作,北京交通大學計算機與信息技術學院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等已經加入。毫末DriveGPT雪湖•海若大模型的成果將首發落地在搭載毫末HPilot3.0的新摩卡DHT-PHEV上。
顧維灝表示,毫末DriveGPT雪湖•海若將攜手生態伙伴率先探索四大應用能力,包括智能駕駛、駕駛場景識別、駕駛行為驗證、困難場景脫困。
【本文來自易車號作者TechWeb,版權歸作者所有,任何形式轉載請聯系作者。內容僅代表作者觀點,與易車無關】
上一篇
廣州市級剪紙非遺代表性傳承人、著名工藝美術大師韓艷把自己編著出版的廣東省首本剪紙歷史著作《廣州剪紙非遺史》現場捐贈給了海珠區全區的中小學校和文化單位。廣州剪紙是嶺南文化藝術瑰寶,是廣東傳統工藝美術廣東剪紙的主要代表。
制作趣味龍舟模型、慢嘆非遺休閑驛站、齊玩真人龍舟棋……來自廣州、珠海、惠州、汕尾、東莞、江門、肇慶七個市的非遺項目及傳承人,與景區游客共度端午。記者在現場看到,本次節慶“嘆”非遺活動體現了濃郁的嶺南端午特色。包粽子和賽龍舟是嶺南端午不可缺少
作為全網首個在抖音平臺上突破4000萬粉絲的美食創作者,穩居平臺第一美食創作者的李子柒在視頻內容上具備其不可替代性。李子柒抖音粉絲破4000萬,憑借的不僅是其持續輸出優質內容的核心能力與對東方美學的理解,也離不開內容創作者與優質平臺間的相互
是的,從宏觀經濟學的角度來說,ChatGPT可能引發的失業屬于典型的技術性失業,即原來由人完成的工作被搭沒跡機器來代替完成。一、采用ChatGPT和其他類似的語言模型,可能會導致某些行業出現失業或變化。一些領域的自動化、以及語言模型分析大量