大模型助力工業智能化發展
“大模型結合仿真技術,就成為了生成式仿真技術,生成式仿真可以做一些有效的平滑處理,給我們帶來非常大的機會。
比如車輛撞擊,未來的仿真應該是現場的真實數據、來自于Altair這種小模型的機理的仿真數據以及工業的大模型仿真數據,三者融合在一起。有可能讓工業仿真得到一個極大的推動,升級到另外一個新的高度。”
——上海數據科學重點實驗室主任 肖仰華教授 在Altair “AI FOR ENGINEERS”線下研討會的精彩演講
為了與全球優秀工程師共同探索人工智能(AI)在工業發展中的變革力量,6月20日,Altair 將舉辦面向廣大工程師的全球線上會議“AI for Engineers”。會議邀請全球知名設計、仿真和制造領域的專家與權威學者,共同探討生成式人工智能(GenAI) 如何助力工業變革、產品研發,歡迎關注公眾號“Altair RapidMiner”或者點擊鏈接立即免費報名https://hubs.ly/Q02BgDjZ0,與全球工程師共享人工智能前沿技術。
現在整個世界的不確定性日益增大,導致工業系統前所未有的復雜。很多大型基層裝備,涉及到成千上萬個零件,每一個零件又要經過一道涉及到上萬個零起元器件組成的生產線加工過程,這樣的加工程序可能有幾百道工序,使整個系統的復雜性達到了當年錢學森所說的復雜巨系統的狀態。
基于當前的復雜情況,我們一定要把來自專家的認知能力一定程度讓度給機器,未來發展成為人機協同的認知,共同應對工業中的巨大挑戰。
很顯然,當下大模型想要助力工業智能化發展,在工業認知系統以及能力的實踐方面,都遇到了非常多挑戰:
缺乏海量的應用模式
當我們把數據科學、數據智能、人工智能的很多能力和技術方案遷移到工業場景的時候,會發現以往比較成熟的應用場景大多是在消費互聯網,但是這些技術一旦遷移到工業場景,就會面臨著非常多的挑戰。因為在工業場景,沒有像消費互聯網那么海量的應用模式,而且認知復雜性遠遠超過消費互聯網。
數據復雜,治理困難
數據來源非常多樣,例如Mac系統、ERP系統等等,各種各樣的系統都在產生不同的數據,數據治理很困難。面對這些復雜的數據,要加工、關聯、融合、清洗都非常困難。所以工業的數據治理,恐怕是所有行業里面最困難的。
知識屬于隱形經驗,機器難以學習
工業知識有個很大的特點,很多知識屬于師傅的經驗,往往自己也說不清,很難顯性化的表達,所以很多知識是一種隱性經驗,是一種直覺,師傅很難講的明白,機器也無法學習。另外工業的知識體系龐雜、類型多樣,涉及到幾乎所有我們熟知的學科,機械的物理的化學的流程的工藝的光電的。這都會給人工智能解決工業領域的問題帶來非常大的挑戰。
在面對這些挑戰的情況下,大模型給工業帶來哪些機會呢?
在講大模型之前,先看小模型,Altair的小模型RapidMiner在這方面做得很好,可以把傳統的非常封閉場景的經驗,通過數據擬合表達。在可控可編輯可理解可解釋方面,小模型和智能突破仍然比大模型有優勢。很多工業場景是嚴肅的應用場景,需要可編輯可控制可理解可解釋。
其次是大模型,對于工業而言,大模型最重要的意義在于又一次有力的推動了數實融合,把數據和實體產業相結合。
對于工業來說,大模型有非常重要的價值:
1、可以對語言模型進行統一的建模和理解
工業里面的語言主要是日志,我們通過日志了解設備的運行狀態,以往都是小模型,小模型換一個新任務,模型就失效了,換一個廠商的日志,模型就又失效了。現在我們已經可以用大模型技術訓練日志大模型,把行業的知識注入到語言模型里,模擬實現日志統一理解處理。
工業里另外一個語言是腳本。我們經常要配置很多腳本,以前一旦是新手配置這些腳本就會容易出錯,現在可以用機器統一理解,做一個生成式腳本模型,自動生成配置各種不同設備。
大模型也可以幫大家理解日志,把看不懂的日志變成自然語言表達,這樣的話普通人也可以做一些運維的工作。
2、幫我們理解行業數據
現在各行各業都想激活數據要素的價值,甚至把數據變成資產去流通去交易,但是這里面很關鍵的問題在于數據治理。目前數據治理還是要靠行業專家寫規則,然后做治理。但是代價極大,有幾個行業專家能把幾萬張表全看一遍,所以現在要靠大模型實現數據治理的agent。如果能練就自己的工業大模型,一定程度能夠識別工業數據的錯誤,從而幫我們做數據治理。
現在還有不少企業在使用大模型研發各種各樣專業模型,比如醫藥研發的企業對大蛋白質的語言模型特別關注,蛋白質的語言模型可以幫新藥的研發周期從2到3個月縮短到一周。很多制造業企業設備要檢驗,都可以借助大模型這種自動駕駛實驗室的技術提效,實現將6個月的實驗量縮短到5天。
3、賦能工業制造文檔
所有的企業生產制造過程始終是由文檔驅動的,每個環節要向下一個環節交付很多文檔,目前圍繞文檔智能化也有很多方案,比如合同的審查檢驗、審圖讀圖。這里展示的demo是用文檔回答問題,幫我們做運維。
這些技術現在已經越來越成熟了,可以做多模態的、多來源的、可溯源的,而且有自知之明的理解,都是用大模型驅動和實現的。
用大模型理解自然語言的能力驅動設備的交互,不再需要寫各種各樣專業的腳本。還可以利用大模型檢查實現更新定位,在網絡系統的自動診斷里,已經有越來越多的案例,效果很不錯。很多故障的排查、復雜的編排規劃,最后做出診斷,就叫agent技術,也是現在大家摸索特別多的技術。目前在有些案例場景下已經能夠做到不錯的效果,尤其在網絡以及工業質檢等方向。
4、用自然語言對私有的數據庫進行查詢,做大數據智能分析
現代企業有很多私有數據庫,把私有的知識全放到一個提示庫里,利用通用大模型的自然語言轉成SQL的能力,就可以實現大數據智能分析。
我們都知道,仿真技術在工業制造中非常重要,Altair的仿真技術在全球領先,現今也融入了大模型。大模型結合仿真技術,就成為了生成式仿真技術。Sora本質上就是生成式技術,結合仿真技術,可以彰顯出非常大的應用潛力。
那么,生成式仿真跟基于傳統的仿真根本差別在哪呢?
第一:生成仿真是在海量數據中訓練的,有現實世界復雜的建模和模擬能力,是可以高度泛化的。
第二:生成仿真可以針對很多復雜的場景進行模擬
現在很多仿真把場景理想化了,比如碰撞場景不單單只是碰撞,可能還有些電子系統發生作用,所以里面實際是很多個機理融合在一起。
以前的仿真只能做某一個側面,但是未來能不能把多學科的不同場景或者來自于不同機理的模型融合在一起仿真呢?這個都是生成仿真可能帶給我們的價值
第三:生成仿真可以解決一些樣本少的數據缺失的場景
生成仿真可以做一些有效的平滑處理,可能給我們帶來非常大的機會。但是未來機理的仿真仍然非常重要,Altair的很多仿真模型本質上是基于機理的,是基于人類對于很多物理現象的理解建立起來的模型。
比如車輛撞擊,未來的仿真應該是現場的真實數據加上來自于像Altair這種小模型的機理的仿真數據,再加上工業的大模型仿真數據,三者融合在一起。有可能讓工業仿真得到一個極大的推動,升級到另外一個新的高度。
從本質上來講,我們做的一切技術實踐和努力,實際上是為了緩解專家資源稀缺的困境。工業尤其如此,老師傅一旦流失了,有經驗的專家一旦離開了,很多問題就解決不了了。
所以大模型對工業最大的意義就是沉淀工業專家的經驗,解決專家資源稀缺的問題。
隨便看看:
相關推薦:
網友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件