今年初,杭州深度求索公司先后上線DeepSeek V3基座模型和專為復雜推理任務設計的DeepSeek R1模型,并同步開源開放,以卓越的性能超越或媲美全球頂級的開源及閉源模型,在美國和中國區域應用商店下載量持續排名第一,引發了全球人工智能領域的廣泛關注與強烈反響。筆者認為,需要提前研判DeepSeek廣泛應用對新型電力系統建設與發展產生的影響,并采取相應的措施確保能源安全,助力實現人工智能技術進步,從而把握新一代人工智能帶來的各種機遇。
DeepSeek在各行業的應用現狀
DeepSeek采用混合專家模型、多頭注意力機制和知識蒸餾技術,大幅降低了大模型的訓練和推理的算力需求,提升了模型效率,在數學、代碼和推理任務方面的性能能夠與OpenAI-o1相媲美,已在全球140多個國家和地區的應用排行榜上登頂,并在各行業得到了廣泛應用。
DeepSeek能引發行業震動的核心原因是在效率和成本控制上的突破。DeepSeek通過模型結構完善、訓練方式優化、底層算力調度等方面的系統級創新,在相對較低的算力投入下,獲得可媲美甚至超越頭部模型的性能表現,實現了“低成本、高性能、準推理”,打破以“大算力、大數據”為核心的生成式人工智能擴展定律,將訓練成本和能耗控制在頂尖大模型的1/20,訓練成本僅為560萬美元,為探索通用人工智能開辟了新道路。DeepSeek的開源與低成本也促成了ChatGPT和“文心一言”等大模型的免費應用,有望改變閉源壟斷的市場格局,倒逼行業巨頭轉向開源生態,有助于我國突破技術封鎖,開辟出一條“以開放破封鎖、以協作促創新”的中國AI發展路徑。
DeepSeek正以前所未有的速度應用到各行各業。在政務領域,深圳、廣州、臨沂等多地政府已完成DeepSeek模型本地化部署。在互聯網行業,國家超算互聯網平臺上線了從1.5b到70b的各級蒸餾模型;阿里云、百度云、華為云、騰訊云、天翼云等主流云平臺陸續官宣接入DeepSeek模型,提供多樣化的部署選項和服務;硅基流動等AI基礎設施廠商宣布適配并上架DeepSeek模型服務。在電信行業,3家運營商均全面接入DeepSeek開源大模型。在金融行業,已有16家券商、10余家公募基金公司以及多家銀行和保險機構完成接入或部署。在能源電力領域,“三桶油”、國家電網公司、南方電網公司及五大發電集團均已完成DeepSeek私有化部署,并將其接入自身的數字平臺。
國外對Deepseek的數據安全與隱私保護仍持有謹慎態度。DeepSeek尚未建立透明的數據托管機制,其在線應用會將用戶數據存儲在我國境內,因此遭到了部分歐美國家的抵制。美國國會議員以數據安全為由,提出一項兩黨法案禁止在聯邦政府的設備上使用DeepSeek。意大利數據保護局以缺乏DeepSeek應用個人數據的具體方式為由,限制DeepSeek處理意大利用戶的數據。澳大利亞也以強制性指令禁止政府設備訪問DeepSeek,以杜絕數據泄露的隱患。
對新型電力系統建設的影響
DeepSeek通過用戶使用和行業應用這兩條路徑對新型電力系統建設產生影響。一方面,電力用戶的廣泛應用將通過模型訓練推理的電力需求影響電力系統穩定;另一方面,電力企業對DeepSeek的應用,也將引發系統運行和企業經營的系列變革,從而推動新型電力系統建設。遵循以上兩個方向,筆者的研究團隊從算力及電力需求、電網規劃、應用效果和安全自主可控四個方面,深入分析DeepSeek對新型電力系統建設的影響。
一是DeepSeek的技術進步或將增加整體的算力及電力需求,為“綠電+算力中心”提供了發展空間。雖然DeepSeek通過優化算法、硬件適配等技術,顯著提升了人工智能算力效率,降低了單次任務的能耗,打破了人工智能應用的經濟門檻,但DeepSeek的技術進步也將同步觸發“杰文斯悖論”,能源消耗總量或將突破線性增長模式,形成“效率提升-應用擴張-能耗躍升”的閉環。一方面,DeepSeek的開源和低算力的特性,降低了大模型行業的準入門檻,也將激發公眾的大模型應用需求,從而引發整體算力增長。DeepSeek弱化了國外對先進算力的限制,將促進更多的供應商提供更為廣泛的服務,同時也將激發用戶在本地部署大模型的需求。另一方面,DeepSeek依賴于高精度模型知識蒸餾技術,需要有個復雜且性能優異的“教師模型”將知識遷移到“學生模型”中。因此,需要大的算力來支撐高參數、高準確性的“教師模型”訓練;谏鲜鰞蓚因素,DeepSeek及其技術廣泛應用之后,仍將引發算力和電力需求的快速上升,也需要綠色電力來保障算力中心的巨量電力需求。
二是DeepSeek的廣泛應用將改變算力中心的負載分布,對配電網規劃和運行產生一定沖擊。DeepSeek打破了原有數據中心市場格局的平衡,為市場帶來了新的競爭力量。以往,大型數據中心憑借其雄厚的資金實力和先進的技術設施,在AI計算服務領域占據主導地位,為大型科技公司提供定制化的算力支持。然而,DeepSeek可無視邊緣側數據中心算力低的劣勢,并激發時延低和貼近應用的優勢,推動邊緣側數據中心承接延遲敏感的應用需求,使得一些中小型數據中心也有機會參與到AI計算服務的競爭中來,同時也迫使亞馬遜、阿里云等云計算巨頭調整部分大型數據中心的建設投入,轉而加強邊緣計算和分布式算力布局。邊緣側部署DeepSeek需要對應的電力來驅動服務器、存儲設備和網絡設備,導致整體能耗上升,易引發高峰期的電力供應緊張,因此,需要提升配網承載能力,同時也要依靠大模型來提高電力分配和管理效率,以弱化因大模型而引發的電力供應緊張。
三是DeepSeek與電力業務深度融合將為電力行業帶來深刻變革,進一步優化業務流程。相比其他的大模型,DeepSeek通過技術進步有效提升了大模型的普惠性,推動了大模型在工程場景中的規;瘧,具有在電力行業海量運行場景中深化應用的潛力,并能提升專業模型的應用效率,加強個性問題推理的邏輯性,實現在考慮全局情況下的最優回答,不僅能作為一個智慧辦公助手,更有望成為一個綜合型的電力行業專家,可輔助業務人員完成對當前問題的分析,給出解決方案。例如,在設備管理上,專業模型需要根據區域差異優化相應參數,DeepSeek可以考慮區域地理、氣候等因素,輔助調試專業模型;在電網調度上,可以根據區域網架結構和能源結構特性完成調度指令輔助。
四是DeepSeek可更改底層代碼,實現差異化需求,確保電力大模型技術的自主可控和保障信息安全。電力行業作為國家的基礎性產業,對核心技術國產化有著較高要求,實現國產化替代的需求十分迫切。DeepSeek作為國產的模型系統,可以避免國內電力系統與國外模型適配性低的問題,而且不同于閉源模型的技術壁壘,應用企業可以深入了解模型的架構和算法,并根據自身業務需求進行深度改進和優化定制。同時,DeepSeek在設計和開發過程中充分考慮了信息安全因素,因其源自國產模型系統,研發和維護團隊熟悉國內應用環境,能夠更好地遵循國家信息安全政策和標準,減少了因外部因素導致的信息泄漏風險,可以確保電力數據在采集、傳輸和分析過程中的安全性。
與新型電力系統建設深度融合的著力點
DeepSeek在訓練效率、安全可控和精準度上展現了較強的優勢,在電力領域具有廣闊的應用前景。筆者研究分析認為,需要從與現有技術應用融合、算力的電力供應和數字基礎設施的綠色發展等重點任務著手,推動DeepSeek與新型電力系統建設的深度融合,助力電力行業的智能化發展。
與現行大模型的融合應用
持續開展行業大模型的迭代優化,提升滿參數“光明”“大瓦特”等大模型的精準度,保障其作為“教師模型”的知識蒸餾技術效果。加強對DeepSeek所提出的強化學習、群體優化、多頭潛在注意力和專家混合模型等技術理念的跟進學習,推動前沿技術與各企業人工智能的有機結合。同時,推動DeepSeek長思維鏈推理與行業大模型的融合應用,推動形成電力AI智能體。并將專業模型在電力規劃、電網調度、設備管理和營銷服務等場景中的應用結果通過多模態學習,作為DeepSeek的綜合性輸入,從不同維度對業務進行分析,提高分析結果的可靠性,根據DeepSeek的推理結果采取相應的處置措施,輔助用戶完成工作。
對大模型的供電保障
雖然DeepSeek能夠以更聰明、更高效、更綠色的方式訓練出AI模型,但人工智能的發展仍然離不開強大的算力與電力支撐,而算力和數據基礎設施的運行呈現高耗能特征,因此,需要做好大模型廣泛使用的電力需求預測。與其他大模型相比,DeepSeek更具分布式和實用性部署的優勢,需要更為精準地預測分布式數據中心的能耗。在保障算力的電力供應的同時,也要加強電力-算力規劃的協同,強化算力中心與配網的協同規劃設計,加強算力電力負荷的預測,促進電算兩側設備均在負載區間運行,研究算力中心靈活運行技術,進一步探索算力中心參與源網荷儲協同互動的可行性。
算力基礎設施的綠色化低碳化發展
加快推進數字基礎設施的綠色化低碳化發展,探索綠電對算力中心的直供方式,推動零碳、低碳數據中心建設。加速制定數據中心的綠電直供政策,推動解決算力的綠電需求與新能源資源分布存在錯位的問題,針對新能源資源稟賦,有效調配訓練算力分布,推動訓練算力對綠電的就地消納;針對推理算力的區域性布局,圍繞分布式綠色能源系統,盡快制定風、光、氫等綠能建設的規劃。
當前,DeepSeek正加速融入全球各行各業,也推動了我國電力行業向更加高效、安全、智能的方向邁進。電力行業要加強大模型前沿技術的跟進與研發,進一步強化人工智能的自主可控,加強對DeepSeek強化學習、群體優化、多頭潛在注意力和專家混合模型等技術理念的融合,發揮電力行業海量場景優勢和產業鏈帶動作用,推動DeepSeek的技術路線和研發生態的不斷發展和完善,加速新型電力系統建設,為經濟社會高質量發展保駕護航。
聯系地址:陜西省西安市北關正街35號方興大廈8樓