開源代碼爭議背景
盤古Pro MoE的開源與質疑
2025年6月30日,華為正式開源了部分盤古大模型體系,包括70億參數的盤古稠密模型和720億參數的盤古Pro MoE混合專家模型,以及配套的昇騰模型推理技術體系。這一舉措被華為視為構建昇騰生態的關鍵步驟。然而,僅僅四天之后,爭議便隨之而來。 GitHub上的一項研究指出,華為盤古Pro MoE模型與阿里通義千問Qwen-2.5模型的注意力參數分布高度相似,平均相關性達到了0.927,這一數值遠高于同行模型間的對比范圍。同時,研究者在盤古開源代碼文件中發現了標注有“Copyright 2024 The Qwen team, Alibaba Group”的版權聲明,這進一步引發了“非獨立開發”的質疑。
華為的正式回應
面對這些質疑,華為諾亞方舟實驗室于7月5日發布了正式聲明。聲明中,華為強調盤古Pro MoE是基于昇騰硬件平臺開發、訓練的基礎大模型,并非基于其他廠商模型增量訓練而來。華為還特別提到了其創新的分組混合專家(MoGE)架構,這是全球首個面向昇騰硬件設計的同規格混合專家模型,有效解決了大規模分布式訓練的負載均衡難題,提升了訓練效率。 對于代碼相似性的問題,華為表示部分基礎組件代碼參考了業界開源實踐,并嚴格遵循了開源協議,標注了版權信息。華為強調,這不僅是開源社區的通行做法,也符合業界倡導的開源協作精神。
回應中的關鍵點解析
MoGE架構的創新性
MoE(Mixture of Experts)模型是一種將大模型拆分成多個“專家”(子網絡或模塊)的架構。華為盤古團隊聲稱其MoGE架構在專家分組、路由機制等方面有顯著創新。這意味著,即便某些基礎組件(如每個專家內部的Transformer塊)的實現參考了開源代碼,也不能完全等同于對整個模型的抄襲。
開源協議的遵循
在開源社區中,使用開源項目需要遵循一定的規則。華為在回應中明確指出了其嚴格遵循了開源許可證的要求,在開源代碼文件中清晰標注了開源代碼的版權聲明。這是開源社區的通行做法,也是尊重第三方知識產權、提倡開源協作精神的重要體現。
爭議中的技術細節
雖然華為進行了詳盡的回應,但爭議并未完全平息。一些業內人士指出,導致參數相關性高的原因很多,類似的訓練目標、相近的模型規模,或設計上采用了類似的注意力機制等都可能產生參數的高相關性。此外,對于“LLM-Fingerprint”分析方法的科學性也存在爭議。華為認為該方法不科學,而質疑方則堅持其有效性。
待厘清的問題與挑戰
開源模型邊界的界定
此次爭議再次暴露了AI大模型開源定義模糊、協議規則與法律界定不清晰的問題。開源并不代表沒有版權,任何第三方使用都應該遵循其開源許可協議。然而,在實際操作中,如何界定開源模型的邊界、如何確保開源技術的健康有序發展仍是一個亟待解決的難題。
開源協作與商業化的平衡
開源協作精神與商業化需求之間往往存在一定的張力。一方面,開源社區倡導開放、共享、協作的理念;另一方面,企業則需要通過商業化來實現可持續發展。如何在保持開源協作精神的同時,合理平衡商業化需求是當前面臨的一個重要挑戰。
技術驗證與透明度的提升
在爭議中,技術驗證的透明度和說服力成為了關鍵。華為雖然進行了回應,但缺乏官方GitHub或其他平臺的完整聲明,也未能提供足夠的反證數據支撐其觀點。這引發了對于如何提升技術驗證透明度、增強說服力的思考。未來,或許需要更加開放、透明的驗證機制來確保技術的公正性和可信度。
結語
華為盤古團隊回應開源代碼爭議的事件不僅揭示了開源社區中的復雜問題,還引發了對于如何推動AI大模型健康有序發展的廣泛討論。在開源協作與商業化需求之間尋求平衡、界定開源模型邊界、提升技術驗證透明度等方面仍需進一步努力。我們相信,在各方共同努力下,開源技術將能夠更好地服務于社會發展和人類進步。
文章評論 (1)
發表評論