【資料圖】
南方財經全媒體記者江月 上海報道7月7日,在上海舉行的世界人工智能大會啟幕,國產芯片也急需在大模型訓練和推理中顯身手。在大模型發展的核心三要素中,算力起到底座作用,國產芯片能否撐起國內大模型的發展需求?
國產CPU設計商天數智芯董事長兼CEO蓋魯江向南方財經全媒體記者表示,該公司的通用型GPU(GPGPU)已跑通接近500個大模型,其中覆蓋多款主流模型。他還表示,大模型企業對算力需求與日俱增,模型參數也在持續升級,因此將在產品上針對性地對算法進行硬件級優化,以便滿足國內大模型發展的算力需求。
在國內,不少互聯網大廠、創業型公司等在自制人工智能大模型。獲得算力,也就是買到或租用到合適的GPU,可謂這項工程的“第一步”。GPU市場的大部分份額目前為海外廠商所占據,而國產GPU設計商仍在尋求與其進行技術競爭,從而給大模型開發商提供更豐富的選擇。
據蓋魯江介紹,天數智芯旗下通用型GPU“天垓100”,目前已經跑通了清華大學的GLM、Meta的LLamA、北京智源研究院的Aquila等大模型。此外,智源研究院的650億參數大模型,也正在天垓100上進行訓練,預計10月可以完成。蓋魯江還表示:“如果有一部分客戶從國外的云平臺遷回來,急需算力,我可以聯合我的合作伙伴給他們搭建算力平臺,來支持他們的開發。”
據該公司數據,截至2022年底,天數智芯累計訂單接近6億元,并在當年確認收入2.5億元。這反映該公司量產的產品已經進入市場。
蓋魯江稱,天數智芯重視國際主流軟件生態,希望方便客戶在API接口層面兼容國際主流終端,并降低遷移成本。“在500多人的研究團隊中,軟件人員的數量是硬件人員的2倍。”蓋魯江稱,他指唯有做好軟件優化,硬件性能才有可能呈幾何倍數增長。
提及對未來的展望,蓋魯江表示一是要準備好應對國內大模型從“千卡集群”向“萬卡集群”升級,二是將聯手數據中心做好云平臺建設。
蓋魯江指出,天數智芯目前已經和國內主流的服務器廠商完成了服務認證。這意味著天數智芯將以自身GPU搭載主流CPU,加載在第三方服務器上完成聯合出貨。談及未來云平臺中需要更多數量的GPU,蓋魯江也指出,chiplet和3D封裝技術可以成為技術升級中的考慮選項。
面對國內客戶或將遷移平臺,蓋魯江希望能在此過程中與客戶達成更好的互信。“GPU開發商需要客戶開放更多底層數據,才能做好軟、硬件優化。”他稱。
標簽:
據中國石油北京項目管理公司官微消息,2023年6月7日,網絡出現公司所屬
旗袍,中國和世界華人女性的傳統服裝,被譽為中國國粹和女性國服。雖然其定義和產生的時間至今還存有諸多爭議,但它仍然是中國悠久服飾文化
7月21日,北京市政府發布《北京市電影局關于在疫情防控常態化條件下有序推進電影院恢復開放的通知》,宣布全市低風險地區影院,可于7月24日
?武漢7·16渡江節組委會14日發布公告,由于長江武漢關水位超警戒水位,按照規定取消2020年第46屆武漢7·16渡江節。受近期持續強降雨影響,
過去一段時間,國家級非遺項目灰塑傳承人邵成村,多次在陳家祠等工作現場,向身邊那些帶著好奇目光的人們講解灰塑的種種技術細節:草根灰、
7月13日,位于璧山區南門唐城夜市街區的璧山冷酒夜市開街。這是璧山區打造夜間經濟消費載體、培育夜間經濟活動品牌的舉措之一。璧山市民一