发表时间:2023-03-21 13:35:43 浏览次数:354
ChatGPT能成为如今火遍全球的顶流模型,少不了背后超强的算力。
数据显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天)。
微软砸下大几亿美元,专门为训练ChatGPT打造了一台超算——上万张英伟达A100芯片打造,甚至专门为此调整了服务器架构,只为给ChatGPT和新必应AI提供更好的算力。
虽然不是真的,不过想象微软数据中心的某些服务器用途,可能一半是Xbox的xCloud,另一半是ChatGPT。
事实上,这台超算并非最近才开始打造。
据微软表示,他们给OpenAI提供这台超算已经有3年之久,而ChatGPT也正是基于这台超算提供的算力训练的。
这是因为,OpenAI在最初商量与微软合作时,曾经就算力方面的事情进行过协商。
虽然它是OpenAI的定制版,但同样具备某种通用性,任何企业都可以基于这种方式来训练自己的大语言模型。
微软负责战略合作伙伴关系的高管Phil Waymouth指出,OpenAI训练模型所需要的云计算基础设施规模,是业内前所未有的。
呈指数级增长的网络GPU集群规模,超过了业内任何人试图构建的程度。
微软之所以下定决心与OpenAI 合作,是因为坚信,这种前所未有的基础设施规模将改变历史,造出全新的AI,和全新的编程平台,为客户提供切实符合他们利益的产品和服务。
现在看来,这几亿美元显然没白花——宝押对了。
在这台超算上,OpenAI能够训练的模型越来越强大,并且解锁了AI工具令人惊叹的功能,几乎开启人类第四次工业革命的ChatGPT,由此诞生。
非常满意的微软,在1月初又向OpenAI狂砸100亿美元。
可以说,微软突破AI超算界限的雄心,已经得到了回报。而这背后体现的,是从实验室研究,到AI产业化的转变。
目前,微软的办公软件帝国已经初具规模。
ChatGPT版必应,可以帮我们搜索假期安排;Viva Sales中的聊天机器人可以帮营销人员写邮件;GitHub Copilot可以帮开发者续写代码;Azure OpenAI 服务可以让我们访问OpenAI的大语言模型,还能访问Azure的企业级功能。
在以ChatGPT为代表的大模型技术上,软硬件都还有不少难关要攻克。
*本图文整理摘抄自网络,如有侵权联系删除
风云教育-苏州工业园区国有的人才服务平台,苏州市公共实训基地、江苏省软件产业人才培训基地、江苏省国际服务外包基地,荣获“国家办学能力和诚信等级3A级单位”认定。致力于软件开发、软件测试、web前端开发、企业人才定制培养等方向的人才培训,解决企业用人需求的“人才蓄水池”。