机构:有关生成式AI的发展,有多少人真正认识到了能耗问题?
集微网消息,科技界生成式人工智能盛行,这对英伟达这样的公司来说是一件好事。十年前,这家公司投资于人工智能,将其视作增长引擎。这些年间,该公司一直在整合硬件和软件零零碎碎的各方面——以及合作伙伴关系——为未来做好准备。对此,半导体分析机构nextplatform做了调研和分析。
最近举行的GTC 2023展示了英伟达人工智能从新产品到战略和路线图方面的工作,而且英伟达在许多方面可以帮助企业在其业务中采用人工智能,这一信息继续得到广泛传播。其中,在本周早些时候,英伟达企业计算副总裁Manuvir Das在马萨诸塞州剑桥市举行的麻省理工学院未来计算大会上发表了主题演讲。
Das在大会上分享了一些信息,包括企业确实需要跳上生成式人工智能列车,无论是通过创业公司OpenAI等公司广泛使用的技术,还是企业通过自身的努力,使用自己的数据训练大型语言模型来实现这一目的。OpenAI是英伟达的合作伙伴,其GPT-4、ChatGPT、Dall-E和其他产品正迅速整合到微软庞大的产品组合中,并得到其他供应商的接受。
(资料图片仅供参考)
另一信息是关于不断发展的计算环境和人工智能。世界上越来越多的工作通过计算完成的,这意味着要消耗更多能源。Das表示,全球约1%到2%的能源由数据中心消耗的,而像计算要求高的生成式人工智能这样的用例只会增加这一比例。增长速度是不可持续的,计算需求越来越高效。不出所料,英伟达认为关键在于在基于GPU的加速系统上运行尽可能多的工作负载——不仅仅是那些基于人工智能和机器学习的工作负载。他认为,GPU可以在保持低功耗的同时处理计算需求,基本上可以取代现在踌躇不前的摩尔定律曾经推动计算创新的地位。
Das在接受The Next Platform采访时表示:“我们的主题是计算未来,所以我想向听众传达的信息是,像生成式人工智能这样的新用例是建立在加速计算的基础上的,所以这些都很好。但是,为了给这些新的工作负载找到空间,并防止全球被迫经历这种大规模的计算扩展,我们需要把在数据中心做的一切,一个域一个域地,基本上都转移到这个加速计算中,因为这是你从目前有的同一个数据中心获得10倍输出的方法。这种转变必须发生。”
近几个月来,英伟达一直在忙着向市场推出针对新兴人工智能领域的产品,构建Das所说的全栈市场策略,其中包括H100 “Hopper” H100 GPU加速器,它在微软Azure、甲骨文云基础设施技术(OCI)、AWS和Meta的“Grand Teton”人工智能节点等领域寻找落脚点,是英伟达内部用来进行人工智能工作的架构。
在GTC大会上,该公司还公布了NeMo护栏等技术,确保人工智能聊天机器人不会因编造内容(制造“幻觉”)或只是获取错误信息而偏离轨道。
从OpenAI的产品到Meta平台的LLaMa,如果企业要全力投入建设大型语言模型,解决这些信任问题是关键。尽管企业急于将生成式人工智能工具投入市场,但在这个仍然有点不确定的环境中,仍有数据安全、隐私和合规性的问题需要解决。一些国家对ChatGPT等大型语言模型提出了质疑,意大利最近禁止了ChatGPT,但本周表示将撤销这一决定;三星表示,由于生成式人工智能带来的风险,其禁止员工使用ChatGPT和类似产品。一些企业高管担心,使用生成式人工智能开发的应用程序可能会无意中泄露敏感数据或企业机密。
联邦政府和其他一些国家政府已开始提出要对快速发展的人工智能市场进行监管和监督。正如我们本周所讨论的那样,随开源公司开始将其大型语言模型代码推向市场,人工智能市场可能会发生持续变化。周四,美国副总统Kamala Harris会见了微软、OpenAI、谷歌和Anthropic的首席执行官,讨论人工智能问题。
Das说:“所有这些事情正浮出水面。但技术就在眼前。这就是问题所在。这些技术——比如对自己的数据进行微调,从正确的数据库中检索信息,教授重要技能——不需要发明这些技术。我们有技术,更重要的是把它交到人们手中。”
生成式人工智能似乎无处不在,但仍有无数问题需要解决。当然,其中之一就是前面提到的能耗。但是,他说,另一个问题是正在创建、收集、存储、处理和分析的数据量,这些数据会反馈到电力问题上。如果未来的计算是可持续的,公司现在似乎不太愿意扔掉任何数据,需要更明智地知道要保留什么和放弃什么。
Das说:“数据是推动这一切的燃料。多年来,我们在存储方面已经取得了很大的进步,但从设备、传感器等所有设备中生成数据的速度来看,以及现在不断涌现的所有这些数据用例,没有公司愿意扔掉这些数据。如果我们尝试保留所有这些数据,那么我们需要的数据中心以及用来保留这些数据的存储系统的数量将是非常庞大的。事实上,我们有大量数据。”
这对供应商和企业来说都是问题。例如,开发自动驾驶汽车的公司会收集大量配备摄像头和传感器的驾驶数据,并记录一切,建立一个数据集来训练人工智能模型。是否可以删除一些增量信息?英伟达有自己的自动驾驶单元,可以模拟交通情况,这样就可以为研究人员提供他们所需要的信息,而无需收集大量数据。
企业方面,公司可以在重复数据删除方面做得更好,以提高存储效率。首席信息官和其他高管还需要清点系统数据,决定哪些有价值,哪些可以丢弃。
Das说:“那么,在哪里以最有效的方式来保存这些数据呢?这都是以后工作描述中非常重要的一部分。这一部分由他们负责。显然,供应商应该提供最好的技术使其高效。”(校对/武守哲)