华为发布盘古大模型:很酷,不聊天
千呼万唤始出来。
来源|AI蓝媒汇
(相关资料图)
ID:lanmeih001
作者|伊柒
编辑|魏晓
“怎么上半年,就听不到你们的一点消息呢?”
外界对华为大模型最关心的这个问题,在今天的开发者大会上,华为高管开场便做了解释:
华为的盘古大模型, 不会写诗,只会做事。
翻译翻译就是:很酷,不聊天。
2023年7月7日,华为开发者大会2023在东莞举办。会上,华为常务董事、华为云CEO张平安最先登台演讲,并发布了盘古大模型3.0,强调称 “华为做AI的方向始终是AI for industries(工业人工智能)”。
本次发布的盘古大模型3.0,亦是 面向行业。
区别于最早一批发布的通用大模型,如百度文心一言、讯飞星火等低门槛接触、随意对话的新一代人工智能,华为并未将自家大模型的重心放在C端。
从现场演示来看,盘古并非没有对话和问答功能,而是华为选择将这些ToC功能先放在行业场景中,再来看效果。
对于这家国内科技巨头而言,多年以来专精于B端业务的模式,或许已经成为惯性。
大模型之战,华为有备而来
没有写作绘画,没有诗和远方,华为给盘古大模型的定调就是 “完全面向行业”的大模型。
背后,则是一套系统——包括自然语言、多模态、视觉、预测大模型和科学计算五个基础大模型,以及针对政务、金融、制造、矿山等行业设计的专用大模型,和台风预测、药物制造等场景大模型。
早在2021年年报中,华为就已经提及“盘古预训练大模型”和生物医学、图文音多模态等数个应用案例,公司的布局远早于2022年末掀起的这场AI之战。
图/2021华为年报
显然,老师傅有备而来。
会上,华为以盘古大模型在气象和采矿等场景的作用为案例做了演示。
在煤矿行业,华为将盘古大模型应用到矿山开采及运输等7大业务流程、1000余个场景中,实现无人、少人安全作业。据悉,盘古矿山大模型已经在全国8个矿井规模使用。
而在气象领域,盘古大模型也提前十天成功预测了台风玛雅的移动路径,以及寒潮的来临。资料显示,盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速一万倍以上,可以在秒级时间内完成未来全球一个小时到7天的天气预报。7月6日,国际科技期刊《nature》刊发盘古气象大模型文章,审稿人称,“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。
只是略显遗憾,或者说略有欠缺的是,本次开发者大会上华为演示的台风预测、矿山开采等大模型应用, 实际上都是在2022年年报中已有场景。
惊喜不多,华为给外界的印象仍是沉稳。
卡脖子的GPU,搞定了?
值得注意的是,华为还在会中提及了自身的AI算力底座。
大模型行业的一个现状是——算力决定能力,而在GPU芯片等硬件领域,华为被卡脖子已有多年。
大家知道,其他人都可以用行业里最成熟的GPU、最成熟的软件,但华为不可以。
张平安一句话点出了华为在AI赛道的硬件阻力—— 没有现成的装备,华为只能依赖自研AI根技术。
好在,华为很争气。
“我们在最底层,构建了以鲲鹏、昇腾为基础的,AI昇腾云算力底座。并在昇腾之上,提供了计算框架CANN…… 昇腾云的效能不仅不落后,反而领先于业界主流GPU。”
资料显示,华为通过针对技术、传输以及使用场景的优化,使盘古大模型训练效率对比业界主流GPU平均提升1.1倍。
并且,这些算力底座除了支持自家AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。针对昇腾云服务的商用,华为在贵安和乌兰察布两地上线了两个新的AI算力中心,用以承载客户的算力需求。
目前,美团已陆续将数十个AI应用迁移到昇腾云,大模型算法也将迁移到云端。按照华为的盘算,依托算力硬件和自研技术等优势,未来将会有更多B端客户,带着场景排队上门,即插即用。
只是,在半数大模型厂商已经卷向B端,谋求对接企业的当下, 盘古大模型在B端绝非没有对手。
华为很能打,但AI的变数实在太多。
今日话题
你看好华为的盘古大模型吗?
来评论区我们聊聊~
往期经典回顾