华为将发布多模态千亿级大模型产品“盘古Chat”,加入国产大模型竞赛

导读 华为公司计划在今年7月7日的华为云开发者大会上发布并内测一款名为盘古Chat的多模态千亿级大模型产品,直接与ChatGPT进行竞争。这一消息是…

华为公司计划在今年7月7日的华为云开发者大会上发布并内测一款名为“盘古Chat”的多模态千亿级大模型产品,直接与ChatGPT进行竞争。这一消息是钛媒体App从华为内部独家获得的。预计盘古Chat将主要面向To B/G政企端客户,并有望成为国内技术能力最强的ChatGPT产品之一。此举使得华为成为继阿里和百度之后又一家重要的科技巨头加入国产大模型竞赛,同时也将为华为的生态产业链企业带来利益。

据了解,华为内部团队在盘古大模型的设计中确立了三个关键的核心原则:模型要大、网络结构要强、具有优秀的泛化能力。盘古大模型于2020年11月在华为云内部启动,2021年4月对外发布,成为首个干亿参数的中文预训练大模型。在2022年4月,华为升级了盘古到2.0版本,并发布了层次化开发方案,致力于打造工业级的盘古大模型。

盘古大模型的基础层包括NLP大模型、CV大模型和科学计算大模型,而上层则是与合作伙伴开发的华为行业大模型。该模型可应用于智能客服、机器翻译、语音识别等多个领域,提供AI技术支持。华为在垂直产业领域已经开始将盘古大模型落地应用,例如在矿山领域建立了基于大模型的人工智能训练中心,取得了显著的成本降低和效率提升。

华为在大模型训练方面具备优势,拥有完整的产业链和强大的算力调配能力。据报道,华为团队在训练千亿参数的盘古大模型时使用了超过2000块昇腾910芯片,并进行了超过两个月的数据训练。然而,盘古大模型的训练成本较高,尽管在中文语言处理方面具有高准确度和质量,但在语义理解方面仍存在一定的局限性,特别是在处理复杂的语言结构和语义推理方面。此外,盘古Chat大模型也将面临激烈的竞争压力,需要不断优化和提高模型的性能和质量,以保持市场中的领先地位。

未经允许不得转载:87头条 » 华为将发布多模态千亿级大模型产品“盘古Chat”,加入国产大模型竞赛

赞 (0)