自 2022 年年末起,伴随 ChatGPT 的惊艳亮相并持续迭代,全球范围内的各个国家、众多行业在面对 AI 大模型时仿佛都患上了 FOMO(Fear of Missing Out,错失恐惧症),纷纷积极行动,唯恐错失良机。
但截至目前,在这场热火朝天的“炼大模型”进程中,除英伟达赚得钵满盆盈之外,其余参与者尚未探索出稳定且持久的商业模式。恰恰相反,伴随参数规模的不断扩大,模型训练所需的算力成本愈发高昂,在巨大投入却不见产出的状况下,新的“焦虑情绪”开始四处蔓延。
在大模型“军备竞赛”尤为激烈的美国,资本市场近乎陷入“疯狂”态势。这两年间,美股市场中但凡与 AI 相关的股票都一路飙升。苹果举行一场 AI 进展发布会,次日市值就猛增 2142 亿美元;以微软领衔的美股“Big7”的市值,更是达到前所未有的 14 万亿美元,在标普 500 中占比 32%,纸面市值远超实际价值,其“疯狂”程度可谓史无前例。投行分析师们开始担忧一个比互联网泡沫规模更大的 AI 泡沫即将来临。
在中国的互联网领域,巨头们在为与美国的差距而焦虑的同时,开始不断压低每 Token 的价格,早早地开启了简单直接的价格战。其中,字节跳动的豆包大模型将通用模型 pro-128k 版的推理输入价格设定为 0.005 元/千 tokens,相比行业水平大幅降低 95.8%;阿里的通义千问把主力模型 Qwen-Long 的 API 输入价格降至 0.0005 元/千 Tokens,降幅高达 97%;百度甚至宣称将文心大模型的两款主力模型 ENIRESpeed 和 ENIRELite 完全免费。
一方面是 AGI 的高远追求,另一方面是 ROI 的冷峻现实,面对 AI 大模型这趟驶向未来的列车,不上车不行,上车后找不到理想位置、无法坚持到底也不行,究竟该如何抉择?
在中国的政企领域,一批富有前瞻性的开拓者将通用大模型与特定行业的专业知识相融合,构建属于自身的专属大模型,以此加速行业 AI 应用的落地,切实实现大模型的价值,为业界摆脱 AI 大模型“焦虑症”找到了“最佳方案”!
中国大模型摆脱“焦虑症”,行业成破局关键
自全球“大模型竞争”拉开帷幕,“中美在 AI 领域的差距究竟有多大”一直是公众热议的焦点话题,说法从 1 - 2 年到 8 - 10 年不等。
不得不承认,我国在算力、算法和数据方面确实不占优势:高端算力卡被英伟达限制供应,短期内自身的制程和设计难以跟上;算法领域,虽然模型数量众多,但大多是基于国外开源架构进行优化,缺乏自主性和领先性;数据领域,我们的开放数据与国外相比不在同一数量级,中文语料严重匮乏。
这些差距短期内难以抹平,此时,缩短差距的正确方式,显然不是用自身短板去比拼他人长处。
换个角度看,我国拥有全球独一无二的全工业门类、数量最多的金融消费人群以及规模最大的政务和城市体系,由此产生了丰富的场景和私有数据,这些都为发展行业大模型提供了得天独厚的条件。所以,在应用方面展开比拼成为中国大模型破局的一条有效途径,通过大模型为一个个行业细分场景赋能,最终实现战略突围。
凭借差异化优势入局,可以预料,如今率先拥抱大模型的行业企业和组织,迎来的将是一个具有划时代意义的重大战略机遇。
政企行业大模型困难众多,工程化能力决定成败
当然,站在新的起点,政企行业构建大模型,面临诸多挑战,因为大模型的应用本身就是一项复杂的系统工程,除了单点技术的不断突破,更需要依据场景和需求适配恰当的技术,通过全链路、多技术融合的系统性创新整体推进。
首先,大模型并非孤立的技术,必须注重软硬件基础设施的协同发展。除了大模型本身,还需关注其背后的技术生态系统,涵盖开发工具、计算架构以及硬件设施如算力、存储和网络。在设计和验证过程中,必须考量性能、可靠性、可维护性和兼容性,以确保系统高效稳定运行。
其次,行业大模型需要适应 AI-Native 的基础设施。一般企业可以直接选用公有云以享受其充足的算力,但对于政府、金融、电力等大型政企而言,为满足安全合规要求,混合云才是更优选择,即先借助公有云的强大算力和数据训练基础大模型,再在私有云结合私有数据进行二次训练得到企业专属大模型,最后在边缘云进行推理实现场景化应用。
再者,大模型需要建立 AI 开发工作流程,推动模型确定性交付。大模型的开发是一个复杂的系统工程,需要跨团队协作和迭代开发。为提升开发效率和质量,需要构建一站式的 AI 开发工作流程,实现标准化和自动化,降低开发过程中的不确定性。
然后,大模型需要重视数据工程,构建优质数据集。高质量的数据是大模型成功的关键。当前中文数据集与英文存在差距,需要通过建立数据工程能力,优化数据的供应、流动和使用,为大模型提供高质量的数据。
另外,行业大模型不宜单打独斗,需要大力培育产业生态。生态是发展大模型不可或缺的因素,这需要政府和行业头部企业从技术生态、数据生态、模型生态和应用生态四个层面,构建 AI 时代开放、可闭环、高质量的生态体系。
最后,大模型不是一次性的工作,需要持续运营和优化。大模型的运营和建设同等重要,持续的运营和优化对于大模型平台的长期价值至关重要,这要求企业建立适宜的流程、组织结构和人才队伍,不断优化现有场景并探索新的应用领域。
总之,行业大模型考验的并非单项能力,而是全流程融会贯通的工程化能力。
先行者稳步前行,行业大模型前景光明
综上所述不难发现,尽管当前大模型在技术和价格方面竞争激烈,但其实现价值的“主渠道”在于行业,真正的竞争重点在于落地。在行业大模型的赛道上,不盲目追求算力和参数量的堆砌,而是聚焦技术与场景的深度融合,扎实积累工程化能力,助力行业大模型落地才是关键。从这个角度来说,AI for industries 的华为云与政企行业先行者的联合创新实践,走在了正确的道路上。
去年,华为云率先发布业界首个大模型混合云华为云 Stack。在近期的华为开发者大会上,华为云进一步发布大模型混合云十大创新技术,包括多样性算力调度、算子加速、云边协同等等。既有核心技术研发实力,又拥有业界最全面的 AI 大模型全套工具链和软硬件产品,华为云 Stack 的一系列举措,极大地缓解了行业大模型的焦虑。
例如,从 2022 年起,山东能源集团与华为云基于混合云打造全球首个矿山大模型,已在煤矿领域 9 个专业 40 多个场景进行应用实践。今年 1 月,鄂尔多斯与华为联合打造内蒙古首个以行业 AI 大模型为核心的工业互联网平台,在煤矿领域的提升、主运、安监、防冲、采煤、掘进、辅运、洗选、焦化等 9 个专业实现了 26 个场景的智能化,达到可视、可管、可溯的规范化作业,在提升安全生产能力的同时有效提高了生产效率和效益。
更值得关注的是,先行政企的行业大模型不仅用于自身,还在牵头打造示范场景并积累经验,向外输出为行业赋能。比如,鄂尔多斯工业互联网平台目前已完成 44 个 AI 大模型应用开发,上架 270 多款商品,为 28 家 AI 企业、16 家矿鸿企业共 44 家应用开发者以及当地 300 多家矿山生产企业提供了开放可靠的交易平台。
展望未来,相信在华为云及产业上下游各方的共同努力下,依托我国场景丰富的优势,大模型必定能够开拓更广阔的行业智能化空间,加速迈向智能世界,释放出更大的经济和社会效益!
声明:本站所使用的图片文字等素材均来源于互联网共享平台,并不代表本站观点及立场,如有侵权或异议请及时联系我们删除。