去可网 > 社会 > 正文

​一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户

2024-06-09 04:12 来源:去可网 点击:

一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户

作者 | 王沁

编辑 | 邓咏仪

5 月刚刚大降价的智谱 AI,这个月再给用户们全面上新。

6 月 5 日,智谱 AI Open Day 正式举办。在现场,智谱 AI 发布了全新的开源大模型 GLM-4 系列、新 API 模型、MaaS 2.0 大模型开放平台、智能体等等产品。

5 月的大模型 " 大促月 " 还没结束,智谱也再度跟进降价。

比如,GLM-4-Flash 轻量化版本,在企业优惠价下最低只需要 6 分钱 /100 万 token。这意味着不到一毛钱就可以把四大名著如《红楼梦》写两遍。

而在企业 V3 版的价格下,用 CogView-3 文生图模型生成一张图只要 6 分钱。

智谱 AI 也公布了过去一年的产品、商业化进展:

当前,智谱 AI 的开放平台已服务 30 万企业级客户,日均调用量达 400 亿 token,过去 6 个月 API 每日消费量增长了 50 倍以上。

智谱 AI 旗下的 To C 产品智谱清言 App,当前已经有超过 30 万个智能体活跃在清言的智能体中心内,其中包括了思维导图、文档助手、日程安排等许多生产力工具。

新版的 MaaS 大模型开放平台,价格体系更加细分,让企业客户有多套餐可选。无需代码,客户以三步完成微调,用自有数据就可以部署私有模型。

90 亿参数模型开源,API 价格新低

值得注意的是,此次智谱开源了一个 90 亿参数的 GLM-4-9B 模型,其综合能力相比 ChatGLM3-6B 提升 40% ,全面超过 Llama-3-8B-Instruct。

而对比训练量更多的 Llama-3-8B 模型,GLM-4-49B 在英文方面有小幅领先,中文学科能力提升 50%。

上下文窗口,也从 128K 扩展到了 1M token。这意味着模型能同时处理 200 万字的输入,大概相当于 2 本红楼梦或者 125 篇论文的长度。

GLM-4-9B 模型也有自己调用外部工具的能力,即 All Tools 能力,能够调用外部工具(比如代码执行、联网浏览、画图、文件操作、数据库查询、API 调用等)来辅助回答问题或完成任务。

从模型体量上看,GLM-4-9B 可以算是适用于非常多应用落地场景的一个小尺寸。智谱也表示,在开源模型上,智谱并未追求一味扩大模型参数。

" 在模型规模方面,我们认为对于个人用户和开发者来说,显存更加珍贵,因此我们没有采用例如混合专家结构这种用显存来换性能的结构,而是略微将模型规模扩大到 9B,用实际的计算量来追求性能。" 智谱 AI 的技术团队表示。

在大模型的落地上,小模型(10B 以下的轻量化大模型)在应用落地上有独特的优势——参数小、占内存少、响应速度快、易于在端侧运行。训练大模型需要巨大算力资源和数据,而小模型所需数据更少,应用场景特定,商业化也更容易。

如今,各个大厂都有推出小模型系列产品——比如微软的 SLM(小语言模型)Phi-3 系列、苹果的 " 小模型 " 家族、谷歌的 Gemma 等等。

MaaS 平台,加量但降价

另外,智谱的 MaaS 大模型开放平台也发布了 2.0 版本。相比之下,今年 1 月智谱 Dev Day 强调更大参数模型 GLM-4 的硬核能力,在对话、代码、图片理解、文生图等全方位硬刚 OpenAI,称 GLM-4 的英文能力达到 GPT-4 的九成,在中文表现上超越对方。

而新一代 MaaS 平台支持的一系列新模型更重视商业化应用,让企业根据不同需求有多套餐可选,差异化选择:

GLM-4 性能最强大,不过也最贵(100 元 /100 万 token)

GLM-4-Air 性能堪比规模更大的模型 GLM-4-0116、但有更性价比,GLM-4-Flash 价格最优惠(0.1 元 /100 万 token)

而 CogView-3 文生图模型一张图只要一毛钱。

模型有套餐,企业 VIP 卡也上线了各种分级套餐。现在,智谱的 MaaS 平台有 9 折 V0、8 折 V1、7 折 V2、6 折 V3 的企业服务体系。比如,V3 价格下,GLM-4-Flash 下 100 万 token 只要 6 分钱,CogView-3 生成一张图 6 分钱,主打量大便宜。

而针对企业用户的数据安全、对私有化模型的需求,智谱的 MaaS 大模型平台上线模型微调功能,在准备训练数据、创建微调任务、部署微调模型三个步骤后,就可以完成一个私有模型的训练。

智能体上线,能做的任务又变多了

AI 圈内热议的 " 智能体 "(Agent),现在和大模型的结合度,也越来越紧密。

如今,清言 App 推出的多智能体协作系统 " 清流 ",可以在同一个对话框中,自由调用多种不同的智能体协同工作。

清言可以调用思维导图、流程图、数据分析等多个不同智能体,同时接入微博、飞书、日历等平台工具。

图源:智谱 AI

智谱 AI 举了不少有趣的案例。

一位 9 岁的小男孩,与智谱清言合作,写出了一本关于火星生存的科幻小说。

他先问质谱清言,如何才能在火星上生存?智谱清言给出氧气、水、食物、能源等关键生存因素,再确立整本书的框架。

在用户和质谱清言的对话轮回中,填充文本,智谱清言还会查询科学数据来检查小说内容,修改文字错误。

智谱 AI Open Day 现场还展示了一个 " 赛博 IP" ——罗永浩智能体。

智谱 AI 智能体员工 "AI 老罗 "

它有着跟罗永浩一样的广博的知识面、幽默的说话腔调,全天候 24 小时工作,还发挥老本行特色,现场为一套 " 奇葩 " 挖掘机形状的房屋户型图,来了一段罗永浩风格的直播推销:" 你想象一下,你就打算在挖掘机的房子那得多酷,你住在里面每天都能感受到那种工程的力量和魅力 ...... 这个挖掘机户型把每个空间都挖掘得恰到好处,不像那些动辄几百平米的豪宅,看似气派,其实住起来空荡荡的,冷清得很。"

"AI 老罗 " 解说的挖掘机户型

根据 36 氪的试用,现在清言 APP 的智能体中心,已经有多种对话场景。

比如,你可以在催生了人工智能革命的达特矛斯会议上与信息论始祖香农对话,在作家聊天群中与莫言、余华对话,在 " 无限流续写 " 中通过对话编织小说,向 " 专业选择引导师 " 智能体询问如何选高考专业。

智谱清言聊天界面

大模型降价已经成为趋势,现在许多大模型的小尺寸模型价格已经接近免费,这会持续多久?政务服务企业华信永道副总经理吴文表示,企业用户在意价格,但不是最在意价格,帮助企业增加利润率最重要,只要能帮助企业增加收入,即使贵,企业也愿意用。而爱设计 CEO 赵充在会上表示,降价的底线是电费,只要比电费高,就还有利润空间。