下一个苹果还是苹果
下一个苹果还是苹果
苹果冷静地观察了生成式 AI 亢奋的一年,一直在为自己的生态基础添砖加瓦,还在一步一个脚印地迈向明年发布 AiPhone。
十月份,苹果机器学习研究团队曾推出一个 " 雪貂 " 模型(Ferret),这个多模态大模型比 GPT-4v 对空间的理解更准确。最近这个模型开源了。简单地说,在一幅图中的任何地方,你指出任何一个物体,哪怕它再微小," 雪貂 " 都能解释清楚。
这种对空间的敏感,对于苹果即将发布的 Vision Pro 具有重要作用,它让自然 / 虚拟的视觉感知与语言大模型结合。这篇不张扬的论文作者全部是华人,最近越来越引起业内的重视,它在空间计算上达到了 SOTA 水平。
" 雪貂 " 模型架构 (来源:FERRET: REFER AND GROUND ANYTHING ANYWHERE AT ANY GRANULARITY )
苹果最近推出了能在其 M3 芯片上训练部署大模型的开源框架 MLX。这意味着 Mac 笔记本电脑的开发者,可以开发出大模型支持的应用。
苹果还推出了 " 闪电大模型 " (LLM in a Flash),用闪存解决了手机上部署大模型内存(DRAM)不足的问题。
这是个人很喜欢的一篇论文。是的,偷偷干活的苹果,也开始默默地发论文了。
这篇论文谈的是一个小而关键的问题,如何在手机这样一个内存非常有限的空间里,部署一个大模型,而且推理的速度要快,还不费电池。
它的最大优点,不是就算法谈算法,而是从对硬件的深刻理解,结合算法提出了自己的方法。它的出发点完全是消费者思维,大模型在遥远的云端,大得吓人,贵得惊人,只有揣在用户的口袋里,才能让消费者对生成式 AI 产生感觉。
DRAM 太小,放不下一个几十亿级的模型。尽管可以放到闪存里,但闪存的带宽不够。为了最小化从闪存到 DRAM 带宽的负载,苹果创新了两个技术,窗口化 (windowing)和行列捆绑 (row-column bundling)(详见论文)。
在 OPT 6.7B 和 FALCON 7B 两个模型上测试,结果相当 " 炸裂 ",能够运行的模型尺寸达到可用 DRAM 能容纳的两倍,与 CPU 和 GPU 中的简单加载方法相比,推理速度分别提高了 4~5 倍和 20~25 倍。
对齐芯片、操作系统和系统设计,找到方法建立起一个推理成本模型,这事只有苹果做得出来。
最近一系列的几十亿参数级小模型表现当惊世界,如 Mistral, Phi-2 能挑战百亿参数级大模型;谷歌推出了 18 亿参数的 Nano 级 Gemini 模型,直接装到 Pixel 手机上。高通的骁龙芯片能跑得动百亿参数级的模型。三星可能将于 2024 年初推出生成式 AI 游戏功能的 Galaxy S24 手机。
还有上海交大团队推出的推理引擎 PowerInfer,都为大模型在设备终端,尤其是手机和笔记本电脑的部署,扫清一个又一个障碍,也预示着 2024 年,消费类电子产品,将会迎来一波大模型加载的高潮。
这些 " 小 " 模型的推出,有一个共同的特征,就是采用了高质量的数据," 教科书级 " 的数据。无疑,主流新闻媒体的档案,所能提供的是好的语言训练材料。
苹果正在与美国各大媒体机构谈判,约以 5000 万美元的价格,获得这些媒体的档案语料库,用来训练自己的大模型,可能会用 Siri 的对话服务。
想想这些用来训练语料的品质吧,康迪纳斯特的 Vogue、New Yorker、NBC News,以及 IAC 的 People、The Daily Beast、Better Homes、 Gardens 等。它包括大量的以时尚与生活方式为内容的精美文字和图片。也包括部分新闻文章、图片和视频。
但是其他的主流媒体对此没有表示出多少兴趣。以往纸媒与社交媒体的合作,并没有给他们带来多少利益。另外,媒体将其档案中的新闻交给苹果去训练大模型,在使用的过程中,可能产生的法律纠纷,也引起这些媒体的担忧。
苹果的做法,被认为更加地道。其他的 AI 公司或者科技巨头,是先用了人家的语料,被揪住了再去谈授权,已经引发了一些官司。
苹果出于对隐私的强调,它不愿意直接从网络上扒数据。苹果也不允许收集其客户的数据。
那么,2024 年苹果会做什么?
大家首先想到的是,它会在明年推出生成式 AI 加持的语言助理 Siri。它将是 2024 年秋季 iPhone16 和 iOS18 的最大亮点。有些果粉开玩笑说会推出 SiriGPT。但这些都只是冰山一角。
巨头的做法,通常是寻找新的技术加强其固有的核心能力,在原有的产品上产生差异化。是从表面上看,吃老本的苹果,在生成式 AI 上行动迟缓,采取了保守的跟随战略?还是苹果能真正利用其在芯片、操作系统、大模型方面一体化整合的能力和产品设计能力,做出最好的 AI 产品体验?答案可能是后者。
苹果在过去的几年,已经收购了几十家 AI 初创企业,用于其产品、服务及生态中。只是这里面没有那些明星级的初创公司。
苹果只做不说,早有分析人士注意到,苹果在 AI 上的投资,一点都不比微软少:已经花了上百亿美元,建造生成式 AI 应用开发的基础设施。稍早人们传闻苹果在内部偷训自己的大模型 Ajax,或者叫 Apple GPT,据说当时能赶上 GPT-3.5。
但最近苹果在机器学习方面一系列的研究成果表明,苹果在走自己的路。微软、谷歌、亚马逊、英伟达,以及 OpenAI 为代表的闭源大模型公司,围绕模型、云和算力去收割了第一茬。
而苹果看重的是其 20 亿设备及其用户所形成的巨大的生态。生成式 AI 所带来的 iPhone 的新的体验,以及用大模型去加持所有的应用,这些给苹果带来的消费市场机会,是其他巨头难以夺走的。苹果以隐私保护的名义,控制了第三方应用之间互相窜访,这也让苹果商店成为自己未来 AI 应用的金矿。
苹果动作慢了吗?生成式 AI 的幻觉问题,还有监管、隐私保护、版权纠纷等,这些问题都会令苹果想得更深一些,考虑得更周全一些。苹果有这样的底气,因为它在芯片、操作系统、应用、产品、制造等各个层面一体化的设计,最终所带来的产品体验创新性的深度,仍将可能是其竞争对手难以比拟的。
OpenAI 引发的 "iPhone 时刻 ",已经尖叫好几回了,但下一个苹果,还是苹果。
-
- 姗姗来迟的 OPPO Find X7,能给 OPPO 开个好头吗?
-
2023-12-27 11:13:07
-
- 继电器原理及继电器接线图
-
2023-12-26 11:10:56
-
- 红发:给我一个面子,把这9张图拿去做电脑壁纸,因为霸气
-
2023-12-26 11:08:40
-
- 和“狼牙”相比,火凤凰这些女特种兵的代号真是一个比一个乱
-
2023-12-26 11:06:23
-
- 国漫经典邋遢大王,里面恐怖的画面你还记得多少
-
2023-12-26 11:04:07
-
- 第十二届音乐盛典咪咕音乐汇直播!五月天,薛之谦,周杰伦
-
2023-12-26 11:01:51
-
- 成都龙泉驿区启用一批电子警察,7月18日正式开通运行
-
2023-12-26 10:59:35
-
- ETC的电子标签失效、读不出卡,别慌,这里有解决办法
-
2023-12-26 10:57:19
-
- 7.26抢婚日:相爱9年,隔6000公里抢婚,全网的兄弟都去帮忙了!
-
2023-12-26 10:55:03
-
- 《香蜜沉沉烬如霜》邝露是谁,她是太乙仙人女儿,背景不简单!
-
2023-12-26 10:52:46
-
- 知网论文检测和PaperPass有什么区别
-
2023-12-26 10:50:30
-
- 淄博站—鲁中最大的交通枢纽
-
2023-12-25 22:15:14
-
- 朱一龙演过《芈月传》,出道十年才火,你知道吗?
-
2023-12-25 22:12:59
-
- 垭口套是什么?垭口套有什么作用呢?简单介绍,一看就懂
-
2023-12-25 22:10:42
-
- 武装突袭3配置要求高吗 配置要求介绍
-
2023-12-25 22:08:26
-
- 王者荣耀英雄台词对话集锦,这是你们最喜欢的一对“CP”嘛?
-
2023-12-25 22:06:10
-
- 同事早两个月买了阿特兹,现在出新款后悔死了
-
2023-12-25 22:03:55
-
- 千呼万唤终定档,《大秦帝国之天下》12.1央视八套黄金档开播
-
2023-12-25 22:01:38
-
- 你要不要饼干?最新坑人套路表情
-
2023-12-25 21:59:22
-
- 蒙城又一涉黑涉恶团伙被捣毁 已有20人被抓
-
2023-12-25 21:57:06