苹果宣布整合ChatGPT！盘点硅谷大厂的AI策略 | 甜欣屋

6月10日（周一），苹果公司在年度开发者大会（WWDC）宣布将与OpenAI合作，通过大幅改进其智能语音助手Siri和操作系统来增强其AI能力，推出了名为“苹果智能”的新平台，旨在简化用户的设备使用体验。

这篇文章，我们就来盘点硅谷各大科技巨头的AI策略，用一句话概括一下每家的特色吧。

OpenAI – 大力出奇迹的AI

在2020年1月，OpenAI发布了一篇名为《神经语言模型的规模化定律（Scaling Laws for Neural Language Models）》的论文。它主要阐述的是，即使在相同的结构和数据集条件下，增大模型的规模也能提高系统的表现。这有点像举重或拳击，如果你的体型更大，你天生就会表现得更好。

就像那时候没有人知道COVID一样，也没有人关心规模化定律。直到2022年11月ChatGPT上线，40天内日活跃用户达到1000万。剩下的故事我们都知道了。

是OpenAI开启了这种越来越大的模型规模的趋势，而且是以指数方式增长的。

更酷的是，他们将规模化定律应用到了其他领域：DALLE用于图像生成，Sora用于视频处理。3D建模也即将推出。

我认为OpenAI展示了强者愈强的趋势。Sora这个文本到视频的模型，正是建立在他们自己的DALLE 3和GPT模型的坚实基础之上，以及他们可靠的数据基础设施之上。

如果真的要提出什么批评的话，可能是关于它最初的非营利性质，和后来的封闭源代码实践。不如干脆改名叫ClosedAI吧。

谷歌 – 道德的AI

八年前的2016年，谷歌宣布将从一家以移动为先的公司转变为一家人工智能为先公司。谷歌的研究工作分布在不同的团队中，运行方式相对较为松散。

所以，当OpenAI去年抢走了风头并引起轰动时，谷歌简直不知所措、被水淹没。

请允许我表达一些个人观点。许多今天AI产品中使用的机器学习方法，最初是由谷歌的研究人员提出的；许多方法都是开源的。Gemini模型在基准测试中表现相当不错。

公众的批评包括：

命名混乱：出于某种原因（我也不知道为什么），Bard被重命名为Gemini。
命名系列繁多，如Bard、Gemini、Gemini Advanced、Gemini 1.5 Pro、Gemini Ultra、Gemini for Workspace、Gemini Business和Gemini Enterprise。
多样性问题：Gemini在创建涉及历史事件的图像时，将少数族裔描绘为白人男性。

确实，对于那些知道美国开国元勋全是白人男性的人来说，这些图像可能更多的是笑料。但从ChatGPT和其他人工智能产品中，我们知道大型模型可能会编造信息，我们不应将人工智能生成的结果视为事实。至于那张伊隆·马斯克的照片，甚至不是由Gemini生成的。

因为这是谷歌，人们可能会有更高的期望。我理解这一点，但我们也应该公平看待。总结一下就是：谷歌拥有强大的研究团队、广泛的产品集成潜力，并且对人工智能伦理有所认识。

Meta – 开源的AI

Llama2模型在2023年7月意外泄露，意外地引发了一系列优秀的ChatGPT开源替代品。

Meta的人工智能部门倡导开源。他们表示：“在人工智能领域，我们的通用基础设施包括我们的Llama模型，包括目前正在训练中且表现出色的Llama 3，以及我们开发的行业标准工具如PyTorch。”

对于批评方面：

当如此强大的工具对所有人开放时，人们担心人工智能的安全性。
由于条款中的某些限制，它并不足够开放。
这个模型与闭源模型相比，性能不够好。

至于Llama2模型的表现不够好的问题，我不会抱怨。毕竟它是免费的，一分钱一分货嘛。

值得注意的另一个项目是，Meta的开源模型“Segment Anything”。语义分割是一个重要的研究任务，在现实世界中广泛应用。Meta的基础模型可能替代小型分割模型，并在各个领域表现出色。例如，我参与的一篇论文使用“Segment Anything”对道路进行分割，并将其转换成道路网络图，取得了一些很酷的成果。

短短几年，Meta从一个社交媒体平台转变为元宇宙，再到涉足人工智能领域。Llama 3将被整合到Meta的产品中，如WhatsApp、Messenger、Instagram和智能眼镜。让我们拭目以待吧！

微软 – 支持OpenAI

微软拥有OpenAI 49%的股份，并有权在偿还投资款项之前获得高达75%的OpenAI利润。我认为微软的支持也在奥特曼重返OpenAI中扮演了重要角色。OpenAI与微软的AI云生态系统非常契合。

另一个值得一提的优秀产品，是微软收购了GitHub。GitHub拥有Copilot，这是编程领域最佳的AI之一。微软通过投资获得酷炫技术的策略非常聪明。

根据IoT分析公司的说法：“尽管与OpenAI有着强大的合作关系，微软还大力推广通过其平台使用其他模型，如Llama 2。微软的另一个关键优先事项是，将AI能力整合到其现有的产品中，如Azure、微软全家桶和Bing。”

英伟达 – 硬件的AI

英伟达通过向上述的几家科技巨头出售GPU，而在市场上占据了优势。我们知道“卖铲子”总是一个安全且有回报的策略。

去年对GPU的需求激增，因此英伟达加强了其在市场中的主导地位。只需看看股价——在过去一年中翻了一番。

英伟达的独特之处，在于其软件生态系统。CUDA在市场上为英伟达打出了区分度；其他开源库如Nemo和Megatron，进一步帮助英伟达实现了价值传递。

英伟达有几个竞争对手，包括AMD和英特尔，其他大型科技公司也在研发芯片。你认为英伟达能保持其领先地位吗？在评论区留下你的想法吧！

特斯拉 – 路上跑的AI

特斯拉的自动驾驶方法与众不同。它起步于电动汽车，销售的每辆车都有潜力将数据反馈给特斯拉，这对于训练机器学习模型来说非常宝贵。

想象一下，当一个模型观察所有的地方就像一个人四处游荡一样，它将学习到很多关于世界的法律和模式，我们将获得类似于一个世界模型的东西。人们说：“特斯拉正在为自主机器人构建基础大模型”。

特斯拉不仅仅是汽车。特斯拉的机器人名为Optimus，是一种人型机器人。它与特斯拉汽车共享一些技术，能够完成很多任务。

亚马逊和苹果

对于亚马逊来说： “Jassy在周四发布的年度股东信中表示，他对‘许多改变世界的人工智能将建立在AWS之上’持乐观态度。”

我同意这一点。根据我自己的经验，在AWS上运行AI是非常方便的。

至于苹果： “据首席执行官蒂姆·库克透露，苹果计划在今年晚些时候公布更多关于将生成式AI（Gen AI）集成到其产品中的计划。”

考虑到苹果一直擅长保守秘密并在发布日期准时宣布，我相信他们确实有一些计划。（注：英文原文写于2024年4月）

欣想法

公司内资源的战时整合

在人工智能领域的公司间竞争中，由于规模化定律的影响，以及当前的“战时”状态，大型科技公司正在进行跨团队合作以加快进程。这就是为什么我们看到DeepMind和Google Brain合并的原因。通过将这些团队合并，谷歌不仅减少了重复工作，还显著增强了其能力，从而在该领域推动了更快的进展。

从学术影响到商业需求的焦点转移

科技巨头过去常常发表论文以增强其行业影响力，但现在他们不再公开技术细节。虽然基础研究依然重要，但明显地转向了产品化。我们看到在模型训练前后有大量的工程努力，如细致的数据清洗和积极收集用户反馈。目标已经转变为更加现实，并强调商业利益。

在现有产品中整合人工智能技术

自然地，大型科技公司寻求将人工智能技术整合到现有产品中，以利用它们庞大的用户基础和数据基础设施。纯粹的人工智能技术不足以建立护城河；它总是需要结合特定领域的优势。例如，谷歌在其2023年第四季度财报电话会议中表示，他们将使用人工智能改善搜索和云服务。

创业公司的空间并不像想象中那么大

大型科技公司拥有所有的人才、数据、基础设施和计算资源，能够构建强大的基础模型，这些模型可以广泛应用于许多细分领域。记住规模化定律——它为进入设置了高门槛。创业公司在寻找机会和确保资源方面面临巨大挑战。整体空间比看起来更狭窄，迫使创业公司寻找服务不足的市场或创新方法以产生影响。