6月10日(周一),苹果公司在年度开发者大会(WWDC)宣布将与OpenAI合作,通过大幅改进其智能语音助手Siri和操作系统来增强其AI能力,推出了名为“苹果智能”的新平台,旨在简化用户的设备使用体验。
这篇文章,我们就来盘点硅谷各大科技巨头的AI策略,用一句话概括一下每家的特色吧。
OpenAI – 大力出奇迹的AI
在2020年1月,OpenAI发布了一篇名为《神经语言模型的规模化定律(Scaling Laws for Neural Language Models)》的论文。它主要阐述的是,即使在相同的结构和数据集条件下,增大模型的规模也能提高系统的表现。 这有点像举重或拳击,如果你的体型更大,你天生就会表现得更好。
就像那时候没有人知道COVID一样,也没有人关心规模化定律。直到2022年11月ChatGPT上线,40天内日活跃用户达到1000万。剩下的故事我们都知道了。
是OpenAI开启了这种越来越大的模型规模的趋势,而且是以指数方式增长的。
更酷的是,他们将规模化定律应用到了其他领域:DALLE用于图像生成,Sora用于视频处理。3D建模也即将推出。
我认为OpenAI展示了强者愈强的趋势。Sora这个文本到视频的模型,正是建立在他们自己的DALLE 3和GPT模型的坚实基础之上,以及他们可靠的数据基础设施之上。
如果真的要提出什么批评的话,可能是关于它最初的非营利性质,和后来的封闭源代码实践。不如干脆改名叫ClosedAI吧。
谷歌 – 道德的AI
八年前的2016年,谷歌宣布将从一家以移动为先的公司转变为一家人工智能为先公司。谷歌的研究工作分布在不同的团队中,运行方式相对较为松散。
所以,当OpenAI去年抢走了风头并引起轰动时,谷歌简直不知所措、被水淹没。
请允许我表达一些个人观点。许多今天AI产品中使用的机器学习方法,最初是由谷歌的研究人员提出的;许多方法都是开源的。Gemini模型在基准测试中表现相当不错。
公众的批评包括:
- 命名混乱:出于某种原因(我也不知道为什么),Bard被重命名为Gemini。
- 命名系列繁多,如Bard、Gemini、Gemini Advanced、Gemini 1.5 Pro、Gemini Ultra、Gemini for Workspace、Gemini Business和Gemini Enterprise。
- 多样性问题:Gemini在创建涉及历史事件的图像时,将少数族裔描绘为白人男性。
确实,对于那些知道美国开国元勋全是白人男性的人来说,这些图像可能更多的是笑料。但从ChatGPT和其他人工智能产品中,我们知道大型模型可能会编造信息,我们不应将人工智能生成的结果视为事实。至于那张伊隆·马斯克的照片,甚至不是由Gemini生成的。
因为这是谷歌,人们可能会有更高的期望。我理解这一点,但我们也应该公平看待。总结一下就是:谷歌拥有强大的研究团队、广泛的产品集成潜力,并且对人工智能伦理有所认识。
Meta – 开源的AI
Llama2模型在2023年7月意外泄露,意外地引发了一系列优秀的ChatGPT开源替代品。
Meta的人工智能部门倡导开源。他们表示:“在人工智能领域,我们的通用基础设施包括我们的Llama模型,包括目前正在训练中且表现出色的Llama 3,以及我们开发的行业标准工具如PyTorch。”
对于批评方面:
- 当如此强大的工具对所有人开放时,人们担心人工智能的安全性。
- 由于条款中的某些限制,它并不足够开放。
- 这个模型与闭源模型相比,性能不够好。
至于Llama2模型的表现不够好的问题,我不会抱怨。毕竟它是免费的,一分钱一分货嘛。
值得注意的另一个项目是,Meta的开源模型“Segment Anything”。语义分割是一个重要的研究任务,在现实世界中广泛应用。Meta的基础模型可能替代小型分割模型,并在各个领域表现出色。例如,我参与的一篇论文使用“Segment Anything”对道路进行分割,并将其转换成道路网络图,取得了一些很酷的成果。
短短几年,Meta从一个社交媒体平台转变为元宇宙,再到涉足人工智能领域。Llama 3将被整合到Meta的产品中,如WhatsApp、Messenger、Instagram和智能眼镜。让我们拭目以待吧!
微软 – 支持OpenAI
微软拥有OpenAI 49%的股份,并有权在偿还投资款项之前获得高达75%的OpenAI利润。我认为微软的支持也在奥特曼重返OpenAI中扮演了重要角色。OpenAI与微软的AI云生态系统非常契合。
另一个值得一提的优秀产品,是微软收购了GitHub。GitHub拥有Copilot,这是编程领域最佳的AI之一。微软通过投资获得酷炫技术的策略非常聪明。
根据IoT分析公司的说法:“尽管与OpenAI有着强大的合作关系,微软还大力推广通过其平台使用其他模型,如Llama 2。微软的另一个关键优先事项是,将AI能力整合到其现有的产品中,如Azure、微软全家桶和Bing。”
英伟达 – 硬件的AI
英伟达通过向上述的几家科技巨头出售GPU,而在市场上占据了优势。我们知道“卖铲子”总是一个安全且有回报的策略。
去年对GPU的需求激增,因此英伟达加强了其在市场中的主导地位。只需看看股价——在过去一年中翻了一番。
英伟达的独特之处,在于其软件生态系统。CUDA在市场上为英伟达打出了区分度;其他开源库如Nemo和Megatron,进一步帮助英伟达实现了价值传递。
英伟达有几个竞争对手,包括AMD和英特尔,其他大型科技公司也在研发芯片。你认为英伟达能保持其领先地位吗?在评论区留下你的想法吧!
特斯拉 – 路上跑的AI
特斯拉的自动驾驶方法与众不同。它起步于电动汽车,销售的每辆车都有潜力将数据反馈给特斯拉,这对于训练机器学习模型来说非常宝贵。
想象一下,当一个模型观察所有的地方就像一个人四处游荡一样,它将学习到很多关于世界的法律和模式,我们将获得类似于一个世界模型的东西。人们说:“特斯拉正在为自主机器人构建基础大模型”。
特斯拉不仅仅是汽车。特斯拉的机器人名为Optimus,是一种人型机器人。它与特斯拉汽车共享一些技术,能够完成很多任务。
亚马逊和苹果
对于亚马逊来说: “Jassy在周四发布的年度股东信中表示,他对‘许多改变世界的人工智能将建立在AWS之上’持乐观态度。”
我同意这一点。根据我自己的经验,在AWS上运行AI是非常方便的。
至于苹果: “据首席执行官蒂姆·库克透露,苹果计划在今年晚些时候公布更多关于将生成式AI(Gen AI)集成到其产品中的计划。”
考虑到苹果一直擅长保守秘密并在发布日期准时宣布,我相信他们确实有一些计划。(注:英文原文写于2024年4月)
欣想法
公司内资源的战时整合
在人工智能领域的公司间竞争中,由于规模化定律的影响,以及当前的“战时”状态,大型科技公司正在进行跨团队合作以加快进程。这就是为什么我们看到DeepMind和Google Brain合并的原因。通过将这些团队合并,谷歌不仅减少了重复工作,还显著增强了其能力,从而在该领域推动了更快的进展。
从学术影响到商业需求的焦点转移
科技巨头过去常常发表论文以增强其行业影响力,但现在他们不再公开技术细节。虽然基础研究依然重要,但明显地转向了产品化。我们看到在模型训练前后有大量的工程努力,如细致的数据清洗和积极收集用户反馈。目标已经转变为更加现实,并强调商业利益。
在现有产品中整合人工智能技术
自然地,大型科技公司寻求将人工智能技术整合到现有产品中,以利用它们庞大的用户基础和数据基础设施。纯粹的人工智能技术不足以建立护城河;它总是需要结合特定领域的优势。例如,谷歌在其2023年第四季度财报电话会议中表示,他们将使用人工智能改善搜索和云服务。
创业公司的空间并不像想象中那么大
大型科技公司拥有所有的人才、数据、基础设施和计算资源,能够构建强大的基础模型,这些模型可以广泛应用于许多细分领域。记住规模化定律——它为进入设置了高门槛。创业公司在寻找机会和确保资源方面面临巨大挑战。整体空间比看起来更狭窄,迫使创业公司寻找服务不足的市场或创新方法以产生影响。
它不仅改善了决策过程,还增强了团队和部门之间的协作。专业数据库具有适应和适应不断变化的业务需求的能力,为有效管理数据提供了灵活可靠的解决方案。
个人感觉,虽然目前苹果自己在LLM上不怎么样,但是苹果对于如果把LLM集成到产品中,做的还是很好的
写的很好,简单明了
谢谢你呀