大模型应用#1:从Chatbot到AI Agent,个人助理重塑手机应用生态
随着大规模AI模型能力的进步,聊天机器人在C端受到了广泛的“排斥”。聊天机器人可以自动处理和响应用户输入,模拟人类对话,并通过文本或语音与用户实时交互。 2010年代,随着NLP等技术的发展,聊天机器人在客户服务、营销、企业信息服务等领域得到广泛应用。但由于语言理解和生成能力有限,聊天机器人的实现一直局限于特定的B端服务场景,并没有形成具有广泛影响力的C端产品。 2022年12月,ChatGPT在文本生成、代码生成和修改、多轮对话等方面展示了显着超越过去AI问答系统的能力,将聊天机器人行业带入了我所展示的AI大模型时代。那。自此,Chatbot一跃成为谷歌巴德、百度文心一言、阿里巴巴同易前文等各大模型厂商的“标配”产品,为C端用户体验大模型提供了最低门槛。 2023年一个又一个。
除了文本对话功能外,随着大型AI模型功能的发展,聊天机器人的功能也在迅速丰富。过去一年来,各大设备厂商的聊天机器人产品普遍扩展了聊天机器人的功能,包括增加图像理解和文本生成功能,以及添加应用插件商店等。以ChatGPT为例,2023年9月OpenAI将DALL-E 3集成到ChatGPT中以支持Vincent图功能。 2024年1月,OpenAI正式推出应用商店GPT Store。那时,用户已经创建了超过300 万个GPT。主要GPT涵盖七大类:图像生成、写作、科学研究、编程/软件开发、教育和生产力工具。和生活。 GPT 商店取代了之前的插件商店(计划于2024 年3 月关闭)。用户不仅可以在平台上分享自己创建的GPT,还可以从其他用户那里获取各种GPT,形成丰富的GPT生态系统。 GPT 存储的定制版本可以针对特定任务和行业进行优化,使用户能够轻松使用数据库和电子邮件等外部数据。 2024 年5 月,OpenAI 更新了GPT-4o 模型,使ChatGPT 能够识别用户声音中的情绪并输出音频,创造出一种身临其境的体验,就像与真人交谈一样。
聊天机器人将逐渐演变成人工智能代理。人工智能代理是由大规模模型驱动的智能代理,具有规划、记忆、工具和行动能力。我们认为,聊天机器人的进化方向是逐步提高智能化和自动化程度,逐步减少人类的参与程度,逐步过渡到人类与AI协作的Copilot。最终形式是只需要人类的人工智能代理。初始指令和结果具有自主记忆、推理、规划、执行的全自动能力,任务执行过程中不需要人工干预。
从聊天机器人到人工智能代理的演变可能会改变移动应用生态系统。我们相信手机可以进化为AI代理,成为第一个充当AI个人助理的硬件载体。 AI私人助理会记住你生活和工作中的各种信息,比如下周的晚餐计划、工作会议等,并自动对这些信息进行整理和索引,帮助你安排约会、旅行等。例如预订、旅行预订等。点餐、播放音乐、回答问题和其他任务。在实施过程中,移动应用生态系统可能会从目前的应用商店+APP模式转变为代理商店+代理模式,手机厂商可能会发布自己的代理商店。
AI手机:AI大模型助力软硬件升级
IDC预计,2024年全球AI手机出货量预计将达到1.7亿部,同比增长233%。预计2024年之后中国AI手机份额将快速扩大,预计2024年中国市场AI手机出货量将达到4000万台,2027年将达到1.5亿台。到2027年,手机普及率将超过50%。 AI手机有望引领新一轮手机换机浪潮,其智能化、个性化的功能将鼓励更多用户升级。
据IDC统计,2024年4月7日发布的《4月手机观察:华为份额继续提升,关注P70等新机发布》显示,苹果2023年销量为2.34亿台,华泰称苹果2024年销量将比2年下降8.2%,预计销量将达到1500万台单位。据BankMyCell统计,2024年苹果手机活跃用户将达到14.6亿,对应当前兑换周期为6.23年,而根据Apple Intelligence的数据,苹果手机活跃用户将达到14.6亿。如果月份缩短,可能会刺激约1000万辆的新销量。电话。
AR/VR:看好AI大模型交互能力,智能眼镜等轻量级AR发展机会
AI大模型有望提升AR/VR交互能力,加速进入主流市场。 IDC预计,2023年全球AR/VR产品出货量预计将达到675万台,较上年下降23%。随着Apple Vision Pro的发布,AR/VR/MR出货量预计将在2024年小幅复苏。据VR Gyro (6/5/2024) 报道,随着大规模AI 模型的出现,语音助手、物体识别、生活助手等功能将增强AR/VR 设备,提高用户与虚拟现实的交互质量。环境将会改善。 Meta Ray-Ban 智能眼镜的推出出货量突破100 万台,大尺寸AI 机型的到来有望加快AR/VR 技术进入主流市场的步伐。
语音助手、物体识别、生活助手等AI功能在AR/VR产品中得到广泛应用。语音助手功能让AR眼镜能够通过上下文语义理解更自然地与用户沟通,例如,李维克Meta Lens S3通过广泛的语言模型AI系统提供聊天和建议。物体识别技术使AR眼镜能够识别现实世界中的物体,例如集成了建筑物识别和菜单翻译功能的Meta Ray-Ban智能眼镜。此外,生活助手功能与用户的社交生活深度关联,提供回复聊天、整理邮件、提供购物建议等个性化服务。这些AI能力的融合不仅提升了用户体验,也意味着AR/VR产品将变得更加智能化,为用户提供更加便捷、个性化的服务。随着技术的不断进步,未来的AR/VR设备预计将实现更复杂的多模式人工智能应用,进一步增强其作为下一代计算平台的潜力。
大模型应用#2:生产力工具的AI化有望推动新一轮PC换机周期
生产力工具、通讯工具、协作工具已经从PC时代、移动互联网时代演变,如今正在进入AI时代。微软、谷歌、金山办公等公司正在利用AI大模型提供文档理解、文本生成、图像生成、数据分析处理等原创生产能力,提升用户生产力。
Office:微软和谷歌引领全面的基于人工智能的产品矩阵
微软是生产力工具领域的全球领导者,拥有围绕企业业务和管理流程的完整产品矩阵,目前在基于人工智能的生产力工具的采用方面处于领先地位。微软的产品矩阵涵盖了企业办公、客户关系管理、资源管理、劳动力管理、低代码开发等业务环节,并通过将大规模AI模型集成到现有产品中,推出了相应的Copilot。为. 提供动力的产品。从Copilot的发布时间来看,微软首先发布了旗舰Office套件的Copilot,随后发布了用于企业业务和管理流程的Dynamics套件、开发相关的Power Platform术语,以及用于劳动力管理的Viva套件。 Copilot认为自己以“万能助手”为起点,重构微软的生产力工具矩阵,并向数据协作和功能协作的方向发展。目前,办公场景下的Copilot和办公及企业业务流程场景下的Dynamics对于单一产品都有明确的计费标准。微软的Copilot产品主要分为两个场景:移动和家庭。
关于工作场景: 1)Copilot for Microsoft 365 针对企业办公场景发布,根据微软2024 年Q3(相当于Q1 日历季度)财报显示,财富100 强企业中有近60 %正在使用它。 2)针对企业流程财务、销售、客服场景,分别推出财务/销售/服务Copilot。 3)云运维管理场景,推出Copilot for Security。 4)IT安全场景,推出Copilot for Security。 5)此外,微软还推出了Copilot Studio,支持用户定制Copilot。
家庭应用方面,1)针对C端用户办公场景推出Copilot Pro。 2) Copilot for Windows 针对Windows 11 和部分Win 10 启动,并支持通过任务栏或键盘上的Copilot 按钮快速访问。在Bing 上搜索会在Edge 浏览器中启动Copilot。
谷歌已将Gemini大型模型纳入其2B云办公套件Workspace中。 Google 对Gemini for Workspace 的功能定义如下: 1) 项目计划、建议书、简报等的创建,以及文本优化等。 2)使用简单的说明等创建项目跟踪表格。 3)形象创作。 4) 例如,在与联系人进行视频通话时创建自定义背景并提高音频和视频质量。 5) 无需代码即可创建应用程序。
金山Office WPS正在其主要产品中逐步推出WPS AI服务。 WPS AI涵盖文本、演示、PDF、表单、智能文档、智能表单、智能表单等产品,涵盖金山办公主要产品。此外,金山办公发布WPS AI企业版,推出AI Hub(智能库)、AI Docs(智能文档库)、Copilot Pro(企业智能助手)三大关键功能。
编程:人工智能支持编程开发,提高开发效率和质量。
人工智能编程工具非常相似,主要在于它们的功能,例如自动代码生成、代码分析和错误检测以及实时编程建议。 AI工具的应用极大地提高了开发效率,自动完成编写示例代码、搭建环境、调试等重复性工作,让开发者将更多的时间花在创意开发上,并能提高代码质量。 减少代码调试时间并加快开发进程。微软官网的研究数据显示,74%的开发者对自己的工作感到更加满意,88%的用户在使用AI工具辅助编程后感觉工作效率更高,96%的开发者表示工作效率有所提高。更快地执行重复性任务。
GitHub Copilot是AI编程领域最具代表性的AI工具,由OpenAI与微软合作开发。 Copilot具有强大的网络搜索和推理决策能力,可以解答开发过程中的问题。例如,通过用自然语言编写您的需求,Copilot 可以自动生成代码并提供实施建议。根据微软2024 年第三季度(相当于第一季度)财报显示,GitHub Copilot 拥有180 万付费用户,环比增长超过35%,收入增长超过45%。与上年相比。在2024 年5 月的Microsoft Build 大会上,我们将1)进一步升级GitHub Copilot,包括扩展更新以提高开发人员效率;除了编写代码之外,开发人员还花费75% 的时间跟踪工作流程和创建文档。扩展统一了所有流程,并且可以通过Neovim、JetBrains IDE、Visual Studio 和Visual Studio Code 等多个编辑器实时工作,从而减少上下文切换并允许开发人员专注于核心代码。 2)我们推出了Copilot Workspace,以提高您的团队使用GitHub管理项目时的效率,为代码更改提供清晰的可视化界面,并增强您的项目管理感觉。 3)推出Copilot连接器,方便开发者使用第三方数据和应用程序定制Copilot,提高开发效率。例如,开发人员可以使用西班牙语语音要求Copilot 用Java 编写代码或询问有关Azure 资源可用性的问题。
PC:AI PC渗透率预计2024年下半年继续提升
AI PC=边缘算力+内置大模型。目前AI PC的定义有很多,芯片厂商、PC品牌厂商、第三方组织都有自己的定义。从广义上讲,我们认为内置NPU和大模型提供边缘计算功能的处理器可以称为AI PC。纵观4月18日联想推出的AI PC系列产品,目前AI PC的主流功能有PPT智能创作、文森图、文档摘要、智能问答、AI图像识别、会议纪要等八类。智能会议克隆,可以归类为,设备调整非常好,这被认为是该公司在AI PC上的首次尝试。随着处理器升级的新一代AI PC 于2024 年底发布,我们预计AI PC 将在全球范围内得到采用。预计该速度将进一步加快。
IDC预测,全球PC出货量将稳步增长,AI PC渗透率将持续提升,到2027年将达到60%。 IDC数据显示,2023年全球PC出货量约为2.5亿台,其中人工智能PC出货量为2500万台,约占2024年全球PC出货量的10%。人工智能PC出货量市场份额约为19%,但到2027年全球PC出货量预计将达到2.93亿台,届时人工智能PC市场份额预计将达到60%。
NPU和独立GPU方案很可能会在AI PC下长期共存。人工智能应用的实施将增加对PC计算能力的要求。高通、英特尔、AMD等芯片厂商纷纷推出芯片产品,宣布针对AI PC场景优化的布局。在PC端,使用独立的GPU来运行AI负载,提供高性能和高吞吐量的好处,但代价是更高的功耗。尽管NPU解决方案具有高能效和低功耗的特点,但它们也有局限性。支持高性能AI负载。考虑到不同的AI任务需求和用户偏好,AI PC市场分为1)CPU+NPU+GPU处理器(如Intel Meteor Lake/AMD 8040)2)CPU+独立GPU。 +NPU+GPU处理器+独立GPU和其他组合可能会长期共存,作为处理AI工作负载的主要计算能力架构解决方案。 IDC数据显示,2022年ARM架构CPU将占据PC市场约11%的份额,其中苹果是领先厂商。 2023年10月,高通推出了基于ARM架构的X Elite芯片,具有卓越的AI性能。这符合AI PC的发展趋势,有望进一步推进ARM CPU在PC市场的发展。在2024 年6 月的COMPUTEX 2024 上,ARM 首席执行官Rene Haas 表示,Arm 预计将在五年内占领超过50% 的Windows PC 市场。
AI PC正在推动存储规格升级,最低DRAM为16GB,LPDDR比例可能会逐渐增加。 1)阿里巴巴统一千文7B模型的原始大小为14.4GB,但目前在联想AI上运行的模型被压缩为4GB。所以运行一个大型的AI模型+计算机自身的缓存需要5-6GB的内存,而操作系统本身也需要5-6GB的内存,所以以后不会稳定,最少需要16GB的内存。需要确保运行。操作电脑。 2)根据Trendforce的数据,LPDDR5x为7500-8533Mbps,相比高通骁龙4800-5600Mbps,对于需要接受更多语言指令并缩短响应速度的AI PC很有用。今年PC DRAM需求的30-35%是LPDDR,未来将得到AI PC CPU厂商的规格支持,因此LPDDR的进口比例将会增加。
硬件级安全芯片确保您的隐私和安全。根据联想与IDC联合发布的《AI PC产业(中国)白皮书》,AI PC包括设备级个人数据和隐私安全保护,以及针对本地个人数据安全域和隐私问题的本地闭环推理,你需要一个个性化的、本地的。知识库。还可以部署硬件级安全芯片,以确保只有授权的程序和操作才能在硬件级读取和处理私有数据。此外,联想等厂商也在开发自己的AI芯片,实现智能用电,其中联想的四款新笔记本Y7000P、Y9000P、Y9000X、Y9000K均搭载了AI芯片——LA系列芯片。跨机器的消耗分布。
大模型应用#3:AI大模型推动具身智能技术加速迭代
Embodied AI是人工智能的一个领域,典型应用是自动驾驶汽车和机器人。具身智能一般是指具有实体身体、能够自主与外部环境交互的AI智能载体。与人类自主性类似,通过五种感官(感知)、大脑(计划和决策)、小脑(运动控制)完成一系列动作,具身智能的活动一般都是基于“我在”。通过感知和理解与物理世界的交互而获得的信息使得能够(2)自主推理和决策,以及(3)通过采取相应的行动来进行交互。目前,具有大规模落地场景的典型体现智能应用包括自动驾驶和机器人,其中最突出的产品包括特斯拉的FSD自动驾驶系统和Optimus人形机器人。
在过去的一年里,大规模人工智能模型支持了感知、决策和实体智能其他方面的技术进步。前面提到,具身智能算法一般包括感知模型(感知识别环境信息并预测环境变化)、规划/决策模型(根据感知结果做出任务决策),并且又可分为控制/执行模型。 (将决策从指令转变为行动)。我们以行业领头羊特斯拉的发展为例,观察过去一年大规模AI模型的应用所带来的对实体智能技术的推动。
自动驾驶:受益于大规模AI模型的发展,快速迭代感知和决策层。 (1)感知层:传统的自动驾驶感知技术主要是“2D直视+CNN”,侧重于识别周围障碍物,效率和准确性较低。特斯拉于2022 年10 月宣布的大规模占用网络模型(基于BEV+Transformer 的扩展),计算物体的空间体积占用情况,以获得更连续稳定的感知结果,构建具有空间的4D“实时地图”。和时机。这有助于解决障碍物在未被识别的情况下消失的问题。同时,以车辆为中心坐标系构建地图,更好地融合了识别和预测框架。 (2)决策层:解决长尾瓶颈问题,因为之前的决策算法都是基于预设的基于规则的规则,在不同场景下触发行为代码。特斯拉的决策算法采用了交互式搜索模型,在该模型中,机器独立预测个体在周围环境中交互的轨迹,评估每次交互带来的风险,最终可以逐步决定采取什么策略来加速加快进程。实现更灵活、更人性化的决策行为。 (3)控制层:由于汽车自由度较低,自动驾驶控制算法主要根据决策模型输出指令,控制线控底盘的转向和制动。正在驾驶一辆车。现在,特斯拉FSD V12已经全面过渡到端到端架构(从感知到控制的大规模模型),并开始推动商业落地。虽然只有2000多行代码,但V11版本完全抛弃了工程师编写的超过30万行C++代码。
人形机器人:这在技术上比自动驾驶困难得多,运动控制算法可能是关键之一。 (1)感知层:仿人机器人的外部感知(获取外部环境信息)主要是视觉、听觉和触觉,内部感知(获取自身状态信息)主要是身体状态和姿势控制。 Tesla FSD的视觉识别占用网络可以在机器人中重复使用,有助于加速机器人多模态识别的发展。 (2)决策层:LLM/VLM/VLA等通用大规模模型的使用不断发展和扩展,将提高机器人的语义和视觉理解能力、问题和任务分解和推理能力。它会帮助你进步。 (3)控制层:机器人,特别是仿人机器人,具有很高的自由度,可以用灵巧的双手或机械臂执行一系列复杂的任务,需要控制直立行走、奔跑、跳跃等动作。较强的逻辑推理能力。然而,一些运动控制算法仍处于发展早期阶段,指令生成速度较慢,这也是机器人发展亟待取得进展的关键之一。特斯拉的人形机器人在2022 年10 月还只能缓慢行走和挥手,但到2023 年12 月它已经能够平稳行走并抓取鸡蛋等物品,我们发现运动控制功能的迭代正在加速。
NVIDIA 正在打造三大计算平台,以加速实体智能的发展。 NVIDIA 创始人兼首席执行官黄仁勋在2024 年GTC 大会上表示,“机器人时代正在加速,所有移动物体有一天都将变得自主”,“我们致力于加速实现生成式物理人工智能”。智力。 ”。NVIDIA还升级了Isaac机器人平台,从训练、模拟、推理三个方面支持机器人行业的发展。在自动驾驶方面,NVIDIA还公布了Drive平台。
1)训练平台:用于训练机器人的基本模型。这包括NVIDIA推出的人形机器人通用模型“Project GR00T”,以及VLM/LLM等其他主流生成式AI通用基础模型,基于感知、决策、学习等方面包括训练和强化学习。你可以控制它。
2)仿真平台:机器人仿真平台Isaac SIM是基于Omniverse构建的。在数字孪生环境中,通过获取在真实环境中难以获取的数据,可以获得与真实环境中相同的开发和测试效果,例如加快开发进程、降低开发成本。
3)终端平台。机器人本体不仅构建在低功耗、高性能的嵌入式计算平台上,还通过应用部署人工智能算法进行感知、决策和规划。例如,NVIDIA发布的Jetson Thor SoC片上系统开发硬件包括下一代Blackwell GPU(NVIDIA此前发布了汽车用的DRIVE Thor套件),拥有100GB/GB的带宽和800TFLOPS的AI。计算性能。
优必选持续迭代Walker-X的推出,加速人形机器人在中国的商业化进程。优必选是中国最早开始研究人形机器人的公司之一。 1)2016年,我们开始开发人形机器人,并发布了可以全方位行走的步行器原型。 2)2017年至2018年,我们推出了第一代大型双足人形服务机器人Walker1。下楼梯、追球、踢球、感知和躲避障碍物、拟人舞蹈、人机交互等等。 3)2019年至2021年,推出第二代Walker,并于2019年春节亮相。 4)2021年,机器人高度为1.30米,重量为63公斤,行走速度为3公里/小时。控制、手眼协调、流畅的物理交互、U-SLAM视觉导航、智能家居控制、多模态情感交互、人类同理心表达环境和人体意识等特征。 5)2022年起,沃克
自动驾驶和仿人机器人是具身智能最具代表性、最流行、最有前景的应用。展望未来,我们预计高端自动驾驶将逐步开始规模化落地,但人形机器人将受到成本和算法成熟度的限制。
度落地尚需等待。自动驾驶:特斯拉于2024年3月已推出FSD V12.3版本,正式更名为FSD Supervised,采用业内首个端到端大模型,并在北美大范围推送免费试用服务。国内随着大模型技术进步、传感器成本的下降,2024年小鹏、华为、理想等在全国多城市开始推送城市NOA高阶智驾,小米、比亚迪、蔚来等也积极布局高阶智能驾驶,行业迎来快速发展。机器人方面,垂直类场景机器人如无人运送机、扫地机器人、工厂机械臂等在加速渗透,但通用型人形机器人由于其多模态感知、高精准运控、以及对泛化和涌现能力等要求高,受限于软件难度和硬件高成本压力,或尚难以在短期内实现快速降本及大规模应用。特斯拉研发的Optimus人形机器人作为行业内关注度极高的机器人产品,我们预计将首先量产应用于工厂和仓库,从事较为清晰可控的拣选搬运工作,未来才会逐渐迭代扩大应用场景。
大模型应用#4:大模型是推动云计算发展的“锚”
我们认为AI大模型是云计算业务的“锚”,云厂商以大模型为重要底座,推动云计算业务向MaaS转型。MaaS是大模型厂商重要的商业模式,提供包括算力、模型、数据工具、开发工具等多种服务。目前已有多家科技巨头将大模型能力部署在云端,或以私有化部署方式提供给企业用户,以模型API调用费、模型托管服务费、按项目收费的定制化解决方案等形式获得收入。海外,微软推出了Azure OpenAI,谷歌推出了Vertex AI,英伟达推出了AI Foundations;国内,阿里、百度、字节跳动、腾讯等公司均推出了基于自有云服务的MaaS模式,商汤等公司也推出了基于自有AIDC和大模型能力的MaaS服务。其中,大模型的来源包括厂商自身训练的闭源模型和开源模型,以及第三方开源模型。以微软Azure为例,用户可选择OpenAI的闭源模型,微软自己的开源模型Phi系列,以及Llama等第三方开源模型。
AI开始拉动云计算收入增长。以微软为例,从2Q23到1Q24的四个季度,AI分别贡献Azure及其他云服务收入增速的1%/3%/6%/7%。谷歌在4Q23、1Q24业绩会上表示,AI对谷歌云的贡献不断提升,对垂直整合的AI产品组合的需求强劲,这为谷歌云在每个产品领域创造新的机会。亚马逊在1Q24业绩会上表示,基础设施建设与AWS AI功能正在重新加速AWS的增长率。生成式AI和模型训练需求驱动,AI收入占百度AI智能云收入在4Q23/1Q24 分别达到4.8%/6.9%,其中大部分收入来自模型训练,但来自模型推理的收入快速增长。
大模型降价吸引客户上云。2024年5月,字节、阿里云、百度、科大讯飞和腾讯相继宣布降价策略,调低面向B端市场的大模型API调用费用。我们认为大模型API降价得益于算力芯片性能的提升与推理部署的优化,其目的在于吸引客户使用公有云,购买云厂商的计算、存储、网络和安全等基础产品。
大模型应用#5:大模型赋能搜索和广告等互联网传统业务
搜索、广告是互联网厂商的代表性传统业务,AI大模型赋能业务效果提升。我们看到AI从算法优化广告推送机制、广告内容生成2方面助力互联网公司广告业务。微软推出Copilot in Bing,Google发布生成式搜索体验(SearchGenerative Experience,SGE),提供更精准、更个性、更智能的搜索结果。其中,微软Bing借力GPT模型能力,市场份额有所提升。
广告:AI算法优化推送机制,生成式AI实现自动化广告制作
AI技术通过算法优化推送机制,提高用户流量与广告转化率。根据Meta Ads公司官网数据,推出Reels短视频后,得益于人工智能驱动的发现引擎,推送内容与用户偏好更加贴合,Instagram用户的平均使用时间增加了24%,超过40%的广告主选择投递Reels形式的广告。Google应用 AI技术改进Lens视觉搜索以及图片文本跨模态多重搜索,Lens 21-23年用户增长四倍,月使用数达到120亿次。
机器学习算法匹配广告和最相关受众,提高广告转化率。Meta Ads引入类似受众和细分定位功能,计算最佳受众群体扩大方式来优化转化量和改善广告表现。类似受众功能通过一系列指标,如过去购买过同类商品、访问过广告主的网站等来挑选最有可能转化的潜在用户进行广告推送。根据Meta官网数据,该工具令单次增量转化费用中值降低 37%。Google使用AI驱动的竞价系统,通过排序最大点击次数出价在整个营销漏斗中进行优化,以推动用户对目标网站的访问等购买意向性行为,并统计广告转化数据,生成归因报告,向广告主推荐值得出价的高效指标。
生成式AI实现自动化广告制作,提高广告创意表现与营销效果。
1)Meta Ads推出内置免费AI广告创作工具Advantage+ Creative,实现广告简化生成与标准美化,助力提高广告创意表现与营销效果。Advantage+ Creative细分功能包含文本衍生、背景生成、智能扩图、风格化制作等,广告主只需提供广告创意和业务受众,AI即可创建多个版本的广告,并挑选出最有可能得到目标受众响应的版本。它也可对广告进行细微改进——比如调整亮度、宽高比和文本布局。Advantage+ Creative有效地降低广告主投入的时间与成本,并提升广告表现。根据Meta官网调查数据,采用Advantage+ Creative的广告主所获得的广告支出回报率(ROAS)提高了32%,其中77%的广告主表示每周得以节约数小时的时间。
2)Google利用人工智能,根据查询上下文即时优化搜索广告,并通过机器学习算法增强广告视觉呈现效果。借助生成式AI技术,Performance Max可以大幅简化广告主的广告制作流程,根据广告主提供的产品网址自动填充广告文本与生成广告图片。此外,当目标受众使用搜索引擎时,Google利用自动创建素材技术优化搜索广告(ACA),重组现有广告生成更贴合查询内容的新标题与图文。广告系列Demand Gen亦能通过机器学习算法将最佳视频和图片素材资源集成到视觉效果最强的接触点中,避免遮挡,帮助广告主在最具沉浸感的视觉界面上吸引更多消费者。根据Google 2022年中期报数据,采用Performance Max使得广告主获得转化客户的成本下降,单次操作费用(CPA)中值减少17.3%;在支付同等费用情况下,广告转化次数增长了18%。
搜索:引入大模型后,Bing份额提升
谷歌:从理解式AI到生成式AI,搜索引擎巨头广泛应用人工智能技术。谷歌享有搜索市场大部分份额,早期对人工智能技术的应用主要以理解式AI为主。根据StatCounter统计结果,2015年至今谷歌在PC与移动端综合搜索量的市占率均超过90%。机器学习在谷歌产品中的第一个应用是2001年的拼写纠正系统,帮助忽略人们搜索内容的拼写错误而得到正确结果。随后谷歌于2019年使用BERT进行检索句子整体拼读以优化搜索排名系统,并开发能力优于BERT 1000倍的多模态、多线程统一大语言模型MUM,以理解和组织网页内容。
随着搜索总量的增加和用户需求的多元化,有效率、高质量的多模态交互搜索成为发展趋势。谷歌于2023年开始启动搜索生成式体验(SGE)实验,以生成式AI大模型Gemini为基础,自动生成搜索内容摘要并进行垂类推荐等算法优化。AI Overviews是SGE的升级版,在5月的2024 GoogleI/O开发者大会上作为“25年间最大更新”发布,与谷歌核心网络排名系统集成,旨在保证搜索准确性,仅显示由高质量网页信息支持的结果。AI Overviews继承了SGE的内容摘要生成能力,支持视频搜索,具有一次搜索解决系列问题的多步骤推理功能和集成谷歌文档邮箱的规划功能。该产品推出两周后受到广泛质疑,谷歌实行改进,但据企业SEO平台BrightEdge于同年6月的调查数据,谷歌淡化了这一功能,AI overviews在搜索中的出现频率已于初始的84%降至约15%。
微软Bing引入GPT模型能力开启生成式Web搜索新体验,市场份额提升。2023年2月,微软为旗下搜索引擎Bing配置AI增强型Web搜索体验助手New Bing,根据3月必应博客文章,预览版助手推出4周时间内日活用户即超过1亿,其中约1/3用户是第一次使用微软的搜索引擎。同年11月,微软将New Bing更名为Copilot。Copilot基于GPT-4和DALL-E,通过汇总Web搜索结果形成摘要和链接列表,并提供聊天体验来支持用户,优势包括:1)具备自然语言理解能力与多模态搜索和生成能力;2)以连续提问模式替代多次独立搜索;3)内置于微软浏览器网页边栏,同步化搜索与网页浏览过程;4)开发多平台延展,连接Web搜索和不同终端,如Skype、office365、GroupMe等。Copilot带来的搜索引擎流量增长数据亮眼,微软FY2Q24(4Q23)业绩会上表示,Bing的市场份额超过雅虎搜索,升至3.4%,由Copilot支持的搜索对话累计达50亿次,公司该季度搜索与广告收入同比增长近10%。根据StatCounter数据,Bing在搜索引擎中的市场份额已经由23年2月的2.8%提升至24年1月的3.4%。
#以上关于【研究】大模型应用场景分类与硬件升级的相关内容来源网络仅供参考,相关信息请以官方公告为准!
原创文章,作者:CSDN,如若转载,请注明出处:https://www.sudun.com/ask/92022.html