2025谷歌开发者大会有哪些值得关注的内容?
Alphabet(GOOGL.O)谷歌年度最盛大的开发者大会Google I/O 2025于本周二和周三在加州山景城的海岸线圆形剧场举行。这是展示其全产品线发布动态的舞台,涵盖安卓、Chrome、谷歌搜索、YouTube,以及当然不可或缺的AI聊天机器人Gemini等众多领域。
谷歌还专门为安卓更新举办了一场独立活动。公司宣布了多项新功能,包括寻找遗失安卓手机和其他物品的新方式、Advanced Protection高级保护计划新增的设备级安全功能、防诈骗防盗的安全工具,以及全新设计语言Material 3 Expressive。
以下是Google I/O 2025公布的重磅内容:
Gemini Ultra
Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务“最高级别的访问权限”,月费为249.99美元。套餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的Deep Think模式。
订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用Gemini聊天机器人、基于Project Mariner技术的多项“智能代理”工具、YouTube Premium和Google Drive、Photos、Gmail的30TB存储空间。
Gemini 2.5 Pro的Deep Think模式
Deep Think是Gemini 2.5 Pro模型的一种“增强型推理模式”,可在回答前综合多个答案,提高模型在某些基准测试中的表现。
谷歌尚未详细介绍其具体原理,但其可能类似于OpenAI的o1-pro或即将推出的o3-pro,具备搜索和整合最佳解决方案的能力。
Deep Think目前通过Gemini API向“受信测试者”开放。谷歌表示将在更广泛推出前进行额外的安全评估。
Veo 3视频生成AI
谷歌称,Veo 3可生成音效、背景噪音,甚至是配音对白。画质方面也优于前代Veo 2。
Veo 3将从周二起上线Gemini聊天机器人应用,仅向Gemini Ultra订阅用户开放,可通过文字或图像提示生成视频内容。
Imagen 4图像生成AI
Imagen 4的速度比Imagen 3更快,未来还将发布比Imagen 3快十倍的版本。它能够生成布料、水珠、动物毛发等“精细细节”,支持写实与抽象风格,图像可达2K分辨率,多种尺寸比例。
Veo 3和Imagen 4都将为视频创作工具Flow提供核心支持。
Gemini应用更新
谷歌宣布Gemini系列应用月活跃用户数突破4亿。
Gemini Live将在本周向所有iOS和安卓用户开放摄像头与屏幕共享功能,借助Project Astra技术,用户可以与AI实现近实时语音互动,并实时共享手机画面。
未来数周,Gemini Live还将与谷歌生态其他应用深入整合,例如调用Google地图导航、创建日历事件、管理任务清单等。
此外,Deep Research功能升级,用户现在可上传私有PDF和图片生成研究报告。
Stitch
Stitch是一款AI工具,可用于设计网页和移动应用前端,用户只需几句话或一张图片,即可生成UI元素及HTML和CSS代码。
尽管Stitch的功能较部分“可视化编程”工具略有限制,但它提供了较高的自定义空间。
同时,谷歌扩大了开发者AI助手Jules的使用范围,Jules能帮助理解复杂代码、在GitHub上创建Pull Request、处理代码积压任务等。
Project Mariner
Project Mariner是谷歌的实验性AI代理,可代用户访问和操作网页。其现已更新,支持同时处理近十项任务,开始面向部分用户开放。
例如,用户无需打开第三方网站,只需与AI聊天即可完成购票或在线购物等任务。
Project Astra
Project Astra是由Google DeepMind推出的低延迟多模态AI项目,将为搜索、Gemini应用及第三方产品提供支持。谷歌也正与三星、Warby Parker等公司合作开发Project Astra眼镜,但尚未公布发布日期。
AI Mode
谷歌正在美国推出AI Mode —— 一种实验性的搜索功能,支持用户通过AI接口提出复杂的多段式问题。
AI Mode能处理涉及体育与金融的复杂数据查询,还提供服饰“试穿”功能。今夏晚些时候上线的Search Live将结合手机摄像头的实时画面支持基于视觉的搜索提问。
Gmail是首款支持个性化语境处理的应用。
Beam 3D视频会议
Beam(原名Starline)结合六摄像头阵列与定制光场显示器,让远程会议仿若面对面。其AI模型将不同角度的视频流合成为3D渲染图像。
Beam实现毫米级头部追踪与60帧/秒的视频流传输,结合Google Meet使用时,还可提供AI实时语音翻译,并保留原说话人的音色、语调与表情。
Google Meet本身也将支持实时语音翻译功能。
更多AI更新
Gemini将整合进Chrome浏览器,作为全新AI浏览助手,帮助用户快速理解页面内容并完成任务。
Gemma 3n是为手机、笔记本、平板优化的AI模型,周二起开启预览,支持音频、文本、图像与视频处理。
谷歌还为Gmail、Docs和Vids带来大量AI办公更新。Gmail将新增个性化智能回复与收件箱清理功能,Vids增强了内容创建与编辑功能。
NotebookLM将新增视频概览功能,同时谷歌上线了SynthID Detector —— 一个基于SynthID水印技术的AI内容识别平台。音乐生成模型Lyria RealTime也将通过API开放使用。
Wear OS 6
Wear OS 6引入统一字体,提升界面一致性;Pixel Watch将支持主题色同步,增强动态美感。
新设计平台将帮助开发者构建更丰富的个性化应用,并实现无缝的界面过渡。谷歌将提供开发者设计指南及Figma模板文件。
Google Play
谷歌为安卓开发者在Play商店新增多项工具,包括订阅管理、内容预览(如音频片段)、更流畅的支付流程等。
美国用户可访问“主题浏览”页面,快速发现与影视作品相关的应用。开发者还将获得专属的测试与发布页面及应用发布监控工具。遇到严重问题时,开发者可暂停应用发布。
订阅工具也获升级,支持多产品结账。开发者可在主订阅下销售附加服务,实现统一结账。
安卓Studio
安卓Studio将集成多项新AI功能,包括配合Gemini 2.5 Pro的“Journeys”(AI开发代理流程)与“Agent Mode”自动化开发功能。
此外,App Quality Insights面板的“崩溃洞察”功能也将由Gemini提供支持,帮助分析源码、定位崩溃原因并提供修复建议。
(责任编辑:时讯)
-
可能是我当过老师,其实当老师的人很多,但是能讲、会讲的,真不多。...[详细]
-
SphereX mainnet officially launched, creating the ultimate DeFi product with Robin Hood spirit
后来对方看他实在可怜,就说看你挺诚心,先拿几百万尝试一下。...[详细]
-
所以做汽车相关的事业,就得抓住核心,管它是汽油还是电动,必须要紧抓汽车的发明就是为了让人类拥有更快的速度,速度是其本质。...[详细]
-
第一届超会议吸引了9万多人来到现场,347万人观看直播,2016年举办的超会议吸引了15万人到达现场。...[详细]
-
(2)对广告主来说,投放软文不好选择了,但选择非新闻源站也有机会进行优质展示了...[详细]
-
各位,看出这里面的门道了吗? 这意味着,百度抛弃掉新闻源机制(至于有多大影响,我们稍后再说),又重新构建了一套新的机制,把鸡蛋从一个要“破掉”的旧筐子拿到了新框里,更狠的是,...[详细]
-
2012年我们第一次举办niconico超会议,如今回想起来,对当时的Dwango来说,超会议是必要手段。...[详细]
-
一旦你有了,你就需要产生社交媒体内容。...[详细]
-
将注意力引导到特定元素 留白让留白所包围的元素显得更加突出,如果你想让某个元素从整个设计中脱颖而出,用留白来突出它是最直接的办法。...[详细]
-
”周迪告诉邦哥,“大鱼计划”的分成较高,以“大鱼奖金”为例,至少会让2000个创作者每个月拿到1万块钱。...[详细]