6)提示:“这是一张长曝光照片,拍摄于星光灿烂的夜空中,银河位于魔幻时刻的海滩上方。在光绘摄影中,银河明亮而突出,在深蓝黑色的氛围中,可以看到许多星星,色彩生动大胆。使用专业相机拍摄,对比度高,构图风格为电影风格。”(A long exposure photo of the Milky Way in a starry night sky, centered over an ocean beach at magic hour. The milky way is bright and prominent with many stars visible against a dark blue black atmosphere in light painting photography with vivid and bold colors. Shot on a professional camera with high contrast and a cinematic composition in the style.)
Google 的最新图像生成模型,Imagen 3,目前尚未对外开放。如果您对此感兴趣,可以通过以下链接加入等待名单,
申请体验使用权限:https://aitestkitchen.withgoogle.com/tools/video-fx
音频模型
1)类似GPT-4o实时对话+视频聊天:Google Project Astra
两段演示视频,这展示了 Google DeepMind 对未来 AI 智能体的设想。每段视频均为单次拍摄、实时录制完成。
另一个 Google Project Astra 演示,陪你一起看 Google I/O 直播并为你解说。效果挺不错的,能完整的介绍会议的内容,还能回过去看之前发生的事情,说明有“记忆”能力。美中不足是机器感太足,缺少一点情感,另外响应时间要稍微长一点,对比一下 GPT-4o 就能发现其中差距。
没有对比就没有伤害。不得不说 OpenAI 真是坏,看完 GPT-4o 的演示再看 Google 的,一下子就黯淡无光了,如果没有 GPT-4o 的演示其实还不错的。
2)音乐合作的极致伙伴 :Music AI Sandbox
“Music AI Sandbox”是由Google DeepMind与YouTube联合推出的一套创新工具集,旨在为音乐创作者提供全新的音乐制作方式。这些工具利用最先进的人工智能技术,帮助音乐家从作曲、编曲到最终制作等各个环节,以创新的方式优化和加速音乐创作过程。
无论是专业音乐制作人还是业余爱好者,都可以通过这些工具探索音乐的新领域,并将自己的创意实现转化为现实。
我们正与音乐家、作曲家及制作人合作,共同探索人工智能在音乐创作过程中的潜在魅力。
Wyclef Jean、Justin Tranter 和 Marc Rebillet 是首批利用 Music AI Sandbox 发布新作品的艺术家,现在你可以在他们的 YouTube 频道上欣赏到这些作品。
视频模型
Veo 是由 Google DeepMind 开发的迄今为止最先进的视频生成模型。它能够生成超过一分钟、高达1080p分辨率的高质量视频,展示多种电影和视觉风格。
这个模型具有从单一提示出发,或者通过一系列叙述性的提示,制作并延长至60秒以上的视频片段的能力。这一功能为电影制作人和内容创作者提供了探索新的叙事技巧和视觉表现形式的可能,推动了传统视频制作的界限。
下面这段视频是Veo直接输出的未经编辑原始片段,是根据以下提示制作的:
在一个充满霓虹灯、飞行汽车和雾气的繁忙反乌托邦城市中快速穿梭,场景设定在夜晚,配有镜头光晕和体积光。
在一个布满明亮霓虹灯、天空中飞舞星舰的未来派反乌托邦城市中快速穿梭,场景同样设定在夜
晚,并有体积光效。
一辆以光速行驶的汽车的霓虹全息影像,电影级的惊人细节和体积光效。汽车驶出隧道,重返现实世界的香港城市
看起来和初代的 Sora 至少还有 半代 的距离
想体验 Google 的文本生成视频模型Veo,可以申请加入 google labs 的候补名单,试用他们的实验工具 VideoFX 中的一些 Veo 功能。
申请地址 → https://aitestkitchen.withgoogle.com/tools/video-fx
AI时代的Google搜索引擎
Google搜索即将引入一项革命性的多步骤推理功能,这是对其核心产品进行的一次重大改进。在最新的演示中,我们可以看到谷歌如何利用先进的人工智能技术,几乎完全重构了谷歌搜索的产品形态。