谷歌母公司Alphabet(GOOGL.US)晓谕,将面向付用度户灵通"相片转视频"功能MK体育,这项岁首仅限小畛域测试的东谈主工智能器具现认真登陆Gemini东谈主工智能助手。
该公司声明称,自周四起,特定地区订阅Google AI Ultra和Pro筹办的用户可通过Gemini网页版使用该功能,迁移端诳骗将在本周内连接推送更新。
这项新功能允许用户基于单张相片及文本描绘,生成带声息的8秒短视频。生成的MP4设施视频辞别率为720p,接受16:9横向画幅。
这次更新使该功能平直集成至Gemini聊天界面,记号着谷歌在AI视频畛域与好意思国竞争敌手OpenAI、Runway AI Inc.保捏同步。大家市集竞争相同热烈:中国阿里巴巴集团、AI初创企业Manus和快手科技曩昔数月均发布了升级版视频器具。
该功能由谷歌五月在开导者大会发布的最新一代视频生成模子Veo 3运行,此前仅限通过孤立付费影视器具Flow使用。
谷歌强调已接受"进攻后台措施确保视频生成允洽要领",举例不容使用公世东谈主物(包括名东谈主、政要及闻名企业家)图像生成视频,其策略同期不容挑动危急行径、暴力或群体挫折的骨子。
但测试涌现时刻仍存颓势。媒体在Gemini网页版实测中发现:上传个东谈主相片条件生成东谈主物讲话视频时,输出截止屡次变嫌面部特征以致东谈主种;天然能告捷收场"植物随风舞动"或"静态猫片讲话"等浅显教导,但对"相片东谈主物跳轰隆舞"等复杂条件,仅生成东谈主物挥手画面。
谷歌发言东谈主就测试截止恢复称,AI模子并无修改东谈主物外貌的设定教导,相片转视频及面部动画仍属新时刻,可能基于单张图像生成与原始骨子不符的截止。
该模子更擅长活化其他场景,如平时物品动画化、画作动态化及天然相片增通达恶果,公司将在后续更新中捏续矫正包括面部动画在内的各项功能。
株连裁剪:于健 SF069MK体育