金磊 发自 凹非寺
量子位 | 公众号 qbitai
翻车,大翻车。
就在今天凌晨,谷歌版her——gemini live正式发布。
毕竟明显是对标openai家的gpt-4o,可以说是吸足了科技圈的眼球。
在金沙娱场城app官网发布的demo中,拍照问答功能的效果是这样的:
它大致实现的功能,是用手机拍摄演唱会的海报,并让gemini查看用户的日历,看看行程是否适合参加。
以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。
然而……当来到发布会现场演示环节的时候,画风却180°大变样。
请看vcr:
嗯……小哥表情,肉眼可见的有点慌。
就连知名科技媒体techcrunch都配上了这样的emoji:
甚至还有网友开启了辣评模式:
我10秒钟就能搜索我的日历。
当然,这只是今天made by google的一个小插曲。
关于gemini live的更多内容,我们继续往下看。
谷歌版her的全貌
正如我们刚才提到的,gemini live和gpt-4o的功能十分相似。
除了“拍照问答”之外,它也可以做到实时对话,甚至在gemini回复过程中进行打断。
据了解,目前gemini live的功能已经在安卓系统中向advanced订阅者开放(仅限英语)。
未来几周,这个功能会陆续扩展到更多语言并且向ios开放。
在对话声音方面,gemini live推出了10种新的声音供选择,效果是这样的:
在操作方面,由于gemini已经完全集成到了系统中,所以只需长按电源按钮或说“hey google”,就可以调用了。
例如在写邮件的过程中,让gemini帮你生成配图,效果如下:
不过对于这项功能,外媒们的评价却是褒贬不一。
例如the verge的一位作者在亲测后给出的标题是——
gemini live比google快,但更尴尬。
具体原因是作者在一次为期三天的公路旅行中,汽车的音频系统突然失效。
使用原先的谷歌助手寻找金沙娱场城app的解决方案花费了至少五分钟,而gemini live仅耗时15秒。
但对话过程中的gemini live的持续发言和需要用户主动打断的交互方式,却让作者感到尴尬。
他认为:
声音和说话方式过于人性化,以至于在打断它时感到不自在。
与gemini live的互动中投入了更多情感,而不是将其作为解决问题的工具。
无独有偶,对于gemini live在云端运行这个点,华尔街日报也给出了犀利的评价——
对话上的进步,功能上的退步。
具体到技术层面,gpt-4o是一个端到端的系统,但从谷歌发布的内容来看,gemini live则并非如此。
而是将stt、vad、llm和tts系统做了集成:
除此之外,谷歌所发布的新pixel系列手机中,也出现了gemini live的身影。
包括pixel 9 pro fold、pixel 9、pixel 9 pro和pixel 9 pro xl。
ai功能方面,谷歌的pixel手机在拍照上增加了一个叫“add me”的功能。
可以用增强现实(ar)和ai技术,可以把两张不同照片中的人物“塞”到一起。
谷歌为什么追不上openai?
虽然谷歌这次发布gemini live,算是对openai gpt-4o的一种应战,但自从大模型时代拉开序幕以来,我们可以看到一个非常明显的一种趋势——
谷歌,跟不上openai的脚步。
首先是在最为关键的chatgpt发布的这个节点上,openai成为了开拓者,但谷歌随后发布的bard,和这次gemini live很相似,后续出现了翻车情况。
而后近一年半多的时间来,似乎所有重磅模型、重磅应用的发布,都是openai在引领。
反观谷歌这边,不仅是技术呈现出步步慢的状态;甚至在舆论上,还出现了被openai用一个人事变动(ilya离职)消息盖过谷歌年度最大活动(i/o大会)热度的情况。
那么谷歌在大模型时代为什么不行了?
对此,前谷歌ceoeric schmidt(2001年至2011年任职)在斯坦福最新的演讲中表达了他的观点:
谷歌非常重视工作与生活的平衡,例如允许员工居家办公。
但创业公司,他们工作真的很拼。
甚至还有网友爆料称:
我兄弟是谷歌顶级ai程序员,他有3个全职工作,每天只在谷歌这边花2个小时。
那么你对此怎么看,欢迎在评论区留言讨论。
参考链接:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1g6xrq7vo0anjjwg
[2]https://x.com/googledeepmind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1g6xrq7vo0anjjwg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones
— 完—
量子位年度ai主题策划正在征集中!
欢迎投稿专题一千零一个ai应用,365行ai落地方案
或与我们分享你在寻找的ai产品,或发现的ai新动向
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
2024-08-14
2024-08-23
2024-01-11
2023-02-13
2023-02-11
2024-08-24
2024-08-25
2024-08-25
2024-08-25
2024-08-24
2024-08-25
2024-08-25
2024-08-25
2024-08-25
2024-08-25
金沙娱场城app copyright © 2024 金沙娱场城app-老版金沙app下载客户手机端 北京智识时代科技有限公司 金沙娱场城app的版权所有