复制成功

分享至

主页 > 数字货币 >

即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

2024.04.09

文章来源:不客观实验室


图片来源:由无界AI生成 图片来源:由无界AI生成

作者|陆

邮箱|xiaoyu@pingwest.com


上个月,彭博社消息称苹果正在与 Google 进行谈判,希望将 Gemini 集成的 iPhone 当中,为 iPhone 的软件提供 AI 相关的新功能。把新系统的核心功能“外包”给第三方,这种做法非常不苹果。

其实苹果自己也在 AI 上做了不少投入,比如在消息传出的同期,苹果发布了自研 MM1大模型论文,这是一个最高拥有30B 规模的多模态 LLM,但苹果迟迟没有公布公测时间,也没有对外宣布任何上线计划。据知情人士接触到苹果内部团队后了解,团队认为自家的大模型与主流的 GPT4、Gemini 相比“不具备竞争力”,才开始寻找第三方合作商。

或许在6月即将举行的 WWDC 2024上,苹果会公开自研模型的进展与第三方厂商的合作计划,毕竟届时需要对所有用户和开发者展示 iOS 18的核心卖点。而 iOS 18被苹果内部誉为史上升级最大的一个操作系统版本的原因,就是苹果宣称 iOS 18上的 Siri 将会真正的成为用户的“私人助理”。

如果该合作确认落地,那由于合规问题,苹果需要在国内找一家公司进行合作,而不是直接使用 Gemini。

据了解,苹果此前曾三家公司洽谈合作 AI 大模型,其分别有百度的文心一言、阿里的通义千问、月之暗面的 Kimi,但目前概率最大的还是百度,毕竟在三星最新一代的 S24 系列产品上,大陆以外发售地区的 AI 合作方也是 Gemini,而大陆则是以百度、美图为首的一众中国大模型公司。


Gemini 在手机上能做什么?


为了了解目前 Google 在手机上能够实现哪些AI功能,我们找到了一台 Google Pixel 8 Pro,这是 Google 目前唯一能够运行 Gemini Nano 端侧大模型的机器,可是在体验之后,我们发现目前 Gemini 目前的大多数功能都十分依赖网络,端侧模型 Gemini Nano 能够做的事儿十分有限。

刨除因为中文系统语言设定暂不开放的功能,目前 Google Pixel 8 Pro 上面的 Gemini 可以为用户提供八大核心功能:

一.魔法修图

在 Google 相册中点选“编辑”按钮,你就可以在左下角发现一个彩色的“魔法修图”图标,选择后用户就可以对照片中想要编辑的内容进行框选,框选后你不仅可以进行消除,还可以进行缩放处理。但需要注意的是,每张图片在处理之前一定要上传到云端的 Google 相册进行“备份”,并且在图片处理的过程中需要保持联网。


即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

图源:品玩 LU


选择擦除后,大模型会对擦除的主体后面的画布进行“想象”并生成补充内容,并给出4张反馈供用户选择。在该步骤下,AI 需要识别图片中的物体,并学习该物体的大概轮廓,对应的在数据库中进行比对并给出补充。


即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

图源:品玩 LU摄


可以看到,将图中女人删除后,Gemini 对香港的红色出租车的细节补充还是比较到位的。

你也可以将画面中的主体进行缩放,这个功能非常适合在景点合影时,修正人物不够突出的构图效果。


即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

图源:品玩 LU


二、“魔法换天

在没有主体的风光照中,你也可以依靠 Gemini 对照片进行不同“时空”的转换,比如这张维多利亚港的风光照,我们点击魔法修图按钮后,可以看到 AI 判断我们可以针对天空、日落、风格化、和水进行四个大方向的调整。


即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

图源:品玩 LU 摄


这个功能非常类似小米手机上很出名的“魔法换天”,不得不说日落时分这张做的还蛮有感觉的。


即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

图源:品玩 LU


免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier