Grok 推 Vision 功能!可识别手机视野内容,多语言音频等同步上线

xAI 的 Grok 聊天机器人现在可以回答有关智能手机摄像头视野范围内的问题,类似于 Google 的 Gemini 和 ChatGPT 提供的实时视觉功能。

周二,xAI 宣布推出 Grok Vision,用户可以使用手机对准产品、标识和文件等物体,并提出相关问题。Grok Vision 可通过 iOS 版 Grok 应用访问,但目前还无法通过 Android 版 Grok 应用访问。

Grok 今天推出的其他新功能包括多语言音频和 Grok 语音模式下的实时搜索。Android 版 Grok 用户可以使用这些功能,但必须订阅 xAI 每月 30 美元的 SuperGrok 套餐。

Grok 一直在稳步增加新功能。本月早些时候,xAI 为 Grok 添加了“记忆”组件,让机器人能够从过去的对话中提取详细信息。Grok 还新增了一个类似画布的工具,用于创建文档和应用程序。

Frontiers
Frontiers
文章: 93