今天Google推出了全新模型Gemini Embedding 2,其是Google Gemini首次支持多模态,各项参数如下:
文本:支持最多8192个输入令牌的广泛上下文
图片:每次请求最多可处理6张图片,支持PNG和JPEG格式
视频:支持最长120秒的MP4和MOV格式视频输入
音频:原生地导入并嵌入音频数据,无需中间文本转录
文档:直接嵌入最多6页的PDF
且Google表示其模型在性能方面的表现要优于其他领先模型,这也就意味着在处理多模态任务时能够节省更多时间
更多资讯,参见 谷歌的博客
版权属于:
兰科勒布劳恩斯基 订阅我们的Telegram频道
作品采用:
《
署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)
》许可协议授权
评论 (0)