继去年12月的Gemini Ultra及Gemini Nano後,Google昨(1)日宣布Gemini Pro於全球上线,并推出中文、法语、日语等40多种语言版本。此外也推出结合Bard英文版的图像生成AI模型Imagen 2。
今天起,Gemini Pro in Bard将支援40多种语言,包括中文、日语、法语、西语、德语、荷语、葡语、阿拉伯语、以及印度印地语(Hindi)、坦米尔语(Tamil)、泰卢固(Telugu)及马拉雅拉姆语(Malayalam)在230多个国家及市场上线。这个进阶AI大型语言模型具备进阶理解、推论、文章摘要及写程式等能力。
随同Gemini Pro全球上线,其中的double-check功能也将提供多语支援。点下Google Bard的「G」,该功能可结合Google网页搜寻,以便比对Bard搜寻来的网页资讯。如果有突显特定字词,用户可以点入了解是否和Google搜寻的资讯符合或冲突。
图片来源/Google
此外,Google Bard英文版也有所强化,加入图像生成AI模型Imagen 2。这模型让用户可以输入文字描述,让Google聊天机器人产出图片。Imagen 2是基於扩散(diffusion-based)模型,强调能生成高品质图片,并解决文字生成图片的技术问题,像是手与人脸渲染失真,并避免视觉伪影等人为问题。
Google并说,Imagen 2基於AI伦理原则设计,会标示为AI生成的作品。它使用SynthID技术在图像中嵌入可以机器辨识的浮水印,并以护栏技术防止Bard产出暴力、冒犯或不雅内容,也会限制产出名人图片。
除了Bard外,Image 2也将用於Google其他AI服务如Image FX、SGE(Google生成式搜寻体验)、及Vertex AI云服务。
Google也公开了测试中的其他生成式AI工具,包括ImageFX、MusicFX及TextFX,现在可经由Google Labs试用。
其中ImageFX是以Imagen 2为底层的文字生成图像工具,类似OpenAI的DALL-E、Meta的Imagine with Meta AI或微软Designer。ImageFX主打提供expressive chips,指的是一系列关键字建议,让用户可以逐个测试生成不同感觉的图片。
图片来源/Google
文字生成音乐的MusicFX,现在可生成70秒的音乐、反覆段落、以expressive chips关键字建议探索提示,还能将创作和友人分享。另外,Google去年和Lupe Fiasco合作开发的AI工具TextFX,可帮助作词者、作家等文字创作者,也在新版中改善了介面可使用性。