Google Gemini Pro全球上线支援逾40种语言、公布图像生成模型Imagen 2

Google

继去年12月的Gemini Ultra及Gemini Nano後，Google昨（1）日宣布Gemini Pro於全球上线，并推出中文、法语、日语等40多种语言版本。此外也推出结合Bard英文版的图像生成AI模型Imagen 2。

今天起，Gemini Pro in Bard将支援40多种语言，包括中文、日语、法语、西语、德语、荷语、葡语、阿拉伯语、以及印度印地语（Hindi）、坦米尔语（Tamil）、泰卢固（Telugu）及马拉雅拉姆语（Malayalam）在230多个国家及市场上线。这个进阶AI大型语言模型具备进阶理解、推论、文章摘要及写程式等能力。

随同Gemini Pro全球上线，其中的double-check功能也将提供多语支援。点下Google Bard的「G」，该功能可结合Google网页搜寻，以便比对Bard搜寻来的网页资讯。如果有突显特定字词，用户可以点入了解是否和Google搜寻的资讯符合或冲突。

图片来源／Google

此外，Google Bard英文版也有所强化，加入图像生成AI模型Imagen 2。这模型让用户可以输入文字描述，让Google聊天机器人产出图片。Imagen 2是基於扩散（diffusion-based）模型，强调能生成高品质图片，并解决文字生成图片的技术问题，像是手与人脸渲染失真，并避免视觉伪影等人为问题。

Google并说，Imagen 2基於AI伦理原则设计，会标示为AI生成的作品。它使用SynthID技术在图像中嵌入可以机器辨识的浮水印，并以护栏技术防止Bard产出暴力、冒犯或不雅内容，也会限制产出名人图片。

除了Bard外，Image 2也将用於Google其他AI服务如Image FX、SGE（Google生成式搜寻体验）、及Vertex AI云服务。

Google也公开了测试中的其他生成式AI工具，包括ImageFX、MusicFX及TextFX，现在可经由Google Labs试用。

其中ImageFX是以Imagen 2为底层的文字生成图像工具，类似OpenAI的DALL-E、Meta的Imagine with Meta AI或微软Designer。ImageFX主打提供expressive chips，指的是一系列关键字建议，让用户可以逐个测试生成不同感觉的图片。

图片来源／Google

文字生成音乐的MusicFX，现在可生成70秒的音乐、反覆段落、以expressive chips关键字建议探索提示，还能将创作和友人分享。另外，Google去年和Lupe Fiasco合作开发的AI工具TextFX，可帮助作词者、作家等文字创作者，也在新版中改善了介面可使用性。

Tags: 大数据