Gemini | Meng 的个人博客

AI模型

Gemini

Gemini是谷歌DeepMind团队基于2012年启动的人工智能研究计划开发的多模态大模型

链接直达手机查看

Gemini是谷歌DeepMind团队基于2012年启动的人工智能研究计划开发的多模态大模型，为应对ChatGPT挑战，谷歌于2023年1月促使联合创始人回归并加速AI开发，历经PaLM、PaLM 2（2023年5月发布）等迭代阶段，于2023年12月6日正式发布。

该模型基于Transformer架构，采用原生多模态设计，支持文本、图像、音频、视频及代码的联合处理。初代Gemini 1.0包含Ultra（复杂任务）、Pro（通用场景）和Nano（移动端）三个版本，自2023年12月13日起通过Google AI Studio和Vertex AI平台向开发者开放API。

2024年2月，谷歌将旗下聊天机器人Bard更名为Gemini，推出Advanced版本，并发布Gemini 1.5。2024年12月，谷歌发布Gemini 2.0。2025年3月新增MTEB排名第一的Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日，谷歌正式发布Gemini 3。模型生态整合至谷歌搜索、广告系统、Chrome浏览器、智能家居及Android Auto车载系统，并在图像生成、编程辅助、长文本分析等场景广泛应用。

技术亮点包括TPU v5p芯片加速训练、稀疏专家混合（MoE）架构提升效率、支持100万token长上下文窗口。争议事件涉及2023年演示视频剪辑争议（联合创始人奥里奥尔·维尼亚尔斯否认造假指控）、2024年图像生成"反白人"偏见功能暂停、2024年9月商标侵权诉讼及2024年11月威胁信息事件。作为谷歌AI战略核心组件，该系列持续深化多模态技术整合应用。

相关导航

发表回复取消回复

相关导航

发表回复 取消回复

发表回复取消回复