Gemini
AI模型
Gemini

Gemini是谷歌DeepMind团队基于2012年启动的人工智能研究计划开发的多模态大模型

Gemini是谷歌DeepMind团队基于2012年启动的人工智能研究计划开发的多模态大模型,为应对ChatGPT挑战,谷歌于2023年1月促使联合创始人回归并加速AI开发,历经PaLM、PaLM 2(2023年5月发布)等迭代阶段,于2023年12月6日正式发布。
该模型基于Transformer架构,采用原生多模态设计,支持文本、图像、音频、视频及代码的联合处理。初代Gemini 1.0包含Ultra(复杂任务)、Pro(通用场景)和Nano(移动端)三个版本,自2023年12月13日起通过Google AI Studio和Vertex AI平台向开发者开放API。
2024年2月,谷歌将旗下聊天机器人Bard更名为Gemini,推出Advanced版本,并发布Gemini 1.5。2024年12月,谷歌发布Gemini 2.0。2025年3月新增MTEB排名第一的Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日,谷歌正式发布Gemini 3。模型生态整合至谷歌搜索、广告系统、Chrome浏览器、智能家居及Android Auto车载系统,并在图像生成、编程辅助、长文本分析等场景广泛应用。
技术亮点包括TPU v5p芯片加速训练、稀疏专家混合(MoE)架构提升效率、支持100万token长上下文窗口。争议事件涉及2023年演示视频剪辑争议(联合创始人奥里奥尔·维尼亚尔斯否认造假指控)、2024年图像生成"反白人"偏见功能暂停、2024年9月商标侵权诉讼及2024年11月威胁信息事件。作为谷歌AI战略核心组件,该系列持续深化多模态技术整合应用。

相关导航

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注