Gemini 3 combina todas las capacidades de Gemini para hacer realidad cualquier idea. Foto: Google.
Gemini 3 combina todas las capacidades de Gemini para hacer realidad cualquier idea. Foto: Google.

Google presentó Gemini 3 Pro, la tercera era de su modelo de Inteligencia Artificial (IA), la cual posee una versión más autónoma, multimodal y capaz de razonar con profundidad.

La IA ha evolucionado en cuestión de dos años, de solo leer textos e imágenes a leer y comprender el contexto de las tareas. Esto se refleja con las actualizaciones de Gemini y sus diferentes versiones, indicó Google en su blog.

Asimismo, resaltó que Gemini ha sido uno de los mayores proyectos científicos con un enfoque integral, diferenciando la innovación en IA de Google. Por ello, Gemini 3 Pro se enfoca en comprender matices, analizar información compleja y ofrecer respuestas precisas y directas.

Gemini 3 posee la capacidad de comprender matices, profundizar en el contexto y resolver problemas complejos. Foto: Gemini 3.
Gemini 3 posee la capacidad de comprender matices, profundizar en el contexto y resolver problemas complejos. Foto: Gemini 3.

EVOLUCIÓN DE GEMINI

Este modelo de IA ha sido diseñado para manejar y resolver problemas complejos de diferentes áreas como la ciencia, las matemáticas, la programación, la creación y planificación de cualquier proyecto con profundidad y matices en cada interacción de manera concisa y directas, mencionó Google en su blog.

Según Sundar Pichai, CEO de Google y Alphabet, cada generación de Gemini se ha basado en su versión anterior. Con Gemini 1 se ampliaron los tipos y cantidad de información que se podían procesar con la multimodalidad nativa y ventana de contexto larga.

Por otro lado, Gemini 2 sentó las bases para las capacidades de los agentes con el razonamiento y pensamiento, permitiendo el apoyo con tareas e ideas complejas. Mientras que con Gemini 2.5 Pro se refleja el liderazgo en la plataforma de LMArena, mencionó.

COMPRENSIÓN MULTIMODAL

Este modelo de IA fue diseñado para procesar texto, audio, imagen, video y código en un mismo entorno, permitiendo la comprensión de contextos e intensiones a solicitudes complejas. Amplía la frontera de razonamiento multimodal combinando razonamiento, visión y comprensión espacial, ya no solo responde preguntas, sino idea soluciones complejas y  colabora activamente, indicó.

Además, Google resalta que la herramienta y capacidad de Gemini 3 abre nuevas posibilidades para los modelos de IA al entender el contexto completo de la tarea solicitado. Por ejemplo, si se requiere aprender a cocinar con las recetas familiares escritas a mano, Gemini 3 las puede analizar, traducir a distintos idiomas y convertirlas en un libro de cocina familiar.

Otro avance clave de este modelo se encuentra en su sistema de entrenamiento supervisado y verificación de información, diseñado para reducir errores y garantizar respuestas más confiables. Según Google, este modelo no solo responde preguntas, sino que propone soluciones, anticipa necesidades y comprende intenciones. Esto lo convierte en una herramienta ideal para estudiantes, desarrolladores, investigadores y profesionales que necesitan apoyo en procesos complejos.

Gemini 3 se encuentra en diferentes productos y  servicios de Google. Asimismo,  en Google AI Studio, Vertex AI, Gemini CLI y en la nueva plataforma de agentes de desarrollo, Google Antigravity, también en plataforma de terceros como Cursor, Git Hub, JetBrains, Manus, Replix, entre otros.

María Alejandra Ortíz
Periodista apasionada por contar historias que informan, inspiran y conectan. Enfocada en crear contenido que aporte valor, genere confianza y refleje el impacto positivo de proyectos e iniciativas. Valoro la comunicación transparente, clara y honesta.
Artículo anteriorGuatemala recibirá a 490 atletas para el Festival Paradeportivo Centroamericano 2025