Google vừa chính thức giới thiệu Gemini 3 Pro Image Preview, mô hình được cho là mang tên mã “Nano Banana Pro”. Đây là phiên bản tạo ảnh mới nhất trong hệ sinh thái Gemini 3 và được thiết kế để hỗ trợ quy trình sáng tạo nhanh hơn, chính xác hơn với khả năng tạo ảnh và chỉnh sửa đa vòng đối thoại.
Gemini 3 Pro Image được xây dựng để xử lý những nhiệm vụ tạo ảnh khó nhất, nhờ tích hợp khả năng suy luận hình ảnh preview tiên tiến. Theo Google, đây là mô hình tối ưu dành cho các tác vụ sáng tạo phức tạp, bao gồm chỉnh sửa hình ảnh theo nhiều bước, yêu cầu độ chính xác cao.
Là một phần của dòng Gemini 3 — nhóm mô hình tập trung vào khả năng suy luận (reasoning) — Gemini 3 Pro Image có khả năng tự phân tích, suy diễn trước khi phản hồi. Nhờ đó, chất lượng hình ảnh được cải thiện rõ rệt, chi tiết sắc nét hơn và tính nhất quán được nâng cao. Google cho biết đây là mô hình tạo ảnh mạnh mẽ và linh hoạt nhất mà họ từng phát triển.
Việc tích hợp cơ chế suy luận trực tiếp vào quá trình tạo ảnh mang lại nhiều lợi ích đáng chú ý:
Nâng cao chất lượng hình ảnh
Hiển thị văn bản dài bằng nhiều ngôn ngữ tốt hơn
Tăng độ chính xác của thông tin trong quá trình tạo ảnh
Gemini 3 Pro Image cũng hỗ trợ xuất ảnh với độ phân giải lên đến 4K, kèm theo tính năng grounding dựa trên tìm kiếm. Điều này giúp mô hình cung cấp thông tin sát thực tế hơn và cập nhật theo dữ liệu mới nhất.

Hiện tại, mô hình đã xuất hiện trên Vertex AI, đồng thời hỗ trợ sử dụng thông qua Google Gen AI SDK với giao diện Python và Go thống nhất trên Google AI Studio. Đây được xem là bước tiến lớn của Google trong cuộc đua mô hình tạo ảnh AI thế hệ mới, mở ra nhiều cơ hội sáng tạo mạnh mẽ hơn cho nhà phát triển và người dùng chuyên nghiệp.