Từ một cái tên tạm thời được đặt vào lúc 2h30p, Nano Banana trở thành biểu tượng sáng tạo mới, hé lộ cách Google thử nghiệm bí mật công nghệ...
Từ một cái tên tạm thời được đặt vào lúc 2h30p, Nano Banana trở thành biểu tượng sáng tạo mới, hé lộ cách Google thử nghiệm bí mật công nghệ AI của mình.
Khi Google ra mắt mô hình tạo hình ảnh Gemini Nano Banana, cộng đồng công nghệ không chỉ chú ý đến hiệu năng của nó mà còn tò mò về cái tên kỳ lạ Nano Banana.
Mới đây, David Sharon, Giám đốc Sản phẩm của nhóm Gemini, đã kể lại toàn bộ câu chuyện trong podcast Made by Google và đó là một câu chuyện thú vị đến bất ngờ.
Theo Sharon, cái tên Nano Banana ban đầu chỉ là một mã định danh tạm thời, được đặt vội bởi một nhân viên Google tên Nina.
Cô đã gửi mô hình thử nghiệm lên LM Arena, một nền tảng nơi người dùng có thể trải nghiệm các mô hình AI ẩn danh, không biết ai là nhà phát triển.
"Để giữ bí mật, Nina cần nhập một tên giả ngẫu nhiên. Cô ấy nghĩ ra cái tên đó vào khoảng 2h30 sáng. Nó chỉ là một lựa chọn vui vẻ, không có chủ đích gì cả", Sharon kể.
Tuy nhiên, điều bất ngờ xảy ra khi người dùng trên LM Arena bắt đầu yêu thích mô hình này và đặc biệt là cái tên Nano Banana.
"Chúng tôi nhận ra mọi người đều gọi nó như vậy. Vì thế, thay vì đổi tên, chúng tôi quyết định giữ nguyên”, Sharon chia sẻ.
Đằng sau cái tên ngộ nghĩnh là một đột phá trong công nghệ tạo hình ảnh của Google. Gemini Nano Banana có khả năng duy trì tính nhất quán khuôn mặt và bản sắc nhân vật, một điểm yếu trước đây của nhiều mô hình AI.
“Lần đầu tôi thử, tôi tải lên ảnh của chính mình và yêu cầu AI đặt tôi vào không gian. Kết quả thật kinh ngạc bởi đó vẫn là tôi, chứ không phải một bản sao méo mó được tạo ra do AI”, Sharon kể lại.
Khả năng giữ nguyên đặc điểm khuôn mặt và đồng thời sáng tạo linh hoạt giúp Nano Banana trở thành một bước tiến lớn trong dòng AI hình ảnh của Google, cạnh tranh trực tiếp với các công cụ như DALL·E 3, Midjourney hay Firefly của Adobe.
Một nhóm nội bộ có tên Greenfield tại Google đã đẩy Nano Banana vào nhiều thử thách sáng tạo khác nhau. Khi được yêu cầu “ghép một chiếc ghế dài và củ khoai tây”, mô hình tạo ra ngay hình ảnh “couch potato”, nghĩa là củ khoai tây trên ghế sô pha một cách lười biếng nhưng dí dỏm. Đây là minh chứng cho khả năng hiểu ngữ cảnh và kết hợp khái niệm linh hoạt của AI.
Những thử nghiệm này cho thấy Nano Banana không chỉ tạo hình ảnh đẹp mà còn hiểu được ý tưởng, mở ra khả năng ứng dụng mới trong nghệ thuật số, quảng cáo và thiết kế.
Thành công của mô hình cho thấy Google đang đặt cược mạnh vào thế hệ AI hình ảnh mới, nơi tính sáng tạo, nhận diện và cá nhân hóa được kết hợp hài hòa, bắt đầu từ một “trái chuối nano” tưởng chừng chỉ là trò đùa giữa đêm khuya.
Đọc bài gốc tại đây.