Thử 10 tình huống sử dụng AI Gemini Flash 2.0 để tạo và chỉnh sửa ảnh

CHIA SẺ:

Không chỉ có khả năng text to text mà model Gemini 2.0 còn có thể text to image, nghĩa là tạo ra hình ảnh từ văn bản nhập vào. Hồi cuối năm ngoái...

Không chỉ có khả năng text to text mà model Gemini 2.0 còn có thể text to image, nghĩa là tạo ra hình ảnh từ văn bản nhập vào. Hồi cuối năm ngoái họ đã phát hành Gemini 2.0 Flash nhưng chỉ cho một số người test. Bây giờ họ đã chính thức phát hành rộng rãi cho tất cả người dùng và chúng ta đã có thể xài thử tính năng này miễn phí tại Google AI Studio.

https://aistudio.google.com/prompts/new_chat?model=gemini-2.0-flash-exp

Các bạn chỉ cần vào đường dẫn bên trên để vào Google AI Studio, cột bên phải chọn vào Gemini 2.0 Flash (Image Generatuon) Experimental, nhớ chọn output đầu ra là Images and text là đã có thể bắt đầu tạo / chỉnh sửa hình ảnh.

Gemini 2.0 cho phép người dùng nhập vào một đoạn mô tả và nó sẽ tạo ra hình ảnh. Google nói rằng người dùng thậm chí có thể dùng nó để kể một câu chuyện bằng text và Gemini 2.0 sẽ lo phần minh họa bằng hình ảnh bằng cách giữ cho các nhân vật, những chủ thể được nhất quán trong suốt cuộc trò chuyện với chatbot.

Sau khi Gemini 2.0 tạo ra một hình ảnh, người dùng muốn chỉnh sửa hay thêm cái gì vào, chỉ cần nhập tiếp lệnh vào qua ô chat là model sẽ tự hiểu và trả về hình ảnh đã cập nhật. Nhờ ngữ cảnh của cả cuộc nói chuyện được giữ lại nên chatbot có thể hiểu được rõ hơn những mong muốn sửa đổi của người dùng để cập nhật chính bức ảnh đã tạo, không tạo ra ảnh mới hoàn toàn.
Không chỉ tạo ra mà người dùng còn có thể tải hình ảnh lên và nhờ Gemini chỉnh sửa, bổ sung thêm các yếu tố khác trong ảnh chỉ bằng câu prompt nhập vào. Đây là điểm khá ăn tiền, cho phép mở ra nhiều tình huống sử dụng hơn rất nhiều.

Google nói rằng khác với nhiều mô hình tạo hình ảnh khác, flash Gemini 2.0 tận dụng kiến thức được dạy về thế giới và khả năng lý luận nâng cao để tạo ra hình ảnh phù hợp. Khả năng này cho phép nó có thể tạo ra hình ảnh chi tiết và thực tế, bám sát vào những gì người dùng mô tả trong prompt bằng ngôn ngữ tự nhiên.

Điểm hay khác của Gemini 2.0 Flash chính là có thể xử lý tốt chữ trên vật thể trong hình ảnh, thí dụ như dòng chữ in lên áo của nhân vật hoặc chữ trên bảng hiệu trong hình ảnh. Google nói rằng đây là điểm mạnh của Gemini 2.0 flash so với rất nhiều model khác nhờ vào khả năng xử lý chính xác các chuỗi text dài của nó.


Bên dưới đây, mình sẽ thử nhanh một số tình huống xài Gemini 2.0 flash để tạo hay chỉnh sửa ảnh tải lên


3 tình huống bên dưới, mình thử thêm các dòng chữ vào chiếc áo của nhân vật trong ảnh, có chỉ ra rõ cách chữ được thêu lên áo.



Một tính năng khá hay của Gemini 2.0 Flash chính là tự vẽ ra một câu chuyện với hình minh họa kèm theo. Mình thử tải một ảnh lên và bắt nó viết ra một câu chuyện dơn giản và bên dưới là kết quả.



Mọi người có thể thử thay nội dung câu chuyện, thay phong cách ảnh để ra được các kết quả khác nhau.


  • Hầu hết các tình huống tạo ảnh, thêm chi tiết vào ảnh đều được làm rất tốt.
  • Ngữ cảnh chung của cả cuộc nói chuyện đều được giữ lại ổn định, dẫn tới việc thay đổi các chi tiết mong muốn trong bức ảnh không làm thay đổi quá nhiều toàn bộ bức ảnh, rất thích hợp để chỉnh ảnh.
  • Các nhu cầu như thay đổi áo quần, màu sắc, background đều được làm tốt.
  • Xử lý chữ trong ảnh rất tốt.
  • Xử lý mặt người cần lưu ý điều chỉnh top K và Temperature của model ở panel bên phải để ra được ảnh mong muốn, không bị biến dạng quá nhiều.
  • Một lưu ý là chất lượng từ bức ảnh thứ 3 trong cùng một cuộc nói chuyện sẽ giảm đi đáng kể. Bởi thế nếu muốn chỉnh sửa một bức ảnh chưa đúng ý do AI tạo ra, chúng ta nên bấm vào edit prompt tạo ra bức ảnh đó và chạy lại thay vì tiếp tục kêu nó tạo thêm bức ảnh khác.
  • Các thí dụ trên đây mình đều sử dụng các lệnh rất ngắn để thử nhanh. Nếu bạn muốn hình ảnh ra chi tiết hơn, cần chi tiết ngay trong prompt, diễn đạt rõ để model hiểu được ý định và trả về kết quả đúng ý hơn.

BÌNH LUẬN

Tên

Amazon,1,An toàn,1,App banking,1,Apple,2,Bán dẫn,1,Bảo mật,1,Bao nhiêu,1,Bất động sản,25,Bí mật,2,Bình đẳng,1,Bóc mẽ,1,Cá nhân,2,Các sàn,1,Các vòng,1,Cảnh báo,4,Cẩm nang,1,Cầm quyền,1,Cân nhắc,1,Chân dung,1,Chi tiết,1,Chia sẻ,3,Chiến lược,2,Chiến thắng,1,Chính sách,1,Chính trị,36,Chip,2,Chủ tịch,1,Chưa từng có,1,Chứng chỉ quỹ,2,Cổ phiếu,1,Công an,2,Công nghệ,64,Cộng nghệ,2,Cộng tác viên,1,Công thức,1,Công ty,3,Cốt lõi,1,Credit card,3,Credit score,1,Cuộc chiến,1,Cửa hàng,1,Dễ dàng,1,Dịch vụ,1,Doang nghiệp,1,Doanh nghiệp,3,Doanh nhân,4,Dự định,1,Đánh giá,1,Đào tạo,2,Đạo Vũ Trụ,13,Đất hiếm,1,Đầu tư,45,Đen tối,1,Đến lượt,1,Đi tìm,1,Địa lý,17,Điểm tín dụng,1,Điện thoại,1,Điện tử,1,Định hình,1,Đối mặt,1,Đối thủ,1,Đường dây,1,Ecommerce,3,EDM,1,Elon Musk,1,F&B,2,Facebook,1,Finance,3,Fintech,5,Fmarket,2,Gemini,2,Giá rẻ,1,Gia vị,1,Giải mã,1,Gian lận,1,Gọi vốn,1,Google,3,Hà Lan,1,Hà Nội,1,Hàn Quốc,1,Hàng giả,1,Hàng tỷ đô,1,Hiệu quả,1,Hình sự,1,Học thuyết,1,Hỗ trợ,1,Hội thảo,2,Hủy diệt,1,Hướng dẫn,3,Hybrid,3,Indonesia,1,Internet,3,Ít vốn,1,Jack Ma,1,Kết hợp,1,Khách hàng,3,Khoa học,3,Khoa học hành vi,13,Khoa học lượng tử,1,Khổng lồ,1,Khởi nghiệp,1,Khủng hoảng,2,Kiểm soát,1,Kiến thức,11,Kinh doanh,72,Kinh nghiệm,2,Kinh tế,85,Kỷ nguyên,2,Lá bài tẩy,1,Là gì,6,Làm nên,1,Lạm phát,2,Làm thế nào,1,Lịch sử,14,Lo lắng,1,Logistics,1,Lôi kéo,1,Lợi thế hơn,1,Lớn nhất,1,Lược sử,1,Lượng tử,1,Marketing,2,Máy quang khắc EUV,1,Máy tính,1,Mẹo & thủ thuật,4,Miền Bắc,1,Miễn phí,1,Mô hình,6,Mua bán,1,Mua sắm,1,Năng lượng,2,Netflix,1,News Feed,1,Ngành công nghiệp,1,Ngành nghề,1,Ngân hàng,20,Nghề nghiệp,1,Nghệ sĩ,1,Nguy cơ,1,Người dùng,1,Người giàu,1,Nhà sản xuất chip,1,Như thế nào,8,Nổi bật,1,Nông nghiệp,7,Nới lỏng,1,Nuôi cua,1,Nuôi tôm,1,Nước ngoài,1,Nvidia,2,One-Stop Mall,1,One-Stop Shop,1,One-Stop Shopping,1,Online,2,Online card,1,Phá sản,1,Pháp luật,35,Phát hiện,1,Phát triển,2,Phân biệt,1,Phong sát,1,Quán ăn,1,Quản trị,2,Qubit,1,Quốc Gia,1,Quỹ mở,1,Ra sao,1,Samsung,3,Sản phẩm,1,Sao chép,2,Silicon,1,Smartphone,1,Starlink,1,Startup,4,Sử dụng,2,Sữa giả,1,Sức khỏe,3,Tài chính,88,Tạo ra,2,Tập đoàn,1,Tất cả,1,Thách thức,2,Thành công,3,Thành lập,1,Thất nghiệp,1,Thẻ tín dụng,5,Thế giới,4,Thế Giới Di Động,2,Thí điểm,1,Thì sao,1,Thị trường,2,Thống trị,3,Thời gian,1,Thủ tục,1,Thung lũng,1,Thực phẩm,1,Thương mại,2,Thương mại điện tử,2,Tiềm năng,1,Tiền mã hóa,5,Tiên phong,1,Tiền tệ,2,Tiêu dùng,1,Tim Cook,1,Tìm hiểu,1,Toàn quốc,1,Tóm tắt,1,Tội phạm,1,Tôn giáo,2,Trải nghiệm,1,Tri thức,1,Trốn thuế,1,Trồng lúa,1,Trợ lý,1,Trung Quốc,6,Trực tuyến,1,TSMC,1,Tuyển dụng,3,Tuyệt vọng,1,Tư nhân,2,Từng bước,1,Tương lai,2,Tỷ đô,1,Tỷ phú,2,Ưu thế,1,Vàng,2,Vay tín chấp,1,Vận hành,1,Vận mệnh,1,Vệ tinh,1,Vì sao,3,VIB,1,Việt Nam,15,Vinahouse,10,Vỏ rỗng,1,Voltes V: Legacy,9,Vòng xoáy,1,Vùng tối,1,Xã hội,48,Xây dựng,3,Xe điện,1,Xiaomi,3,Xu hướng,1,Yếu tố,2,Zakuda Capital,3,
ltr
item
Zakuda.com: Thử 10 tình huống sử dụng AI Gemini Flash 2.0 để tạo và chỉnh sửa ảnh
Thử 10 tình huống sử dụng AI Gemini Flash 2.0 để tạo và chỉnh sửa ảnh
Không chỉ có khả năng text to text mà model Gemini 2.0 còn có thể text to image, nghĩa là tạo ra hình ảnh từ văn bản nhập vào. Hồi cuối năm ngoái...
https://photo2.tinhte.vn/data/attachment-files/2025/03/8669303_collage.jpg
https://i.ytimg.com/vi/gM-hPXC3qDI/default.jpg
Zakuda.com
https://www.zakuda.com/2025/03/thu-10-tinh-huong-su-dung-ai-gemini-flash-20-de-tao-va-chinh-sua-anh.html
https://www.zakuda.com/
https://www.zakuda.com/
https://www.zakuda.com/2025/03/thu-10-tinh-huong-su-dung-ai-gemini-flash-20-de-tao-va-chinh-sua-anh.html
true
5196515751811444554
UTF-8
Đã tải tất cả bài viết Không tìm thấy bài viết nào XEM TẤT CẢ Xem thêm Hồi đáp Hủy trả lời Xóa bỏ Bởi Trang chủ TRANG BÀI VIẾT Xem tất cả DÀNH CHO BẠN TỪ KHÓA LƯU TRỮ TÌM KIẾM TẤT CẢ BÀI VIẾT Không tìm thấy bài đăng nào phù hợp với yêu cầu của bạn Trở về trang chủ Chủ nhật Thứ 2 Thứ 3 Thứ 4 Thứ 5 Thứ 6 Thứ 7 Sun Th2 Th3 Th4 Th5 Th6 Th7 Tháng một Tháng hai Tháng ba Tháng tư Tháng năm Tháng sáu Tháng bảy Tháng tám Tháng chín Tháng mười Tháng mười một Tháng mười hai Tháng 1 Tháng 2 Tháng 3 Tháng 4 Tháng năm Tháng 6 Tháng 7 Tháng 8 Tháng 9 Tháng 10 Tháng 11 Tháng 12 just now 1 minute ago $$1$$ minutes ago Cách đây 1 giờ $$1$$ hours ago Hôm qua $$1$$ days ago $$1$$ weeks ago more than 5 weeks ago Followers Follow THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy Mục lục