Xem bài viết trên Group |
Tác giả: Leo Phạm Trọng
Like: 7 | Comment: 0 | Share: 0
Hôm nay mình test so sánh Dall-E, Bing và Gemini về function “text to image” cho mấy bạn tham khảo nha. Prompt tiêu chuẩn: “visualize a cowboy in texas” và kết quả cho ra hình như bên dưới.Sau lệnh prompt này, Dall-E và Bing cho ra hình ảnh, còn Gemini thì đáng thất vọng: “We are working to improve Gemini’s ability to generate images of people. We expect this feature to return soon and will notify you in release updates when it does.” Next step, mình dùng prompt: “redo with a night background”, con Dall-E sẽ hiểu và generate ra hình vẫn là cowboy với background ban đêm, còn con Bing thì chưa hiểu redo và cho ra hình không liên quan gì đến cowboy Mình đánh giá con Dall-E cao hơn vì độ “INTELLIGENCE” của nó, ví dụ như đợt rồi mình làm vài hình Tết, sau khi generate ra hình, mình dùng prompt: “redo, remove chinese word in the image” và nó làm đúng cái mình yêu cầu 90% (1 vài hình vẫn còn chữ TQ thì mình lại redo lần nữa thì nó remove hoàn toàn)Còn các bạn có kinh nghiệm gì thú vị về AI thì chia sẻ với mình nhen
CÓ THỂ BẠN QUAN TÂM:
- # **TOOL TẠO KỊCH BẢN HÀNG LOẠT** Với tool này cả nhà có thể tạ…
- [Loa loa loa chuyên mục mới] Ứng dụng AI cùng cô Long: Content Mì ăn liền & Prompt thần thánhTẬP 3- TRÌNH CHIẾU ALBUM HÌNH TẾT CẢ NHÀ SUM VẦY TRÊN TI
- Chia sẻ với mọi người hướng dẫn sử dụng Stable Diffusion (tạo ra ảnh n…
- [Stable Diffusion] **Làm sao sửa lỗi mặt và tay?** *Với AI nói …
- [TÊN MIỀN EMAIL CÔNG TY]Hiện tại em/mình đang có làm “miền email” công ty (quy mô nhỏ) ạ. Tuy nhiên em chưa có kinh nghiệm trong phần này ạKhông biết
