Hôm nay mình test so sánh Dall-E, Bing và Gemini về function “text to image” cho mấy bạn tham khảo nha. Prompt tiêu chuẩn: “visualize a cowboy in texa


Xem bài viết trên Group | Tác giả: Leo Phạm Trọng
Like: 7 | Comment: 0 | Share: 0

Hôm nay mình test so sánh Dall-E, Bing và Gemini về function “text to image” cho mấy bạn tham khảo nha. Prompt tiêu chuẩn: “visualize a cowboy in texas” và kết quả cho ra hình như bên dưới.Sau lệnh prompt này, Dall-E và Bing cho ra hình ảnh, còn Gemini thì đáng thất vọng: “We are working to improve Gemini’s ability to generate images of people. We expect this feature to return soon and will notify you in release updates when it does.” Next step, mình dùng prompt: “redo with a night background”, con Dall-E sẽ hiểu và generate ra hình vẫn là cowboy với background ban đêm, còn con Bing thì chưa hiểu redo và cho ra hình không liên quan gì đến cowboy Mình đánh giá con Dall-E cao hơn vì độ “INTELLIGENCE” của nó, ví dụ như đợt rồi mình làm vài hình Tết, sau khi generate ra hình, mình dùng prompt: “redo, remove chinese word in the image” và nó làm đúng cái mình yêu cầu 90% (1 vài hình vẫn còn chữ TQ thì mình lại redo lần nữa thì nó remove hoàn toàn)Còn các bạn có kinh nghiệm gì thú vị về AI thì chia sẻ với mình nhen

Xem bài viết trên Group

Để lại một bình luận