Xem bài viết trên Group |
Tác giả: Leo Phạm Trọng
Like: 7 | Comment: 0 | Share: 0
Hôm nay mình test so sánh Dall-E, Bing và Gemini về function “text to image” cho mấy bạn tham khảo nha. Prompt tiêu chuẩn: “visualize a cowboy in texas” và kết quả cho ra hình như bên dưới.Sau lệnh prompt này, Dall-E và Bing cho ra hình ảnh, còn Gemini thì đáng thất vọng: “We are working to improve Gemini’s ability to generate images of people. We expect this feature to return soon and will notify you in release updates when it does.” Next step, mình dùng prompt: “redo with a night background”, con Dall-E sẽ hiểu và generate ra hình vẫn là cowboy với background ban đêm, còn con Bing thì chưa hiểu redo và cho ra hình không liên quan gì đến cowboy Mình đánh giá con Dall-E cao hơn vì độ “INTELLIGENCE” của nó, ví dụ như đợt rồi mình làm vài hình Tết, sau khi generate ra hình, mình dùng prompt: “redo, remove chinese word in the image” và nó làm đúng cái mình yêu cầu 90% (1 vài hình vẫn còn chữ TQ thì mình lại redo lần nữa thì nó remove hoàn toàn)Còn các bạn có kinh nghiệm gì thú vị về AI thì chia sẻ với mình nhen
CÓ THỂ BẠN QUAN TÂM:
- 5 công cụ vẽ chân dung khách hàng đơn giản mà hiệu quả có thể bạn chưa biếtMuốn truyền thông hiệu quả thì đương nhiên là phải hiểu công chúng mục tiêu
- SERIES KỂ CHUYỆN “CÔ BÉ QUÀNG KHĂN ĐỎ” BẰNG HÌNH AI VẼĐịnh thôi không kể chuyện nữa nhưng lại mê quá nên phải làm thêm nốt cái này nữa ạ. Đây cũng là
- OPENAI TUNG MODEL TEXT TO VIDEO – AI VÀ NHỮNG CUỘC ĐUA KHÔNG HỒI KẾT….
- Các ac gọi ý cho e con AI tư tạo video bằng các hình ảnh với ạ, e cảm…
- [Ngày 022/180] Kết Nối Ngay Với “Chuyên Gia A.I” Chỉ Với 1 Ký Tự “@”GPT Mentions là tính năng hiển thị danh sách các mô hình GPT có sẵn, giúp người dù
