Xem bài viết trên Group |
Tác giả: Leo Phạm Trọng
Like: 7 | Comment: 0 | Share: 0
Hôm nay mình test so sánh Dall-E, Bing và Gemini về function “text to image” cho mấy bạn tham khảo nha. Prompt tiêu chuẩn: “visualize a cowboy in texas” và kết quả cho ra hình như bên dưới. Sau lệnh prompt này, Dall-E và Bing cho ra hình ảnh, còn Gemini thì đáng thất vọng: “We are working to improve Gemini’s ability to generate images of people. We expect this feature to return soon and will notify you in release updates when it does.” ???????? Next step, mình dùng prompt: “redo with a night background”, con Dall-E sẽ hiểu và generate ra hình vẫn là cowboy với background ban đêm, còn con Bing thì chưa hiểu redo và cho ra hình không liên quan gì đến cowboy Mình đánh giá con Dall-E cao hơn vì độ “INTELLIGENCE” của nó, ví dụ như đợt rồi mình làm vài hình Tết, sau khi generate ra hình, mình dùng prompt: “redo, remove chinese word in the image” và nó làm đúng cái mình yêu cầu 90% (1 vài hình vẫn còn chữ TQ thì mình lại redo lần nữa thì nó remove hoàn toàn) Còn các bạn có kinh nghiệm gì thú vị về AI thì chia sẻ với mình nhen
CÓ THỂ BẠN QUAN TÂM:
- [Chia sẻ] Máy Tạo Prompts dành riêng cho eCommerce Marketer.eCommerce Prompts là trang cung cấp miễn phí dịch vụ Tạo Prompts (Generate Prompts) và các
- Đố địa danh T—– –…
- Thử dùng Character Reference và Style Reference trong Midjourney để generate ra vài cảnh nhân vật Santiago lấy cảm hứng từ tác phẩm “Nhà Giả Kim” của
- 4 Bài học phải nhớ khi khởi nghiệp trong ngành F&B
- Liên xô chấm mỹ…Đồng nghiệp của cô giáo Thảo bị bắt…sau 20 năm hoạt động.Hơi ngạc nhiên, cứ nghĩ tầm cỡ như lauxanh thiendia thì admin phải kiếm đ
