E xin phép chia sẻ cho ai cần Translates nhiều như e SeamlessM4T đại diện cho một bước đột phá, đáng kể trong lĩnh vực chuyển đổi giọng nói sang giọng


Xem bài viết trên Group | Tác giả: Vũ Trường
Like: 34 | Comment: 1 | Share: 15

E xin phép chia sẻ cho ai cần Translates nhiều như e SeamlessM4T đại diện cho một bước đột phá, đáng kể trong lĩnh vực chuyển đổi giọng nói sang giọng nói và giọng nói sang văn bản. Bằng cách giải quyết những thách thức của sự bao phủ ngôn ngữ hạn chế và sự phụ thuộc vào các hệ thống riêng biệt, phân chia nhiệm vụ chuyển đổi giọng nói sang giọng nói thành nhiều giai đoạn trên các hệ thống con. SeamlessM4T cũng đang trở thành siêu dữ liệu của SeamlessAlign, bộ dữ liệu dịch thuật toán đa phương thức mở lớn nhất cho đến nay, tổng cộng 470,000 giờ chuyển đổi giọng nói và văn bản được khai thác. SeamlessM4T hỗ trợ AI nhận dạng giọng nói tự động cho gần 100 ngôn ngữ, chuyển đổi giọng nói sang văn bản cho gần 100 ngôn ngữ và chuyển đổi giọng nói cho gần 35 ngôn ngữ. SeamlessM4T cung cấp khả năng chuyển đổi thông tin đa phương thức cho mọi người tiện lợi hơn bao giờ hết.Giới thiệu: https://ai.meta.com/blog/seamless-m4t/Mô hình : https://seamless.metademolab.com/Bác nào biết chạy mô hình trên máy tính thì ngon:https://github.com/facebookresearch/seamless_communicationhttps://huggingface.co/spaces/facebook/seamless-m4t-v2-large

Xem bài viết trên Group

Để lại một bình luận