Hơn 3 năm trước, khi tôi còn chơi sovits, lúc đó mô hình âm thanh cần phải tách rời (loại bỏ tiếng nền môi trường) để lấy ra giọng hát chính rồi mới tiến hành huấn luyện.


Sau đó cần phải lọc dữ liệu, loại bỏ những phần có tiếng ồn nền lớn, rồi bắt đầu huấn luyện.
Thông thường huấn luyện khoảng 8000 bước, âm sắc phục hồi tốt nhất, nếu vượt quá 8000 bước mà điểm đánh giá vẫn dưới 25, thì bộ dữ liệu và quá trình huấn luyện gần như vô dụng, nếu bạn cố tiếp tục huấn luyện, huấn luyện liên tục đến hơn 14000 bước sẽ xuất hiện hiện tượng gọi là “suy thoái”, cuối cùng âm thanh tạo ra sẽ là “nhiễu điện tử nặng” hoặc “người không ra người, quỷ không ra quỷ”.
Ở đây có giống bước phát triển của giao dịch định lượng không? Quá trình trích xuất giọng hát chính chính là quá trình cho máy tự học và dự đoán mô hình tìm dữ liệu, loại bỏ phần có tiếng ồn nền lớn chính là lọc bỏ các thị trường vô giá trị (những phần biến động mạnh trong 1 phút), huấn luyện 8000 bước sẽ không gây ra quá phù hợp nghiêm trọng, huấn luyện đến 14000 bước “suy thoái” (quá phù hợp nghiêm trọng) cuối cùng dẫn đến kết quả thực tế gần như: tung đồng xu.
Dù không cùng lĩnh vực, nhưng logic nền tảng là giống nhau.
Liệu có thể trong tương lai một ngày nào đó, người đánh bại chúng ta không phải là ngành nghề bản thân, mà là những người vượt qua ngành khác, thì thật khó nói...
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim