Trong AI generative, mô hình phổ biến để tạo hình ảnh sử dụng latent space làm không gian biểu diễn nhiễu (noise). Từ input là văn bản prompt (và có thể kèm hình ảnh) được encode thành latent space, model thực hiện quá trình denoising từng bước để chuyển không gian này thành hình ảnh […]

