Phân_bổ_Dirichlet_tiềm

Phân_bổ_Dirichlet_tiềm_ẩn

Trong xử lý ngôn ngữ tự nhiên, phân bổ Dirichlet tiềm ẩn (tiếng Anh: Latent Dirichlet allocation, hay viết tắt LDA) là một mô hình sinh mẫu cho phép các tập quan sát được giải thích bằng các nhóm biến tiềm ẩn lý do tại sao một số phần trong dữ liệu lại giống nhau.[1] Ví dụ, nếu các quan sát là các từ thu thập trong các tài liệu, điều đó giả định mỗi tài liệu là một sự pha trộn của một số lượng chủ đề và mỗi thể hiện từ có tính quy kết cho một trong các chủ đề của tài liệu. LDA là một ví dụ của mô hình chủ đề và thuộc về hộp công cụ học máy và ở nghĩa rộng hơn thuộc về hộp công cụ trí tuệ nhân tạo.

Liên quan

Phân Phân loại sinh học Phân phối chuẩn Phân cấp hành chính Việt Nam Phân người Phân loại giới Động vật Phân bón Phân loại sao Phân số Phân tích kỹ thuật

Tài liệu tham khảo

WikiPedia: Phân_bổ_Dirichlet_tiềm_ẩn http://mimno.infosci.cornell.edu/topics.html http://jmlr.csail.mit.edu/papers/v3/blei03a.html //pubmed.ncbi.nlm.nih.gov/10835412 //pubmed.ncbi.nlm.nih.gov/12930761 //www.ncbi.nlm.nih.gov/pmc/articles/PMC1461096 //www.ncbi.nlm.nih.gov/pmc/articles/PMC1462648 //doi.org/10.1162%2Fjmlr.2003.3.4-5.993 http://genetics.org/content/155/2/945 //www.worldcat.org/issn/0016-6731 https://docs.microsoft.com/en-us/azure/machine-lea...