Phân_bổ_Pachinko

Trong học máyxử lý ngôn ngữ tự nhiên, mô hình phân bổ Pachinko (tiếng Anh: pachinko allocation model, viết tắt là PAM) là một mô hình chủ đề. Các mô hình chủ đề là một bộ thuật toán khám phá cấu trúc chủ đề (chuyên đề) ẩn của một tập tài liệu.[1] Thuật toán cải tiến dựa trên các mô hình chủ đề trước kia như phân bổ Dirichlet tiềm ẩn (LDA) bằng cách mô hình hóa sự tương quan giữa các chủ đề, bên cạnh các mối tương quan giữa các từ cấu thành nên các chủ đề đó. PAM cung cấp khả năng linh hoạt hơn và biểu đạt tốt hơn so với phân bổ Dirichlet tiềm ẩn.[2] Mặc dù đầu tiên được mô tả và triển khai trong lĩnh vực xử lý ngôn ngữ tự nhiên, thuật toán có thể áp dụng ứng dụng cho các lĩnh vực khác như tin sinh học. Mô hình được đặt tên theo tên các máy Pachinko—một trò chơi phổ biến ở Nhật Bản, trong đó các quả bóng kim loại dội xuống xung quanh một tập các chốt (ghim) phức tạp cho đến khi rơi trong các thùng khác nhau ở phía dưới.[3]

Tài liệu tham khảo

WikiPedia: Phân_bổ_Pachinko http://www.cs.brown.edu/~th/papers/Hofmann-SIGIR99... http://jmlr.csail.mit.edu/papers/v3/blei03a.html http://www.cs.princeton.edu/~blei/topicmodeling.ht... http://maroo.cs.umass.edu/pdf/IR-587.pdf http://www.cs.umass.edu/~mccallum/papers/pam-icml0... http://videolectures.net/icml07_mimno_moht/ //arxiv.org/abs/1206.5270 https://web.archive.org/web/20101214074049/http://... https://web.archive.org/web/20120501152722/http://... https://web.archive.org/web/20121002061418/http://...