Hàm_softmax

Trong toán học, hàm softmax, hoặc hàm trung bình mũ,[1]:198 là sự khái quát hóa của hàm lôgit biến không gian K-chiều véc tơ {\displaystyle }  với giá trị thực bất kỳ đến không gian K-chiều véc tơ {\displaystyle }  mang giá trị trong phạm vi (0, 1] bao gồm cả giá trị 1. Phương trình được biểu diễn như sau:Trong lý thuyết xác suất, giá trị xuất ra của hàm softmax có thể được sử dụng để đại diện cho một loại phân phối – đó là phân phối xác suất trên K khả năng khác nhau có thể xảy ra. Trong thực tế, nó là gradien logarit chuẩn hóa thuộc nhóm phân phối xác suất.Bản mẫu:ElucidateCác hàm softmax được sử dụng trong nhiều phương pháp phân loại đa lớp như hồi quy logistic đa biến,[1]:206–209  Biệt thức tuyến tính phân tích nhiều lớp, Phương pháp phân loại Bayes, và mạng neuron.[2] Đặc biệt, trong hồi quy logistic đa biến và biệt thức tuyến tính phân tích, hồi quy đầu vào thành phương trình là kết quả của K hàm tuyến tính riêng biệt, và dự đoán xác suất cho lớp thứ j cho bởi véc tơ mẫu x trọng số véc tơ wBản mẫu:Elucidate là:Đây có thể được coi là thành phần của K {\displaystyle } và hàm softmax (ở đây  {\displaystyle }  biểu khị kết quả của {\displaystyle } và {\displaystyle } ). Phép tính này tương đương với việc áp dụng toán tử được xác định bởi {\displaystyle } để tơ {\displaystyle } vậy, chuyển đổi nguyên bản, có thể rất nhiều chiều, véc tơ đầu vào nằm trong một K-chiều không gian {\displaystyle } .