Trong
toán học,
hàm softmax, hoặc
hàm trung bình mũ,
[1]:198 là sự khái quát hóa của
hàm lôgit biến không gian K-chiều véc tơ {\displaystyle } với giá trị thực bất kỳ đến không gian K-chiều véc tơ {\displaystyle } mang giá trị trong phạm vi (0, 1] bao gồm cả giá trị 1. Phương trình được biểu diễn như sau:Trong
lý thuyết xác suất, giá trị xuất ra của hàm softmax có thể được sử dụng để đại diện cho một loại phân phối – đó là
phân phối xác suất trên K khả năng khác nhau có thể xảy ra. Trong thực tế, nó là
gradien logarit chuẩn hóa thuộc nhóm phân phối xác suất.
Bản mẫu:ElucidateCác hàm softmax được sử dụng trong nhiều phương pháp phân loại đa lớp như hồi quy logistic đa biến,
[1]:206–209
Biệt thức tuyến tính phân tích nhiều lớp, Phương pháp phân loại Bayes, và
mạng neuron.
[2] Đặc biệt, trong hồi quy logistic đa biến và biệt thức tuyến tính phân tích, hồi quy đầu vào thành phương trình là kết quả của K hàm tuyến tính riêng biệt, và dự đoán xác suất cho lớp thứ j cho bởi véc tơ mẫu
x trọng số véc tơ
wBản mẫu:Elucidate là:Đây có thể được coi là
thành phần của K {\displaystyle } và hàm softmax (ở đây {\displaystyle } biểu khị kết quả của {\displaystyle } và {\displaystyle } ). Phép tính này tương đương với việc áp dụng toán tử được xác định bởi {\displaystyle } để tơ {\displaystyle } vậy, chuyển đổi nguyên bản, có thể rất nhiều chiều, véc tơ đầu vào nằm trong một K-chiều không gian {\displaystyle } .