在sk-learn中提供了三種不同類型的貝葉斯模型方法:
高斯模型(基於高斯分佈實現分類概率的計算) - 連續型特徵:from e_bayes import GaussianNB公式:
高斯分佈,也就是正態分佈,是一種連續型變量的概率分佈(高手模型是用來處理連續型特徵的)。
多項式模型 (類別較少的分類)
原理:(條件概率)在某個條件下求出某個東西的所屬類別,例如一篇文章可能屬於軍事,科技,人文等類別,在這些類別條件的下,求出它屬於某個類別的概率,取最大概率的類別作爲它的類別
伯努利模型(只能做二分類) - 特徵數據爲二項分佈
作用:判斷某一文章是否屬於某一類別二值化操作:需要將特徵轉化爲二項分佈,0,1