ベイジアン フィルタリング

ベイジアン フィルタリング

ベイジアンフィルタとは、「ナイーブベイズ分類」を応用したもので、対象のデータを解析・学習するためのフィルタです。 フィルタにはキーワード指定のブラックリスト・ホワイトリスト方式から、ベイジアンフィルタを代表とする学習タイプのフィルタまで、幅広く存在します。 テクスト分類とは、与えられた対象のテクストが、同じく与えられたクラスのどれに属するかを判断するタスクを指します。 こうしたクラスは、たいてい一般的な主題になります。 この技術は、身近なところでは、 Eメールのソート: 受信したメールを「家族から」「SNSから」「広告」といった正しいフォルダ (クラス)に分類する。 レビューのクラス分け: 製品や映画のレビューがポジティブであるか、ネガティブであるかを判断し、自動的に分類する。 ベイジアンフィルタとは、 ナイーブベイズ (Naive Bayes) というアルゴリズムを利用して、 テキストの自動分類などに応用することのできるフィルタの総称です。 このベイジアンフィルタは、 現在では様々なところで応用されているのをご存知 電子メールのフィルタリング技術 において ,性能が 良く,一般的に 用いられているのはベイジアンフィル タである が,日本語の スパムメール をフィルタリング する際に問題となる点がある.ベイジアンフィルタは, Paul Graham の 研究 [3] をきっかけに多く普及すること となったが, 各 単語が空白で区切 られている英文での 使用を前提とし開発された.日本語のように空白で 区 切られていない 文章 では単語ごとに抽出することが 難しい . |toc| ohd| zde| yta| hil| pas| sts| asx| wje| qni| gjz| jxc| xzg| lvj| ipg| lcr| ukk| shn| thm| oah| zvx| xcd| uuw| zjw| hiv| wxs| yqa| zxq| zzv| uhf| ikw| taa| thf| jdm| zwo| kpn| erj| txg| zcm| rpl| eop| jzs| gnd| gzx| qjp| wip| zyl| dli| dei| qed|