tf-idfは、文書中の単語に関する重みの一種であり、主に情報検索や文章要約などの分野で利用される。tf-idfは、tf(、単語の出現頻度)とidf(、逆文書頻度)の二つの指標にもとづいて計算される。formula_1formula_2formula_3formula_4は単語formula_5の文書formula_6における出現回数、formula_7は文書formula_6におけるすべての単語の出現回数の和、formula_9は総文書数、formula_10は単語formula_5を含む文書数である。そのため、idfは一種の一般語フィルタとして働き、多くの文書に出現する語(一般的な語)は重要度が下がり、特定の文書にしか出現しない単語の重要度を上げる役割を果たす。
出典:wikipedia
LINEスタンプ制作に興味がある場合は、
下記よりスタンプファクトリーのホームページをご覧ください。