分类问题的评价指标

  • | Relevant,正类 | Nonrelevent,负类
    —-|——|—-
    Retrieved 被检索到 | TP | FP
    Notretrieved未检索到 | FN | TN

准确率是:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比

精确率是:它计算的是所有被检索到的item中,”应该被检索到”的item占的比例。

召回率是:它计算的是所有检索到的item占所有”应该检索到的item”的比例。

综合评价指标F-measure是精确度和召回率的综合

当a = 0时,为F1:

机器翻译质量评测算法

使用BLEU来衡量算法的准确程度
计算公式如下

其中BP =
c = len(word of machine)
r = len(word of reference)