分类问题的评价指标
- | Relevant,正类 | Nonrelevent,负类
—-|——|—-
Retrieved 被检索到 | TP | FP
Notretrieved未检索到 | FN | TN
准确率是:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比
精确率是:它计算的是所有被检索到的item中,”应该被检索到”的item占的比例。
召回率是:它计算的是所有检索到的item占所有”应该检索到的item”的比例。
综合评价指标F-measure是精确度和召回率的综合
当a = 0时,为F1:
机器翻译质量评测算法
使用BLEU来衡量算法的准确程度
计算公式如下
其中BP =
c = len(word of machine)
r = len(word of reference)
而