← Back to Home

word count challenge

评估模型生成的英文笑话是否符合指定的200单词数要求

模型得分

模型word_count得分
deepseek-v4-flash2001
MiMo-V2-Flash2250.875
数据来源

结果文件: ../evaluate/按单词数生成/结果.csv

得分文件: ../evaluate/按单词数生成/得分.csv