← Back to Home
word count challenge
评估模型生成的英文笑话是否符合指定的200单词数要求
模型得分
| 模型 | word_count | 得分 |
|---|---|---|
| deepseek-v4-flash | 200 | 1 |
| MiMo-V2-Flash | 225 | 0.875 |
数据来源
结果文件: ../evaluate/按单词数生成/结果.csv
得分文件: ../evaluate/按单词数生成/得分.csv