使用 OpenCompass 评测 InternLM2

使用 OpenCompass 评测 InternLM2
为了准确和公正地评估大模型的能力，国内外机构在大模型评测上开展了大量的尝试和探索。斯坦福大学提出了较为系统的评测框架HELM，从准确性，安全性，鲁棒性和公平性等维度开展模型评测。纽约大学联合谷歌和Meta提出了SuperGLUE评测集，从推
使用 OpenCompass 评测 InternLM2
admin1月前
260