(资料图片仅供参考)
凤凰网科技讯 6月16日消息,凤凰网科技《浪潮》对话智源研究院黄铁军,黄铁军表示,要放弃用绝对的标准对大模型进行评价,因为它是生成式的人工智能,它可以产生无穷无尽的可能性。他认为,对于大模型的评价的目的不是从商业上去做,更多的是要评价技术,当下最重要的是训练模型所用的算法和技术。
凤凰网科技《浪潮》:现在各方各面的声音都很多。之前有企业家说10月要赶超GPT,也有企业家表示说赶超的都是吹牛。目前有没有国内外公认的标准,能评价大模型的性能优劣?我们到底如何去评判一个大模型?
黄铁军:首先我们要放弃用绝对的标准进行评价,因为它是生成式的人工智能,它可以产生无穷无尽的可能性,我们不能用一把尺子来完全确定下来哪个分更高一点。就像高考,你考99分,我考98分,你就比我强。我觉得这种评价是一定要有的,但是不能僵化的去评价大模型。
其实智源研究院本身就在做一个评测体系,这是我们国家新一代人工智能重大科技项目下的一个旗舰项目,是目前的一个核心任务。我们现在其实有能力,只要你发布一个模型允许访问,允许有API访问,我们马上就可以给出体系化的评价指标。但是我们做这个评价的目的不是从商业上去做,我们更多的是要评价技术。我认为现在用哪个模型,哪种模型更好,可能从商业上看各有各的一些考虑。但是我认为最重要的还是训练模型所用的算法和技术,这才是最重要的。
(责任编辑:马金露 HF120)关键词:
热门推荐
最新资讯