相关功能测评,零一万物新旗舰模型 Yi-Lightning超越 GPT-4o
kiki 2024-10-18 11:54:14 浏览:310
10月16日消息,在辟谣“不做大模型预训练”后,今天零一万物CEO李开复正式发布最新旗舰模型 Yi-Lightning。
在国际权威盲测榜单LMSYS 上,Yi-Lightning 超越硅谷知名大模型 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。
这也意味着零一万物紧随 OpenAI、Google 之后,与xAI 打平,进击全球前三大模型企业。
有两家公司让我挺疑惑的,一家是Kimi,另一家就是零一万物,其他的互联网大厂或者AI创业公司,一般很多年前就开始投资AI,有些做出了成果,有些啥也没做出来。但是这两家公司,之前没听说做过跟AI相关的事情,随着OpenAI发布GPT,这两家在一两年时间就做了起来,广告铺天盖地,好像瞬间就很牛逼了。这是什么原理?
话不多说,我们来试用一下零一万物的产品吧。界面分为开发模式和聊天模式。
开发模式咱也用不到,我们试试聊天模式,小编问了一个问题:Agentic AI 与 AI Agent的区别。下面是零一万物给的答案。
我们将同样的问题给文心一言,下面是给出的答案:
回答的结果大家已经看出来了,零一万物的回答暂不足以明确的区分两个名词的定义,还是模糊不清的,文心一言的回答虽然有些欠缺,但相对来说能看出两个名词的不同。百度的大模型也许并不怎样,但百度的优势是搜索引擎技术和多年内容积累了庞大数据。
榜单有时候对评判一个模型的性能有一定帮助,但最终,还是看实际使用的情况。毕竟实践出真知,使用的用户才能给出有用的评价。