超越ChatGPT,国产应用DeepSeek登顶苹果美国区免费APP下载排行榜
创始人
2025-01-27 20:01:07
0

  1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

图片

  苹果美国区应用商店

图片

苹果APP Store中国区免费榜

  Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

  作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

  更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。

  英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明了直接强化学习是可行的。

  Jim Fan写道:“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

相关内容

热门资讯

何猷君:青年要把握大湾区机遇|...   中国青年报客户端深圳5月24日电(中青报·中青网记者 赵安琪)5月24日上午,2024文化强国建...
【国际漫评】鳄鱼的眼泪   近日,美国总统拜登在与以色列总理内塔尼亚胡的通话中,敦促以方采取措施,以减少以军行动对巴勒斯坦加...
欧盟驻华大使:看好欧盟和中国的...   中新社成都6月15日电 (记者 岳依桐)“中国很大,这片土地上总是充满机遇。”近日,欧盟驻华大使...
印尼鲁昂火山大喷发   中新社雅加达4月18日电 (记者 李志全)印度尼西亚北苏拉威西省一座火山持续喷发,它将一道红色的...
安理会就以伊冲突举行紧急会议 ...   当地时间4月14日,联合国安理会应以色列要求,就伊朗对以色列进行军事行动举行紧急会议。  中国常...
银行理财布局黄金资产   随着金价接连走高,银行理财也将目光对准了黄金。记者注意到,北银理财、招银理财、光大理财、兴银理财...
中国日报记者TikTok账号被...   导读   近日,CNN在节目报道中抹黑中国日报起底工作室记者为“AI人”。记者联系CNN要求更正...
昌响e文明|网络大V走进未来科...   中国青年网北京11月4日电(记者 安俐)近日,由昌平区委网信办主办、中国青年网承办的“昌响e文明...
交通银行黑龙江省分行国际业务部...   中新网6月12日电 据“清廉龙江”微信公众号消息,交通银行黑龙江省分行国际业务部原总经理王立宪涉...
南方有较强降水过程 内蒙古东北...   中新网5月11日电 据中央气象台网站消息,未来三天南方地区有较强降雨,关注局地强降雨可能引发的山...