刚才,DeepSeek发布了“ Ultimate Edition”!
发布时间:2025-09-24 09:39
Zhidongxi May -set | Chen Junda编辑| Li Shuiqing DeepSeek再次更新了! Zhidongxi在今晚9月22日报道说,DeepSeek发布了官方API平台上最新升级的DeepSeek-V3.1-Terminus模型(Terminus latin的终点和边界),并宣布该模型将很快开放。官方文件指出,在保持原始模型功能的同时,DeepSeek-V3.1末端具有增强的语言一致性,偶尔的异常字符以及在DeepSeek-V3.1之后发生的其他错误,并进一步优化了编程和搜索剂的性能。 DeepSeek正式发布了与微信的官方帐户中的新旧和新DeepSeek-V3.1的基准测试的比较。显然,与DeepSeek-V3.1相比,在不是代理的基准评论中,de Achievemementepseek-V3.1-terminus的绩效提高了0.2%-36.5%,但一些测试分数也略有拒绝。 DeepSeek-V3.1-Ter减去性能改善是最引人注目的HLE(最终人类测试),它主要以高难度和多模式,深层推理和其他模型功能评估专业知识水平。正如代理商所评估的那样,DeepSeek-V3.1末端在浏览网络,简单的问答和许多编程测试时的性能显示出一些改进。 DeepSeek,网页,迷你程序和DeepSeek API模型的官方应用已与Deptseek-V3.1-ensinus同步。 Zhidongxi立即将DeepSeek-v3.1-terminus API命名为体验它,试图重现许多以前的错误并体验最新的模型性能。开源来源:https://huggingface.co/deepseek-i/deepseek-v3.1-rminushttps://modelscope.cn/models/models/deepseek-i/deepseek-i/deepseek-v3.1-rminus1。丢失了两个神秘的虫子,而DeepSeek-V3.1终于并没有愚弄自己。今年八月,在DeepSeek-V3.1启动之后,一些用户报告说调用模型时使用API​​,有时会出现一个严重的错误:模型是“极端”,“激烈”等单词的随机输出,这严重影响了日常使用。如果在未经仔细检查的情况下使用包含此错误的代码,则可能会导致完整性故障。 ▲DeepSeek-V3.1的“极端” bug(照片来源:Zhihu@fun10165)ehidongxi被称为最新的DeepSeek-v3.1-terminus api,以试图复制上述问题。可以在线复制此问题的“高风险”单词包括建模模型编写GO语言,完成与版本,处理时间等相关的任务。▲DeepSeek-V3-terminus不会因为“高风险”的提示单词而导致错误。一些在国外的用户还报告说,以前的DeepSeek-V3.1存在多种语言问题,尤其是在翻译小语言时。 Reddit Netizen分享说,DeepSeek将混合中文,英语和俄罗斯语言,问题文本的比例可以达到5%。 ▲网民分享了DeepSeek-V3.1的多语言问题(照片资料来源:reddit @kitano_o)zhitou试图让DeepSeek-V3-ensinus将这句话翻译成7种小语言:“人工智能改变了我们的世界,它带来了很大的机会,我们需要思考世界,它也会使我们认真地给我们带来很多认真的方式。 2。球以惊人的惊人弹跳,也可以迅速越过搜索信息。除了修复错误外,DeepSeek-v3.1-endinus还有另一个重要的事情要注意改善编程和搜索剂的功能。在编程活动中,Zhitiao要求DeepSeek-V3.1末端测试球反弹,结果如下。该模型网页的输出采用了简单的样式,但是模拟的重力和摩擦效果非常现实。为了创造这种效果,该模型不仅需要强大的编程技能,而且还具有开除的能力rstand物理。该模型创造的动画的影响也很好,轨迹和碰撞相对自然:就代理商搜索Morera的能力而言,我们要求DeepSeek-V3.1-ensinus推荐一些适合新手阳台植物的植物。该测试检查模型是否可以找到完全满足所有条件的植物,例如“阳台种植的植物”,“快速生长”,“吃了原始”和“对儿童安全”。此外,该模型应交叉验证信息的可靠性,并包括和完善和风险警告。如您所见,完全考虑了DeepSeek-V3.1末端提供的答案,并且在手动验证后的事实是正确的,并且阅读能力也很好。结论:DeepSeek-V3.1,激励最终版本? DeepSeek-V3.1-endinus中的“终端”是指拉丁语中的“终点”或“边界”。我们试图让DeepSeek理解此名称本身。 Deepseek说,这个命名可能象征着DeepSeeK-V3.1是该系列体系结构的最终版本,它代表了当前技术路径的成熟度和改进。一些网络还认为,减去Terang可能意味着该模型在编程终端的性能更好。但是,正如DeepSeek所说,解释的具体定义应准确地解释。此前,一些互联网媒体报道说,DeepSeek将在今年年底之前推出代理模型。也许,下一个重大的DeepSeek更新并不遥远。回到Sohu看看更多
购买咨询电话
400-123-4567