DeepSeek 计划二月中旬发布新模型 DeepSeek-V4,有哪些 ...
DeepSeek这个新模型有很强的Coding能力 废话,DeepSeek v3.2就表现出了很强的Coding能力,当然也有用户反映Coding能力反而有下降,我觉得这说明DeepSeek v3.2还没有碾压性的优势,所以在一些个例上显得不如以前,但是v4大版本升级,还大概率应用元旦发布的mHC架构,Coding ...
DeepSeek - Reddit
Subreddit for the DeepSeek Coder Language Model
如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎
尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现上更加友好的量化方法对于训练稳定性的影响会有多大。
deepseek官网地址告诉我? - 知乎
DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9日),已经有很多科技巨头接入DeepSeek,比如英伟达、微软等等。 DeepSeek官网入口(PC端):
OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费后 ...
你可以把DeepSeek和OpenAI看作是平台型应用,免费但钱景无限,类似于微信、谷歌搜索,虽然现在体量和用户达不到,但趋势很明显。 这些平台型应用都是免费的,看不出有什么盈利的方向,但其实它们才是利润的黑洞。2011年微信刚出来的时候,腾讯市值三四千亿,如今微信出道十几年,腾讯成了 ...
DeepSeek 梁文锋旗下幻方量化 2025 年收益率 56.6%,如何 ...
DeepSeek 梁文锋旗下幻方量化 2025 年收益率 56.6%,如何评价这一业绩? 1 月 14 日,据彭博社报道,DeepSeek 创始人梁文锋旗下量化对冲基金去年取得了超过 50% 的收益率,进一步充实了 DeepSeek 的潜在… 显示全部 关注者 994
如何评价DeepSeek发布梁文锋署名论文,提出「条件记忆 ...
如何评价DeepSeek发布梁文锋署名论文,提出「条件记忆」及Engram记忆检索架构?有哪些亮点?
DeepSeek-V3.2-Exp版本更新,有哪些信息值得关注? - 知乎
DeepSeek V3.2,可以说是算法同学最想要、最符合直觉的top 2048 token的sparse attention了,然而,经历过这场适配才能知道,背后有多少infra的坑要踩。 太不容易了,三个时区的同学连轴转一个多礼拜,在DeepSeek提供了很多帮助的情况下,才把hopper kernel集成完了。