3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。文章还率先披露了DeepSeek的理论成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”(一财科技)
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 相关阅读
接入DeepSeek!险企“狂飙”DeepSeek宛如一把钥匙,开启保险行业智能化变革的大门。
237 昨天 20:39
锐意探索,深度应用:安永中国的DeepSeek实践与观察(审计篇)安永中国深度参与人工智能技术的探索与应用实践,以领先技术驱动商业价值的创新变革。
41 昨天 12:49
DeepSeek风靡30天,我们总结了一份使用通识(文科生版)谁在定义“好内容”的新规则?
44 昨天 08:42
AI进化速递 | 腾讯混元新一代快思考模型Turbo S发布DeepSeek宣布开源Optimized Parallelism Strategies;腾讯混元新一代快思考模型Turbo S发布。
24 02-27 20:54
大科技板块交易额占比达44%,市场热议行情是否见顶大科技板块在春节假期后因DeepSeek和宇树机器人的影响,经历了一波上涨行情,尽管交易拥挤度高,但内在逻辑与过去两年不同,反映了中国科技创新的突破和产业变革,且有政策支持和市场趋势支撑,预计行情将持续。
227 02-25 15:17 一财最热 点击关闭