DeepSeek震惊世界:团队没有“海归”,训练成本不到GPT的1/20
蓝鲸新闻 1 月 27 日讯(记者 郝妍)国产大模型 DeepSeek 超越 ChatGPT,登顶苹果中国和美国应用商店免费 APP 下载排行榜,成为了全球科技圈的热议话题。
DeepSeek 登顶苹果美国区免费 APP 下载排行榜
1 月 27 日,苹果 App Store 中国区免费榜显示,DeepSeek 站上首位。同时,DeepSeek 在美区苹果 App Store 免费榜从昨日的第六位飚升至第一位,超越 ChatGPT 及 Meta 公司旗下的社交媒体平台 Threads,以及 Google Gemini、Microsoft Copilot 等美国科技公司的生成式 AI 产品。
DeepSeek 爆火后曾出现两次宕机。
1 月 26 日,DeepSeek 曾出现短时闪崩现象。对此,DeepSeek 回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。
今日又有消息称 DeepSeek 服务状态页面显示,DeepSeek 网页 /API 不可用,目前正在调查该问题。
和国内 AI 公司背靠互联网大厂不同,DeepSeek 由量化对冲基金幻方量化运营。2016 年,幻方量化推出首个 AI 模型,第一份由深度学习生成的交易仓位上线执行。到 2017 年底,几乎所有的量化策略都采用 AI 模型计算。2023 年,幻方量化宣布成立创新性大模型公司 DeepSeek。
2024 年 12 月,DeepSeek-V3 首个版本上线,并同步开源,训练成本仅为 557.6 万美元,整个训练只需要 280 万个 GPU 小时。
1 月 20 日,DeepSeek 又正式开源 R1 推理模型。1 月 24 日,DeepSeek-R1 在 Chatbot Arena 综合榜单上排名第三,与 OpenAI 的顶尖推理模型 o1 并列。
从硅谷到华尔街,DeepSeek 掀起涟漪
DeepSeek 的影响迅速蔓延至大洋彼岸的硅谷。据澎湃新闻援引 Information 网站报道,脸书母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进旗下大模型 Llama。
DeepSeek 之所以引发科技圈关注最主要的原因在于其以极小的成本训练出能和 OpenAI 的 ChatGPT 一较高下的人工智能大模型。
据每日经济新闻报道,DeepSeek 的 R1 的预训练费用只有 557.6 万美元,仅是 OpenAI GPT-4o 模型训练成本的不到十分之一。同时,DeepSeek 公布了 API 的定价,每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元。这个收费大约是 OpenAI o1 运行成本的三十分之一。
受此消息影响,华尔街也作出相应反应。
据 21 世纪经济报道,美股大 V " THE SHORT BEAR "在社交媒体上表示,DeepSeek 创造了一个 AI 巨头们的痛苦时刻,而投资者必须对此敲响警钟。
"如果击败 OpenAI 所需要的金额是 5500 万美元(包括 5000 个 H800 GPU 和 500 万预训练费用),那么这个行业的商业化会比很多人预想的要快很多。"
1 月 25 日,AMD 宣布,已将新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上,该模型旨在与 SGLang 一起实现最佳性能。DeepSeek-V3 针对 Al 推理进行了优化。这对于在 AI 竞赛时代一直颇为风光的英伟达略显尴尬。
据财联社报道,本周一,在亚洲盘交易时段,美国股指期货大跌,而这背后的主要原因,可能就是华尔街人士们担心 DeepSeek 的 AI 模型可能会颠覆美国科技界。
与此同时,在日本东京股市,英伟达的主要供应商 Advantest Corp. 的股价一度暴跌了 8.6%。
本土阵容打造国产大模型黑马,实习生日薪最高上千元
1 月 26 日,《黑神话:悟空》制作人冯骥评价 DeepSeek:可能是个国运级别的科技成果。
而这一科技成果背后是一个完全本土化的阵容,据大象新闻报道,DeepSeek 团队不到 140 人,但 "人才密度" 极高,成员多是来自清华、北大、北航等顶尖高校的应届博士毕业生、在读生以及硕士生。值得一提的是,团队没有"海归",完全本土人才。
"我们的核心技术岗位主要由今年或过去一两年毕业的人员担任",DeepSeek 创始人梁文峰在 2023 年接受媒体采访时表示。
此前,DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉就曾被雷军以千万年薪招揽。
DeepSeek 爆火后,媒体也发现 DeepSeek 正在招聘。招聘网站显示,DeepSeek 的北京子公司正在招人,现共放出了 52 个岗位,包括深度学习研究员、核心系统研发工程师以及资深 ui 设计师等,均为 14 薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为 6 万元 -9 万元;除此之外,大部分岗位的起薪在 2 万元及以上。值得一提的是,该公司正在招聘实习生,AGI 大模型实习生的工资为 500 元 / 天 -1000 元 / 天,数据百晓生实习生为 500 元 / 天 -510 元 / 天。
从 OpenAi 横空出世,到 DeepSeek 以黑马之姿震惊世界,AI 时代一日一变,一切皆有可能。
热点资讯
- 赵丽颖怒斥假新闻, 杨紫片场举动引热议, 肖战再陷绯闻风波: 娱乐圈热点频现
- 饭都没吃被赶出白宫 美乌总统激烈争执
- DeepSeek震惊世界:团队没有“海归”,训练成本不到GPT的1/20
- 11月27日基金净值:金鹰红利价值混合A最新净值1.975,涨2.34%