首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >DeepSeek 横空出世,爆火全球,再不了解和学习你真的就 out 了!

DeepSeek 横空出世,爆火全球,再不了解和学习你真的就 out 了!

作者头像
一个正经的程序员
发布2025-02-04 21:34:36
发布2025-02-04 21:34:36
1.1K0
举报

本文由 #公众号:一个正经的程序员 原创 作者:散淡样子 GitHub:https://github.com/LouisLiu00

前言

最近,所有人还沉浸在春节的氛围中,谁能想到一场悄无声息的 AI 大战已经拉开序幕!

前段时间,美国的一把山林大火,几个星期烧掉了 2500 亿。而 DeepSeek 的横空出世,犹如一场大火迅速蔓延,火到什么程度呢?当地时间1月27日,受中国人工智能初创公司——深度求索公司(DeepSeek)冲击,美国人工智能主题股票遭抛售,美国芯片巨头英伟达股价历史性暴跌 16.97%,纳斯达克综合指数大跌 3%,瞬间烧掉了近 6000 亿美元。

英伟达 (同花顺)

美国人吓坏了,可是美国人为什么这么怕 DeepSeek 呢?美联社称:让一些美国科技行业观察人士感到担忧的是,这家中国初创公司以极低的成本赶上了在生成式人工智能领域领先的美国公司。

那么 DeepSeek 究竟是什么呢?

01

DeepSeek(深度求索)

DeepSeek(深度求索),全称 杭州深度求索人工智能基础技术研究有限公司,是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能写代码、读文件、写作各种创意内容、整理资料和解决复杂的数学问题。

官网:https://www.deepseek.com

GitHub:https://github.com/deepseek-ai

DeepSeek 是一家创新型科技公司,成立于2023年7月17日,使用数据蒸馏技术,得到更为精炼、有用的数据。由知名私募巨头幻方量化孕育而生,专注于开发先进的大语言模型(LLM)和相关技术。

2024年1月5日,发布 DeepSeek LLM(深度求索的第一个大模型)。

1月25日,发布 DeepSeek-Coder。

2月5日,发布 DeepSeekMath。

3月11日,发布 DeepSeek-VL。

5月7日,发布 DeepSeek-V2。

6月17日,发布 DeepSeek-Coder-V2。

9月5日,更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ,推出 DeepSeek V2.5。

12月13日,发布 DeepSeek-VL2。

12月26日,正式上线 DeepSeek-V3 首个版本并同步开源。

2025年1月27日,DeepSeek 应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了 ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek 成为中国区第一。

2025年1月28日消息,DeepSeek 于服务状态页面公告称:近期 DeepSeek 线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录。

2025年1月,DeepSeek 在 GitHub 平台发布了Janus-Pro 多模态大模型,进军文生图领域。

02

DeepSeek-V3 的综合能力

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

图片来源 DeepSeek 官网

03

开源:未来的发展方向?

就在美国调查 DeepSeek 之际, DeepSeek 更是采用了完全开源策略,不仅降低了用户的使用门槛,还促进了 AI 开发者社区的协作生态。这对于目前以闭源和商业化为主的 OpenAI 的核心技术 ChatGPT 而言无疑是一个巨大的打击。

美国白宫顾问 David Sacks 公开表示,有“实质性证据”证明,中国 AI 公司 DeepSeek “蒸馏”(distill)了 OpenAI 模型。他把这种“蒸馏”行为,比作“偷窃”。同时,ChatGPT 的用户协议里明确写着,不允许用我的模型来训练新的模型,尤其是训练用来和我竞争的模型。也就是说,禁止“蒸馏”。用 ChatGPT,就要遵守 ChatGPT 的使用协议,这是诚信问题。

通过开源,DeepSeek 吸引了大量开发者和研究人员的关注,推动了AI技术的发展。英伟达 AI 科学家 Jim Fan 称赞 DeepSeek 是“真正开放的前沿研究,赋能所有人”。

当然,开源也面临着保护知识产权和开源社区秩序维护等挑战。开源只是一种商业模式,即便开源项目也拥有版权。开源与闭源之争,实质上是不同商业模式在特定场景和时代背景下的有效性对比。

04

股市动荡

英伟达的暴跌对整个市场造成了冲击,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%

相比之下,A股的上涨势头非常凶猛,中国时间1月27日,拓尔思上涨+17.79%,飞利信上涨+14.25%,华金资本上涨+10.01%,浙江东方上涨+9.94%,科大讯飞上涨 +1.73%,A股股民们也是钱包鼓鼓的过了一个好年。

股市有风险,投资需谨慎!

05

总结评价

DeepSeek 的成功确实让人振奋,但是我们也必须清醒地认识到,我们跨了一大步之后也还只是缩小了和美国 AI 的差距,而不是全面超越,更不是遥遥领先。但从整个 AI 大模型产业来看,DeepSeek 的成功或许代表了一种全新的发展方向,通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为 AI 大模型产业的发展提供了新的思路。

对此,你有什么感想,欢迎在评论区讨论!

文章部分内容引用以下文章:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一个正经的程序员 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 01
  • 02
  • 03
  • 04
  • 05
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档