电子产业一站式赋能平台

PCB联盟网

搜索
查看: 109|回复: 0
收起左侧

漫谈DeepSeek——平常心 看成功

[复制链接]
匿名  发表于 2025-2-10 18:36:00 |阅读模式
漫谈DeepSeek“平常心 看成功”

蛇年新年科技界最火的话题,莫过于国产大模型DeepSeek了,真的是既提气又打脸。提气的是中国人自己做的大模型成本更低,效率更高,能结合深度推理和联网搜索,并且直接开源,打脸的是,之前融资融得甚嚣尘上的那几家企业并没有能够拿出比DeepSeek更有说服力的产品,这充分证明了部分投资人投资的并不是行业本身,而是在玩击鼓传花的游戏。

DeepSeek的技术创新,本人在此不再赘述,网络上专业人士已经写了很长的文章进行解答,DeepSeek的产品创新,是通过将深度思考和联网搜索结合起来,这样可以很好地解决大模型由于数据更新不及时导致的热点知识缺失问题,并且,本人合理猜想DeepSeek应该对检索得到的信息也进行了深度分析以确保其准确性。DeepSeek的本质,是一个通过技术和工程方式创新后获得的更精简,更高效的人工智能大模型,并且破除了做大模型必须使用CUDA的定律,以后计算机系的老师给学生讲解汇编和高级语言性能差异的时候,就可以用DeepSeek举例。

但是DeepSeek依然还面临着如下的几个问题,第一个就是我经常谈到的商业化问题。和部分技术作者写一篇洋洋洒洒的文章来证明自己懂市场不同,我一般只会问一个问题,那就是:赚钱了吗?如果没有,准备怎么赚钱?哪怕是网友开玩笑说的,帮助母公司的量化基金做空英伟达赚钱也算,只要能复制能长久都行,我本人非常乐意看到DeepSeek和游科合作开发次世代AIGC 3A大作。第二个是准确度问题:在专业应用领域,特别是Mission Critical的领域,是不能容忍AI的臆想行为的,一百次里有一次都不行,比如下图这样就不行↓。




哪怕是作为增强版搜索引擎使用,如果出现了类似的错误,也会给用户带来困扰,毕竟传统的搜索引擎是只提供结果不提供结论,用户自己甄别搜索结果。第三是目前中国面临的最头疼的问题:供应链问题,假设一下,如果川普现在立刻宣布,禁止任何一片GPU芯片流入中国,甚至禁止任何一片GPU芯片流出五眼,会怎么样?OpenAI们毕竟有装备上的优势,在DeepSeek开源后,它可以进一步开发更新自己的模型。我们目前的状态是,有优秀的应用公司,有优秀的芯片设计公司,如华为海思,有好的政策和便宜的电能,但是没有光刻机,没有全国产先进制程生产线。美国让这个不应该被政治化的问题政治化了,那我们就得跟,不跟上,像DeepSeek们这样优秀的应用企业就会变成无源之水,空中楼阁。

有人讲,DeepSeek突破了美国AI领域的护城河,其实,美国真正的护城河是几十年基础科学和工程技术的领先映射出的半导体科技的领先,并不是模型的领先,模型是应用的实体,其本质是算法+语料,美国真正领先的是TSMC+Cadence+Nvidia+……(我们可以把TSMC认为是美国实控)。只通过模型来封锁中国是一件可笑的事情,就像拿着本大英百科全书向全世界宣布这本书不给中国人看一样可笑。模型是封不住的,且大模型的突飞猛进是必然的事情,大模型是人类信息化,互联网化的结晶,从三十年前开始的互联网时代积累了大量的数字资产,这么多数字资产一定需要一部能将其提炼结晶的“百科全书”,并能以最快捷最方便的方式供每个人查阅,这本书,现在看来就是大模型,至于这本书有多厚,有多少干货,准不准确,其实看的各位编辑的能力,大英百科肯定就比什么印度韩国越南百科要强得多。美国的奥特曼前两年写了本好书叫GPT,全世界兜售,非常牛,现在中国的梁文锋老师写了一本更好的书叫DeepSeek。但无论是谁胜谁,本质上还是在总结和挖掘人类产生的数字化资料,适合解决人类已知领域内的问题,并且可以利用其资料产生一些人类不曾产生过的文字类的创作,并不能形成突破,并不能创造出一些新的东西,大模型目前看来,还是以Copilot为主要应用落地场景,我可以说,铁云文摘还能挺立好几年,甚至永远都不会被大模型超越。对于DeepSeek的成功,我们不应该感到太过意外,也不用感到太过了不起,当然,我们得承认DeepSeek确实很了不起。

正如开头所说,DeepSeek的成功,并不能掩盖部分大模型初创公司即将面临的困境,烧钱烧完了没赚到钱就是死,至于寄希望于和那些大模型公司一起成长的芯片公司,约等于把希望寄托在一群泥菩萨身上,一起过江的后果可想而知。商业的本质是赚钱,赛道炒热了得趁热变现,光融资是不够的,并不是所有公司都有某AI芯片上市企业那样的运气,可以在股市上开个杀猪盘。其实大模型是个好赛道,比芯片容易赚钱多了,比如,用在Pornhub和游戏上就挺好,至少能赚钱,赚到钱了才有足够的时间和资源去讨论技术问题。

至于目前国内相对于应用较弱的芯片行业,也是个需要长期投资的赛道。这里说的不是ASIC类芯片,而是真正的通用芯片。并且DeepSeek的成功告诉我们,应用公司最好得有个懂芯片底层的专家,不说能把应用优化到DeepSeek这个水平,至少可以让显存不那么容易泄漏,当然,芯片公司也一定要有一个懂应用的专家,从infra层一竿子插到最终应用层的那种,还得向DeepSeek学习,要开放,芯片公司和合作伙伴一起深度开发,能够极大促进行业的良性循环。国内芯片公司总喜欢敝帚自珍,这个不公开那个不公布,生怕别人给学了去,比如说某ai芯片上市公司,做的东西跟诈骗似的,还藏藏掖掖,但芯片是很难仿制的,以我自己为例,我现在完全了解GPU的架构,但是让我拉起个团队来做个5090,哪怕是台积电给我大开绿灯我也做不到,其本身的工程量和Knowhow是很难逾越的鸿沟。芯片公司不应该埋头挖自己的所谓护城河,而应该和生态伙伴一起建设金字塔。

希望大家都能以平常心看待DeepSeek的成功。
希望国内出现越来越多像DeepSeek这样的团队。
祝大家新的一年,事业有成!



END

作者:铁云欢迎关注铁云文摘

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表