
资料来源:36krish两排在西部有Ultraman,东部有Liang Wenfeng。 Zhao Jinjie的编辑| Wang Jing来源list列表(ID:Wujicaijing)封面源| DeepSeek官方网站“每个人都知道Wenfeng”。这句话可能足以描述Liang Wenfeng今天在AI圈中的地位:媒体可以找到访问的方法,而投资者无法一路预订。 DeepSeek流行后,北京Rongke信息中心和Hangzhou Huijin International Building在此发现了一段时间的研发团队,到处都是媒体和投资者,甚至许多网民都在Xiaohongshu的入住办理登机手续入住入住登机手续入房点被压迫。所有这些都是由于DeepSeek R1的释放所致。 1月20日,在DeepSeek正式发布R1推理模型后,性能与OpenAI O1相当,它直接引发了大型模型行业的研究重点,并从Previo中移动美国GPT模型与推理模型。 Liang Wenfeng和DeepSeek R1的到来将新的AI时代切成了两个不同的时期,除以两个主要里程碑(里程碑)节点:一个是Chatgpt的出现,另一个是新的DeepSeek R1模型的发布。各种节点的公司开始发展新的AI尴尬变化。国内外的许多主要AI制造商开始专注于理解模型,而国内主要技术的制造商在DeepSeek的影响下增加了对C端应用程序的投资。训练Liawenfeng领导的大型模型的低成本方法使DeepSeek成为NVIDIA的最大卖方:资本市场开始怀疑NVIDIA代表的高端计算能力芯片是否会具有新的泡沫,而相对较小的计算能力可以实现模型性能,而不是低于OpenAI。上述担忧是在DeepSeek R1发行后的1月27日的1月27日达到顶峰,导致NVIDIA的股票近6000亿美元。 Liang Wenfeng坚持NVIDIA创始人Huang Renxun在公开场合多次强调Deviceek并没有降低对计算强度的需求,而是进一步增强。但是Huang Renxun的问题不仅如此。低模型Liang Wenfeng训练的低训练方法意外地使中国对H20芯片的需求。从那以后,2023年,H20芯片是最强的AI芯片,其NVIDIA可能会在法律上出口到中国。但是在DeepSeek的影响下,4月,美国在这里施加了新的控制控制许可证,并禁止其在中国市场的销售。 NVIDIA在一份报告中正式披露,限制将造成高达55亿美元的额外损失。但好消息是,黄伦Xun正在促进新一代中国特殊筹码的发展。最近,据路透社报道,NVIDIA知道中国主要客户计划推出修订后的H20芯片版本In 7月。从模型到芯片的应用,Liang Wenfeng和DeepSeek强度会产生影响整个工业链的震惊。 2024年12月,Kanyang Friend Circles通过了Liang Wenfeng Ayang的帖子,文本是文艺复兴技术公司的创始人詹姆斯·西蒙斯(James Simmons)的传记的序言,“征服了市场的人:Simmons的传记:Simmons”,他读到,“ Simmons很幸运,他很幸运。” Liang Wenfeng无疑是幸运的,他发现了一个人工智能时代可以照在他身上。现在,随着R2模型的临近,整个行业都期望Liang Wenfeng带来的新惊喜。在R1发布之前,Liang Wenfeng实际上为该行业带来了两个热门讨论。 2023年4月,私募股权股票量huanfang卷发布了一份公告,指出它将专注于资源和优势,致力于人工智能技术,建立一项新的独立研究ORGA ORGAnization和探索Agi(一般Artipisa Intelligence)。一个月后的2023年5月,该组织被评为“ Deep Search”,并发布了其第一个模型DeepSeek V1。当时,“ Finance 11”报道说,有超过10,000 GPU的中国公司不超过5家。 DeepSeek是其中之一,它开始引起外部关注。到2024年5月,DeepSeek在巨大的模型价格战争的帮助下再次闻名。当时,DeepSeek发布了Open DeepSeek V2源模型的模型,这是该行业第一个降低价格的模型,降低了每百万个令牌1元的成本,约为七个GPT-4 Turbo。随后,Byte,Tencent,Baidu和Alibaba等主要制造商遵循了诉讼。中国大型价格战争就是这样。但是,尚未启动应用程序的Liang Wenfeng在大型循环行业中发表了许多声音,而主要的主要技术制造商吸引了更多的关注。在受到欢迎之前,Liang Wenfeng渴望受到投资机构的青睐,但是在寻找各种投资者组织的人之后,许多VC提供了投资Liang Wenfeng的可能性,因为他们看不到商业前景。但是,在DeepSeek的知名度下,Liang Wenfeng一直是许多投资机构的荣誉嘉宾,他仍然是无法邀请的那种。尽管一直声称不投资大型型号的朱小胡(朱小胡胡)在体验新的Depsek模型后将参加。值得一提的是,DeepSeek的受欢迎程度并没有改变Liang Wenfeng的低调的通常风格。在建立DeepSeek之前,作为Huanfang定量的创始人,Liang Wenfeng在很长一段时间内都没有在幕后看到,外界一直认为该公司的主要高管只与另外两个联合创始人在一起。尽管他因索发现而在一夜之间出名,但梁温芬仍然养成阅读论文,编写代码并参与日期至日讨论的习惯。 DeepSeek尚未促进一群公共关系,他主要是通过在社交媒体和DeepSeek微信沟通小组上设立的官方帐户对外界讲话的。自1月20日DeepSeek R1发布以来,Liang Wenfeng唯一的公开露面是在新闻广播中,其余的参加了私人研讨会商人。尽管很少出现,但它已经通过了国内外科手术,作为熟练的大亨在公共场合总是活跃。但是,与硅谷人民(如马斯克和Ultraman)询问DeepSeek和Liang Wenfeng不同,这家国内技术巨头几乎都表现出了他们对DeepSeek的拥抱以及对Liang Wenfeng的欣赏。马·霍腾(Ma Huateng)通过访问DeepSeek获得了最大的股息之一,他在谈论Liang Wenfeng时说:“我佩服独立和开放源的产品的出现在市场上。我们尊重他们的尊重。 “当然,Liang Wenfeng包括Zhang Yiming,Li Yanhong,Cai Chongxin ... Liang Wenfeng,包括注意力的知识。投资选择了一系列的资金来扩大资金,以衡量货币的机会。未来,或者要从B-End和C-End执行不断增长的客户需求,Liang Wenfeng需要使用更多的钱来生产更多的计算资源2月,还报道说,阿里巴巴以100亿美元的价格对阿里巴巴表示赞赏,并投资了DeepSeek拥有10%的股份,但阿里巴巴拒绝了它。但是,根据中国投资网络的新闻,DeepSeek实际上当时正在与一些投资者联系,希望以80亿美元的赞赏寻求融资。当时,对六个国内AI龙的最高欣赏不超过40亿美元。但事实是,在成名的100天内,正式的DeepSeek API由于过度呼叫需求而曾经暂停了充电服务,并且该应用程序经常偶然发现了多次造成的服务。但是,除了团队的领导能力优化服务体验外,Liang Wenfeng没有显示出扩大计算能力的明确迹象,或者他没有追求用户规模的影响。融资是暂时持有的。它还生产了DeepSeek基本模型,今天不考虑商业化。它还需要添加一家,即尚未搜索外部融资的公司。与她对融资的犹豫相反,Liang Wenfeng继续练习开放资源。到2月底,Liang Wenfeng带领DeepSeek向外界证明了DeepSeek具有奇迹,其中有一个新开放的每周一次开放的资源,通过flashmla,deep沟通库,deepgemm和其他代码库,并揭示了一系列解决方案,可以为NVIDIA H的计算功率提供了一系列的解决方案,以供第一次使用NVIDIA H的计算功率。同时,Liang Wenfeng继续遵循计划中的节奏并抓住Agi的脚步。 Liang Wenfeng在内部计划中说,该团队将朝三个方向下注:一个是数学和代码,第二个是多模式,第三个是自然语言本身。 Liang Wenfeng在过去的100天中经常在这三条路径上移动。 2月18日,DeepSeek发行了e最新的技术角色,以挑战变压器架构关注的最基本机制,从而使其能够处理更好的环境。尤其值得一提的是,Liang Wenfeng的名字也将出现在上纸上的合着者。在本文中,DeepSeek提出的新的NSA体系结构(本地广泛关注)与整个注意力机制相比,基准测试的精度相同或更高。除了团队更改算法的领导能力外,Liang Wenfeng还促进了公司模型更新的速度。就语言模型而言,3月25日,DeepSeek V3模型完成了小型升级,并且启动了DeepSeek-V3-0324的新版本。该官员表示,它在推理活动中的表现提高了,中国写作能力和中国搜索也得到了优化。一个月后,新的数学和代码模型也到了,DeepSeek-Prover-V2也出现了。谚语-V2,即鳍DeepSeek-V3作为主要模型的E已在671b处扩大了其参数的ANG量表。与上一代版本的V1.5中的7B相比,参数量表增加了近一百倍,使数学试验的效率和准确性设定得更高。尽管Liang Wenfeng仍然可以保持自己的速度来促进模型更新,但AI在外界的发展速度是Deptseek。在Liang Wenfeng验证了低模型模型中成功的培训方法之后,AI行业开始分开两条进化路线:一个是继续遵守规模定律,大力追求奇迹,开发高的计算资源,并训练更强的大型大型大型模型;其余的将跟随梁文芬,为成本效益的想法开辟道路,并使用较少的映射来训练更强的特殊模型。专注于模型的两种主要进化途径,中国与美国之间的差异AI开发技术中的S进一步扩展了:硅谷AI的初创公司继续遵循扩展法,并为新的高点提供资金。此前,Openai宣布完成了一项历史悠久的400亿美元的新融资,最终是Musk的Xai,他听到了寻求200亿美元的新融资。相比之下,除Zhipu外,国内AI初创公司名为“ AI的六个小龙”,很少见到其他五家公司的融资新闻,除了Zhipu以赢得一些国有投资。常见的例子为零世界。 1月初,零One World的创始人Kai-Fu Lee正式说他要离开追求Agi。将来,该公司将专注于具有中小参数的行业模型。 “从商业角度来看,我们认为只有大公司才能继续制造超大型模型,”凯·菲·李(Kai-Fu Lee)说。 DeepSeek受到流行后,Kai-Fu Lee将该公司定位为开发AI应用程序的公司。其他 ”AI six Tigers" players have also been hit to different degrees: the dark part of the moon has suspended large -scale advertising, and the approach will be heartbroken with the underlying model optimization; Minimax and Jieyuexing are currently exploring new agent -related applications; The Baichuan Intelligent Business is dedicated to medical care; Zhipu AI focuses on government, finances and other market activities. TheGiant domestic technologies no longer tell AI的故事奇迹般,但与Liang Wenfeng竞争,Robin Li在4月份的演讲中命名为DeepSeek除了拥抱Liang Wenfeng之外,巨型技术的更大野心是克服Liang Wenfeng。直观的表现之一是,除了连接DeepSeek之外,主要的技术制造商还提高了SAR开发模型中的决心。从Openai到DeepSeek,AI大型模型公司可以继续改变的原因更为重要,因为它们依靠一群才华横溢的年轻人。 DeepSeek的创始人Liang Wenfeng正在守护人才组织,因为他对Agi战争的吸引力,而不是封闭的资源,也没有招募该行业的领先才能。对年轻人思想的变化的信心和信念一直是Liang Wenfeng对这一群体的青睐。如今,包括Byte,Tencent,Alibaba,Meituan和JD.com在内的主要技术公司也希望吸收对自己公司中年轻人的创新信念,从而开始他们的“天才男性”招聘计划。但是在巨型技术追逐梁·温芬之前,整个行业都是惠丁G为Liang Wenfeng带来自己的才华横溢的男孩发行新的R2模型。 Reference: "Ideal AI Talk Season 2 Record Record Record" Ideal Auto "DeepSeek-V3 Model Update, all capabilities are comprehensively advanced" Deepseek "The Liang Wenfeng I have a" smart investor "who became a neighbor with DeviceEk" investment world "The 1st anniversary of the serialization of Zhu Xiaohu's Zhu's serialization of Zhu's serialization of Zhu's Zhu's serialization of朱的Zhu Zhu序列化。