AI圈开年首炸:139位中国清北名校蠢才 创建一家
作者:[db:作者] 发布时间:2025-01-14 08:34
快科技1月12日新闻,据媒体报道,DeepSeek作为开年AI范畴的严重冲破,以其“国产之光”的新抽象震动了国内外科技界。这家AI创业企业以其奇特的团队形成跟出色的技巧成绩,成为了业界存眷的核心。从公然材料来看,DeepSeek的团队范围虽小,但气力不容小觑。其开创人梁文锋引导的团队仅有139名工程师跟研讨职员,比拟之下,OpenAI领有1200名研讨职员,Anthropic也有500多名。但是,DeepSeek凭仗一系列吸睛的标签,如“未追求外部融资”、“开创人囤卡大亨”、“团队成员均为清北等名校结业生”等,胜利在AI创业圈中锋芒毕露。2024年12月,DeepSeek宣布了最新的V3开源模子,该模子在评测中表示杰出,不只超出了阿里自研的Qwen2.5-72B跟Meta自研的Llama 3.1-405B等顶级开源模子,乃至能与GPT-4o、Claude 3.5-Sonnet等顶级闭源模子相媲美。值得留神的是,DeepSeek V3年夜模子宣布后便完整开源,且其练习本钱远低于同类模子。据SemiAnalysis数据表现,OpenAI GPT-4的练习本钱高达6300万美元,而DeepSeek-V3的本钱仅为其非常之一不到。别的,DeepSeek V3模子的练习是在2000块英伟达H800 GPU上实现的,这一数目远低于硅谷年夜厂广泛应用的多少十万块更高机能的GPU。这一成绩攻破了算力芯片对国产年夜模子的限度瓶颈,为创业团队供给了新的解法:即使在算力无限的情形下,应用高品质数据跟更好的算法,同样能练习出高机能年夜模子。OpenAI开创团队成员Andrej Karpathy发帖惊叹:DeepSeek-V3机能高过Llama3最强模子,且消耗资本仅非常之一,“将来或者不须要超年夜范围的GPU集群了”。Meta迷信家田渊栋赞叹道:“FP8预练习、MoE、估算十分无限的强盛机能、从CoT中提取以停止领导……哇!这是巨大的任务!”DeepSeek的开创人梁文锋对硅谷的赞叹并不觉得不测。他以为,这是由于DeepSeek作为一其中国公司,正在以翻新奉献者的身份参加到寰球AI技巧的竞争中。他指出,中国须要逐渐成为技巧的奉献者,而不是始终依附东方的翻新结果。梁文锋还夸大了中国AI开展须要树立本人的技巧生态,就像东方主导的技巧社区一代代发明出了摩尔定律跟Scaling Law一样。他以为,良多国产芯片开展不起来,恰是由于缺少配套的技巧社区跟前沿技巧的参加。公然材料表现,DeepSeek的母公司幻方量化是一家量化基金发迹的企业,与DeepSeek的用人作风类似,均重视外乡人才。DeepSeek在AI产物正式表态前,曾长时光外部孵化该产物,并应聘理科人才供给相干常识起源。这一奇特的过程使得DeepSeek在AI范畴自成一家,成为中国AI技巧翻新的佼佼者。【本文停止】如需转载请务必注明出处:快科技义务编纂:秋白
电话
020-66888888