DeepSeek(深度求索)爆火背后那只“普通的小猪”

2025-03-28 21:51

    

  DeepSeek成立后,梁文锋率领团队攻坚克难,不竭取到手艺冲破。2024年5月,DeepSeek发布夹杂专家言语模子DeepSeek-V2,同岁暮,DeepSeek-V3问世,该模子采用立异的MLA架构(多头潜正在留意力机制)取MoE稀少布局,仅用2000块H800芯片、557万美元成本完成锻炼,机能却比肩GPT-4o,其长文本处置能力扩展至128k上下文,推理速度提拔至每秒60个token。2025年岁首年月,DeepSeek发布的R1模子,更是正在数学、代码、推理等方面比肩OpenAI的顶尖模子,且开源权沉,降低了AI手艺的门槛,以至超越ChatGPT,登上免费使用榜单第一位。

  取其他努力于快速贸易化的中国AI公司分歧,DeepSeek专注于“不走寻常”。他们的方针不是复刻ChatGPT。

  2008年,全球金融危机迸发,金融市场动荡不安,但梁文锋却独具慧眼,灵敏地捕获到了机械进修手艺正在量化买卖中的庞大潜力。他和团队起头堆集市场行情数据、金融市场相关数据及宏不雅经济数据,摸索利用机械进修手艺进行全从动量化买卖。这段履历不只为改日后的职业生活生计奠基了的根本,也让他对金融市场和人工智能手艺的连系有了更深刻的理解。

  1985年,梁文锋出生于广东湛江吴川的一个通俗农村家庭。他的父母都是小学教师,家道并不够裕。然而,梁文锋从小就展示出对数学和科技的稠密乐趣,正在奥数竞赛中屡获佳绩,成为世人眼中的“天才少年”。2002年,他以吴川市第一中学高考状元的身份,考入浙江大学电子消息工程专业人工智能标的目的。大学期间,他不只对计较机科学和数学连结着稠密乐趣,常常泡正在尝试室研究机械视觉,还公费采办零件拆卸设备,不竭提拔本人的实践能力。本科结业后,梁文锋选择继续深制,于2007年正在浙江大学攻读消息取通信工程硕士学位,他的结业论文聚焦于低成本摄像机的算法优化。此时的他曾经人工智能将是将来的成长标的目的,正在学术研究的道上不竭深耕。

  当大都人尚未认识到算力的主要性时,梁文锋便展示出了他的前瞻性目光。他斥资2亿元开办幻方AI公司,研发“萤火一号”锻炼平台,搭载1100块GPU显卡,于2020年投入利用,显著提拔算力程度。2021年,他又投入10亿元扶植“萤火二号”,配备万张英伟达A100显卡,进一步巩固领先地位。凭仗强大手艺实力取立异,幻方敏捷成长为国内领先的量化私募基金,办理规模冲破千亿,跻身亚洲最大量化基金之一,成为国内量化私募“四大天王”之一。

  5。梁文峰热衷于公益事业,官网披露公司员工“一只普通的小猪”小我捐帮1。38亿元,正在全国范畴内帮帮。

  十年寒窗无人问,一举成名全国闻。亦如DeepSeek的成名之,它的创始人梁文锋也正在这个春节成为“最火的咖”“最靓的仔”——获总理邀请加入座谈会,登上《》;家乡长者拉、立拱门欢送他回籍……热闹喧哗背后,让我们走进梁文锋的成长史。

  一个80后法式员正在搅动中国量化市场完成资金堆集后,似乎率领他的团队又回到了本来钟情的AI起点,但发生的能量正正在全球掀起骇浪。深究缘由,除了立异第一性准绳、性架构、努力于开源等了了的线之外,奇特的公司文化和人才计谋也为其供给了奇特的膏壤——DeepSeek一直连结着一个完全自下而上的组织布局,优先看创制热情而不是证书。他们的冲破性立异来自年轻的本土着土偶才——中国本土的应届结业生和年轻手艺人才,而非海外聘请。

  3。2023年,梁文峰进军通用人工智能(AGI)范畴,开办DeepSeek,专注于研究和揭秘AGI的更多未知消息。

  DeepSeek(深度求索)正在春节期间成为热议线%的用户用于制定旅行攻略、翻译外语等,约40%的用户用于进修麻将法则。

  2013年,硕士结业后的梁文锋即了创业之旅。他取同窗先是创立了杭州雅克比投资办理无限公司,正式投身量化投资范畴。2015年,他们又开办了幻方量化(后改名为浙江九章资产办理无限公司),并起头正在量化投资范畴崭露头角。

  2。创始人梁文峰曾是浙江大学电子消息工程专业人工智能标的目的的学霸,后投身量化投资范畴,创立幻方量化。

  4。除此之外,DeepSeek采用立异的MLA架构和MoE稀少布局,锻炼成本仅为557万美元,机能却比肩GPT-4o。

  幻方量化凭仗数字和人工智能手艺,敏捷正在量化投资范畴取得了显著成就。2016年,公司推出第一个AI模子,实现了所有量化策略的AI化转型。通过度析海量数据,幻方量化正在动荡的市场中逆势扩张,办理资金规模逐渐扩大。到2018年,幻方量化正式确立了AI为焦点的成长计谋,进一步深化AI手艺正在量化投资中的使用。幻方量化办理的资金规模冲破百亿元,成为中国最大的量化基金之一。

  然而,梁文锋的大志远不止于此。正在量化投资范畴取得庞大成功后,他将目光投向了更具挑和性的通用人工智能(AGI)范畴。2023年5月,梁文锋颁布发表进军AGI,同年7月开办了杭州深度求索人工智能根本手艺研究无限公司(DeepSeek),正式了他正在AI大模子研发范畴的新篇章。

  火到什么程度?大街冷巷,从科技快乐喜爱者到通俗,都正在谈论DeepSeek。社交上,网友纷纷晒出取DeepSeek的互动对话,从点评学校到锐评手机厂商的优错误谬误,皆可“DeepSeek”。超60%的用户用它制定旅行攻略、翻译外语、进修方言,约40%的用户用它进修麻将法则,为春节添加了不少乐趣……正在本钱市场,券商们也正在为DeepSeek“加班加点”,举办超60场演,以至大年节夜也未停歇。凭仗高性价比和开源立异,DeepSeek部门目标超越ChatGPT等国际巨头,被海外称为“来自东方的奥秘力量”。

福建志伟信息技术有限公司


                                                     


返回新闻列表
上一篇:科大讯飞新专利:智能填充消息手艺引领AI使用新 下一篇:中移最新专利:AI手艺帮力API风险办理新体例