原标题:DeepSeek首创东说念主梁文锋回湛江过年新澳门六合彩开奖记录,家乡拉横幅接待打卡旅客
近日,火爆海表里的DeepSeek首创东说念主回到家乡湛江米历岭村过年。1月30日,羊城晚报记者从其同乡处获悉,梁文锋于1月28日(大除夕)回到米历岭村过年,1月29日(大年月朔)上昼离开家乡。


梁文锋回湛江过年,家乡拉横幅接待打卡旅客(视频截图)
该同乡示意,这几天有许多旅客到村里来拍照打卡,骆驿接续。为此,当地还在村口拉上了横幅以表接待。
同乡梁文惠与梁文锋同辈,亦然学友。他回忆,梁文锋从小就瑕瑜常智慧、有天禀的东说念主,“咱们以前皆知说念,他(梁文锋)初中就学完高中的数学了”,“但他相比内向,过年过节回家一般也不奈何外出”。
据此前报说念,2002年,17岁的梁文锋考上浙江大学本科电子信息工程专科。大学时期,梁文锋与同学沿路运行累积阛阓行情数据和探索全自动量化交游。
2023年,梁文锋创立DeepSeek(深度求索),2025年1月27日,DeepSeek一度登顶苹果中国地区和好意思国地区行使商店免费APP下载名次榜,以致被外洋称为“来自东方的玄妙力量”。
2025年1月28日,据央视新闻,DeepSeek一霎遭遇大皆外洋错误。DeepSeek官网自大,其线上服务受到大限制坏心错误。奇安信安全大众涌现,此次受到的网罗错误,IP地址皆在好意思国。
文|记者 赵翊辰
蔓延阅读
国产大模子公司深度求索(DeepSeek)首创东说念主梁文锋参加了总理谈话会。
据新华社报说念,中共中央政事局常委、国务院总理李强1月20日下昼主抓召开大众、企业家和教科文卫体等规模代表谈话会,听取对《政府干事呈报(征求主张稿)》的主张忽视。谈话会上,张辉、任少波、刘珺、梁文锋、魏洪兴、陈学东、陈红彦、杜斌、邹敬园等先后发言。
其中,梁文锋恰是头部量化私募幻方量化首创东说念主、DeepSeek的首创东说念主。

梁文锋参加总理谈话会(视频截图)
低调的“量化天王”
梁文锋“发迹”于量化投资新澳门六合彩开奖记录。
当作又名“80后”,梁文锋本科、盘考生皆就读于浙江大学,领有信息与电子工程学系本科和硕士学位。
2008年起,梁文锋就运行指导团队使用机器学习等手艺探索全自动量化交游。2015年,幻方量化崇拜成立,2019年,其资金处分限制就打破百亿元。
2019年,梁文锋在当年的金牛奖受奖典礼上,发表主题演讲《又名关节员眼里中国量化投资的将来》,这是他有数的公拓荒言。
在演讲中,梁文锋指出,量化与非量化的判定递次即是在投资决议的流程中,是用数目化阵势进行决议的,照旧用东说念主进行决议的。量化公司是莫得基金司理的,基金司理就一堆服务器。
“当作私募,投资东说念主对咱们的生机是很高的,如果一年跑赢指数低于25%,投资东说念主是不称心的。”梁文锋指出,量化投资如故赚了手艺面派系原本赚的钱,将来也要篡夺基本面派系原本赚的钱。
演讲终末,梁文锋说,幻方量化的责任即是提高中国二级阛阓的灵验性。
2021年,幻方量化成为国内首家打破千亿限制的的量化私募大厂,被称为国内量化私募“四大天王”之一。不外,就在这一年,由于事迹波动,幻方量化关闭了全部召募通说念,并在12月底发布致投资者公开信,致歉称“幻方事迹的回撤达到历史最大值,咱们对此深感傀怍”,究其原因,主如果AI的投资决议在贸易时点上莫得作念好,阛阓作风剧烈切换的时期,AI会倾向于冒更大的风险来博取更多收益,进一步加大了回撤。
而后,幻方量化渐渐镌汰其资金处分限制。2024年10月,幻方量化还向投资者发布公告称,打算冉冉对冲居品投资仓位镌汰至零。
“短期内莫得融资打算”
梁文锋关于AI的意思意思早就有迹可循。
2016年10月21日,幻方量化推出第一个AI模子,第一份由深度学习生成的交游仓位上线实施,使用GPU进行策划。2017年,幻方量化声称结束投资计策全面AI化。
幻方量化官网自大,其在2018年就成立以AI为公司的主要发展标的。
2020年运行,幻方累计投资超亿元、占大地积特地于一个篮球场的AI超等策划机“萤火一号”崇拜干预运作,堪称不错匹敌4万台个东说念主电脑的超等算力。2021年,幻方干预十亿竖立“萤火二号”,以“任务级分时分享”为核激情念,调和系统秒级响应,平台配备浩瀚的软件层支撑:高性能算子库(hfai.nn)、散布式检修通信框架(hfreduce)、专为AI拓荒而生的大容量高带宽文献系统(3FS),让AI模子能自如拓展到多节点之上,进行大限制并行检修,算力扩容翻倍,集群连络满载运行,平均占用率达到96%以上。
2021年,在梁文锋参与的论文中提到,他们正在部署的萤火二号系统,“配备了1万张A100GPU芯片”,在性能上接近DGX-A100(英伟达推出的东说念主工智能专用超等策划机),但资本镌汰了一半,同期能耗减少了40%。
那时国内首先1万枚GPU的企业不首先5家,何况除了幻方量化除外,其他4家公司皆是互联网大厂。
整体上,这些小人物并不是判断你是否拥有“像人类一样的智能”,而经常是通过鼠标的移动轨迹等其他方式来确认用户的真实性,因此一些厉害的机器人可以破解它们。但是,它们有些无聊了——而一位科技公司的老板也有类似的想法。
这背后需要极其浑厚的财力支撑。
2023年头,幻方量化示意,以前的几年,幻方量化及职工每年拿出收入的一部分干预公益,回馈社会,累计捐赠首先5.8亿元。其中,2022年,职工“一只往常的小猪”个东说念主就向慈善机构捐赠1.38亿元,那时的音信指出,这个东说念主即是梁文锋。这从一个侧面反应出了幻方量化和梁文锋本东说念主的“不差钱”。
幻方量化曾示意,多年以来,该公司坚抓把营收的大部分干预东说念主工智能规模,竖立首先的AI硬件基础设施,进行大限制的盘考,探索东说念主类未知的高明,“咱们敬佩险些通盘的翻新皆是从神勇尝试和点滴累积中生长而来。”
梁文锋在为数未几的对外发声中雷同也提到“短期内莫得融资打算”,并合计当底下临的问题“从来不是钱,而是高端芯片(短缺)”。
“AI界拼多多”
2023年7月,幻方量化通胜利立大模子公司DeepSeek,崇拜进击通用东说念主工智能规模。据报说念,DeepSeek包括首创东说念主梁文锋在内,仅有139名工程师和盘考东说念主员。与之对比,OpenAI有1200名盘考东说念主员,Anthropic则有500多名盘考东说念主员。
只是不到一年的2024年5月,DeepSeek就发布了DeepSeekV2,因为翻新的模子架构和史无先例的性价比,火爆出圈。DeepSeek-V2的API订价为每百万tokens输入1元、输出2元,价钱仅为GPT-4 Turbo的百分之一。
关于为何能作念到如斯高的性价比,DeepSeek官方评释注解称,DeepSeek-V2摄取了翻新的架构,举例留神力机制方面的MLA(多头潜在留神力)和前馈网罗方面的DeepSeekMoE架构等,以结束具有更高经济性的检修后果和更高效的推理。
因此, DeepSeek被称为“AI界的拼多多”,激发了字节、阿里、百度等大厂的大模子价钱战,纷纷通知大模子居品降价。彼时,梁文锋在接受媒体采访时称,DeepSeek意外成为行业鲇鱼,廉价背后是但愿算力普惠。
2024年12月27日,DeepSeek-V3更是横空出世,火爆群众。据DeepSeek官网自大,其评测收获不仅卓绝了Qwen2.5-72B(阿里自研大模子)和Llama 3.1-405B(Meta自研大模子)等顶级开源模子,以致能和GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模子)等顶级闭源模子一较上下。
DeepSeek通知上线并同步开源DeepSeek-V3模子除外,还公布了长达53页的检修和手艺细节。得回大幅升级的V3模子是在一个“难以念念象”的预算下检修完成的:通盘检修仅毒害了557.6万好意思元,在2048块英伟达H800 GPU(针对中国阛阓的低配版 GPU)集群上运行55天完成,仅是OpenAI GPT-4o模子检修资本的不到十分之一。
“中国也要冉冉成为孝顺者,而不是一直搭便车。”梁文峰在接受媒体采访时说,“咱们如故民风摩尔定律从天而下,躺在家里18个月就会出来更好的硬件和软件,Scaling Law(限制定律)也在被如斯对待。但其实,这是西方主导的手艺社区一代代好学不厌创造出来的,只因为之前咱们莫得参与这个流程,以至于忽视了它的存在。许多国产芯片发展不起来,亦然因为阑珊配套的手艺社区,惟有第二手音信,中国势必需要有东说念主站到手艺的前沿。”
梁文锋和他的DeepSeek还在接续求索。
就在1月20日, DeepSeek崇拜发布DeepSeek-R1模子。该模子在数学、代码、当然谈话推理等任务上,性能并列OpenAI o1郑再版。DeepSeek称,R1在后检修阶段大限制使用了强化学习手艺,在仅有少量标注数据的情况下,极大提高了模子推明智商。DeepSeek不仅将R1检修手艺全部公开,还蒸馏了6个小模子开源给社区,允许用户借此检修其他模子。
“投身于探索AGI的内容,不作念中和的事,带着酷爱心,用最永久的目光去回复最大的问题。”DeepSeek的公众号这么写说念。