首页 科技资讯文章正文

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

科技资讯 2025年02月15日 22:00 18 bvfc9
美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

前言

“媲美中国人的还得是中国人”

DeepSeek问世之后对美国AI界的震撼感那叫一个大。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

霸榜第一名

它仅仅用了558万美元的研发费用,就超越了美国数亿美元成本的AI模型。

美国科技巨头英伟达“应声倒地”,单日市值蒸发接近6000亿美元,创下史上最大单日跌幅记录。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

多家巨头市值蒸发

还有像AMD、台积电等传统巨头也受到了不同程度的冲击。

就在这时,一位美籍华裔女科学家站了出来,用了50美元成功复刻了DeepSeek!

她是咋做到的?

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

美籍华裔女院士李飞飞

人们常说,美国有一位来自中国的“AI教母”,指的就是李飞飞。

李飞飞出生于1976年的北京,成长在一个知识分子家庭,那种浓厚的学术氛围滋养着她的求知欲。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

李飞飞童年

小时候的李飞飞,对知识的渴望简直超乎寻常小朋友,但凡有学习的机会,她都紧紧抓住。

那时候国内的经济虽然潜力巨大,但仍在发展阶段,教育资源不像现在这么丰富。

因此李飞飞16岁时选择远赴美国求学,在美国新泽西州定居,并加入美国国籍。

她凭借优异的成绩考入了普林斯顿大学,主修物理和计算机科学专业。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

普林斯顿大学

上世纪90年代,美国科研环境优势明显,顶尖高校云集,科研设备先进,如同科技领域的 “超级航母”,吸引了大批中国人才。

毕业后李飞飞决定进入加州理工学院,攻读电子工程硕士和博士学位。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

图源网络

此后李飞飞的学术之路就像开了加速器,在人工智能领域崭露头角,做出了颇多的研究成果,2020年被选为美国国家工程院院士。

同时她也在美国找到了自己的意中人,她的丈夫是一位机器人专家,叫西尔维奥・萨瓦雷塞,两人的工作领域可谓相辅相成。

如今李飞飞和丈夫已经生了一儿一女,家庭美满幸福。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

李飞飞家庭

不过她并没有在组建家庭后成为“家庭主妇”,相反更加投身于科研工作里。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

50美元复刻DeepSeek

2025年2月6日,AI界传来重磅新闻:李飞飞和斯坦福大学的研究团队,用不到50美元的成本,成功训练出名为s1的人工智能推理模型。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

图源网络

翻译:DeepSeek r1令人兴奋,但缺少OpenAI的测试时缩放图,且需要大量数据。

我们推出s1,仅用1000个样本以及一种简单的测试时干预方法,就重现了o1-preview的缩放特性与性能表现。

该模型出炉后迅速被拿来和DeepSeek 作比较,结果显示它在数学和编码能力方面与后者平分秋色。

这消息听起来过于魔幻,很多从业者一开始还表示不相信。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

图源华尔街见闻

就好比你用买冰棍的钱,买到了一辆豪华跑车,谁听了不觉得惊讶?

但发现这是事实后,大家都在想她到底是怎么做到的?

随着《科创板日报》记者深入调查以及业内人士的解读,事情的真相逐渐浮出水面。

原来,s1模型并非平地起高楼,而是基于阿里云通义千问(Qwen)模型进行监督微调得到的。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

通义千问

此方法相当于是在精装修好的房子里做一些局部调整。

这让许多网友放心了,原来所谓的低成本,是站在巨人的肩膀上才实现。

从李飞飞团队的研究论文来看,s1模型训练只用了1000个样本数据。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

图源网络

按照业内普遍认知,这点数据量在AI训练中实在是少得可怜,根本不足以研发出一个具备推理能力的模型。

中国人工智能界大咖谢伟迪副教授,在仔细看s1的论文后也发现了这个问题。

这1000个样本数据的作用更像是给蛋糕点缀的樱桃,而不是制作蛋糕的主要原料。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

李飞飞团队论文

这种低成本训练很依赖已有的强大基座模型,要是没有别人给它打地基的话就不行了。

不过,哪怕s1模型的低成本训练备受质疑,但它的研究思路还是有很多可取之处的。

因为AI领域这些年一直在研究的重要项目之一,便是如何高质量、低成本地训练。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

李飞飞

李飞飞这次的成功意义不浅,相当于只要有一个国家在AI领域实现技术突破,就很可能会被其他国家低成本复刻。

然而这样的人才却加入了美国国籍,还代表美国与中国竞争,让许多网友心中不忿。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

网友评论

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

如何看待李飞飞

在美国AI界,像李飞飞这样优秀的华裔科学家还有不少。

比如吴恩达、亚历山大·王、贾扬清等人,都是是AI领域响当当的大神级人物。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

亚历山大·王

对于这些美籍华裔科学家,认可其实力的同时,社会上也存在一些争议观点。

有人觉得他们享受了美国优越的科研资源和环境,取得的成果很大程度上得益于美国提供的平台。

部分人认为,既然他们选择加入美国国籍,就意味着在一定程度上与祖国拉开了距离。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

亚历山大·王呼吁美国必须赢下这场AI战争

即便他们取得科研成果,那种情感上的隔阂也很难完全消除。

而且越是为美国一些关键技术领域做出贡献,越是给中国科研领域造成压力。

这和我们中国人心中的家国情怀格格不入,更多的人所崇敬的还是钱学森这样的人。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

钱学森

不过换个角度看,他们在国际上取得的成就,提升了华裔群体在科技领域的声誉。

有个很有趣的现象,在中美AI竞赛的某场赛事中,双方竟都是中国面孔。

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

图源网络

这种竞争带来的压力,也使得国内AI领域的从业者不敢懈怠,从而屡屡产生新突破。

毕竟中国人骨子里有不服输的精神,这种精神推动着中国AI领域持续发展。

参考信源:
2025-02-06 华尔街见闻——成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

2025-02-06 财联社——李飞飞团队“50美元"复现DeepSeek R1真相:基座为阿里云Qwen模型

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

2025-01-28 中国新闻网——Deepseek爆火,英伟达股价暴跌,白宫回应

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

抖音百科——李飞飞

美籍华裔女院士,依靠Qwen模型复刻Deepseek,成本不到50美元!

发表评论

才聘号Copyright Your WebSite.Some Rights Reserved. 备案号:川ICP备66666666号