2025-04-11 07:35
DeepSeek-R1,正正在接管全球网友线秒用manim代码制做注释勾股的动画,一次完成无错误。为了玩上如许的模子,有人花上10多万元,组7台M4 Pro Mac mini+1台M4 Max Macbook Pro的家用超算。
合计496G显存(64*7+48),才能跑起个4bit量化版,
起首是LiveBench,所以相对受承认。统一个测试上,R1数据蒸馏的Qwen 32B,GPT-4o和Gemini Flash处于统一程度。
福建志伟信息技术有限公司
Copyright©2021 All Rights Reserved 版权所有 网站地图