模型蒸馏是什么,如何工作的? 在 2025年2月27日2025年2月27日 上张贴 由 不二不三发表回复 阅读次数:7 次 说到模型蒸馏,这个概念其实不难理解。简单来说,就是用一个大模型(通常性能很强)来“教”一个小模型,让小模型在性…
DeepSeek R1的原理 在 2025年2月27日2025年2月27日 上张贴 由 不二不三发表回复 阅读次数:7 次 大家还记得ChatGPT 3.5和4.0刚上线时的震撼吗?它们在自然语言处理上的表现可以说是质的飞跃,但也有不…
DeepSeek V3的差异化创新点 在 2025年2月27日2025年2月27日 上张贴 由 不二不三发表回复 阅读次数:7 次 最近DeepSeek真是刷爆了各大平台,尤其是和AI相关的博主,几乎都在介绍它。DeepSeek的热度蹭蹭往上…
DeepSeek是什么? 在 2025年2月27日2025年2月27日 上张贴 由 不二不三发表回复 阅读次数:7 次 你有没有听说过DeepSeek?这个名字最近在科技圈掀起了不小的风波。这家中国AI公司不仅在短时间内开发出了超…