前言

之前雷军不是把deepseek的女强人罗福莉开了个千万年薪给挖过来了吗,最近小米的大模型研发也是有了一些进展。

据IT之家4月30日消息:

小米大模型团队通过“Xiaomi MiMo”公众号宣布,今天,小米开源首个“为推理而生”的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的“小米大模型 Core 团队”的初步尝试。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

MiMo的表现

然后我兴高采烈去HuggingFace上面找,也确实是找到了,但是:

这个开源的版本并没有打包好,也就是我没法像deepseek一样,在cmd里面敲ollama run deepseek-r1直接开箱即用。

mimo官网页面

倒也是有别人打包的第三方版本,但是看名称,加入了各种定语,我只是业余玩AI模型的爱好者,根本看不懂。

第三方打包的模型

于是我放弃了这个想法。下次等发布了官方打包版本,那我多少得部署下来玩玩。

不过,我突然有点好奇了:

7B的模型都能跑出这么好的成绩,那么14B的deepseek-R1又能跑出怎样的成绩呢?

正好马上就2025年高考了,让这个运行在本地的deepseek挑战挑战高考数学试卷,岂不是很有意思?

用H20多卡集群跑的满血模型当然是随便拿捏,考个140是毫无悬念,但是这玩意这么大一块也带不进考场啊!

而14B的模型,用4070Super级别的显卡就能飞速输出,甚至还能装在笔记本,手机里面慢慢输出,就小小一块,很容易就能带入考场(bushi

正好今天挺闲的,因为稍微有点电子养胃。那就二话不说,开整!

测试环境

电脑平台

电脑配置

核心参数其实只需要看显卡基本就行了,12GB显存,在运行时大概占用10G多,刚刚好能装下这个14B模型。

在跑这个模型时,一秒钟大概能生成30字,就比豆包慢一点点,比腾讯元宝的deepseek略快。

AI模型

模型参数

是的,就是我上面说的开箱即用模型。

连接模型的软件

软件页面

设计的挺不错,还支持md格式的数学公式显示。

测试流程

  1. 将高中数学星空公众号的图片形式的高考真题发送给豆包,让豆包提取成如下所示的,AI看得懂的md格式文字:

    1.已知集合\(A = \{x|-5 < x^{3}< 5\}\),\(B = \{-3,-1,0,2,3\}\),则\(A\cap B =\)
    A.\(\{-1,0\}\) B.\(\{2,3\}\) C.\(\{-3,-1,0\}\) D.\(\{-1,0,2\}\)
  2. 将题目直接发送给deepseek,或者加有提示发送给deepseek。
  3. 查看回答情况,根据回答情况决定是否再次给予提示。
  4. 2和3两点都会影响题目最后获得的分值。
  5. 选择填空题直接获得分数,解答题计算步骤分。并记录下思考时长。
  6. 对话全文和数学题目md格式文本会放在文章末尾,感兴趣的朋友自行查看。

打分规则

  1. 如果我直接复制粘贴题目并发送给模型,模型答全对,且如果是解答题,步骤完整,得满分。
  2. 如果模型出现了答非所问或者漏答的情况,我给予一次机会,以不提示任何思路的方式来纠正模型,并且经过本次纠正后模型答对了,在选择填空获得应得分数的80%(四舍五入),在解答题,全对得80%,若未全对则按照步骤算分,获得全部步骤分,且最高分数不超过满分的80%。
    给解答题的评分标准举个例子:这道题模型漏答了,我把那道题(满分15分)的某个小题单独拎出来让它再做一下,然后它每次回答都是对的,拼起来就是三道题全对,那么就获得15*0.8=12分;如果这道题它步骤对了一部分,获得8分,那它就获得8分;如果它最后除了最终答案,其他全都对,按照步骤计分获得14分,那么按照上面的规则,它只能获得12分。
  3. 由于模型解题速度较快,且ai模型输出具有随机性,所以我只做一遍可能并不能体现模型的全部实力。于是我引入了剩余时间加分机制:将2小时减去所有思考时间总和,获得剩余的时间。在这部分剩余的时间中,每分钟奖励0.2分,最终四舍五入获得结果。
  4. 由于模型不具备理解查看图形解题的能力,我删除了两道图形相关的题目,按照情况综合考虑,分别认定33.3%和40%的满分分数。

测试结果

我相信你们现在一定很好奇,一个14B的模型到底能拿下几分。

答案揭晓:94分!

在浙江高考数学要是考这么点,能不能上特控线都不好说。反正我115,没考过我,哈哈。

成绩总览

而且这还是加了时长奖励分的结果(毕竟空了这么多时间,肯定能重做/检查点错误出来),如果纯裸分的话,甚至只有78分!

结果分析

思考时间

思考时间

从这张图表可以大致看出,模型的思考时间和题目难度基本成正相关。难的题目基本不会低于200秒,中等及以下难度的题目基本上都低于100甚至50秒。

做错的题目

有些题目错的很有意思,拎出来单独看看(不分析解题过程,单纯看看模型怎么错的,不然又梦回高中了可不好)。

第八题

8.已知函数\(f(x)\)的定义域为\(\mathbf{R}\),\(f(x)>f(x - 1)+f(x - 2)\),且当\(x < 3\)时,\(f(x)=x\),则下列结论中一定正确的是
A.\(f(10)>100\) B.\(f(20)>1000\) C.\(f(10)<1000\) D.\(f(20)<10000\) 
好,我来看看这个题目。这道题说的是已知函数 \( f(x) \) 的定义域是实数集 \(\mathbf{R}\),满足不等式 \( f(x) > f(x - 1) + f(x - 2) \) ,并且当 \( x < 3 \) 时,\( f(x) = x \)。接下来题目给了四个选项,我需要判断哪个结论一定是正确的。

首先,我要理解一下这个函数的定义和性质。已知当 \( x < 3 \) 时,\( f(x) = x \),那在 \( x < 3 \) 的情况下,函数的行为比较简单明了,就是线性增长的。但是对于 \( x \geq 3 \) 的情况,函数满足 \( f(x) > f(x - 1) + f(x - 2) \)。这让我想到这是一个递推不等式,可能涉及到数列或者递归关系。

题目中的选项给出了四个与特定点的函数值比较的情况:比如 \( f(10) > 100 \),\( f(20) > 1000 \),还有比较小于某个值的情况。为了分析这个,我需要先推导一下当 \( x \geq 3 \) 时 \( f(x) \) 的可能取值范围。

首先,来考虑 \( x = 3 \) 的情况:
\( f(3) > f(2) + f(1) \) 。已知 \( f(2) = 2 \),因为 \( 2 < 3 \),同样,\( f(1) = 1 \)。所以,
\( f(3) > 2 + 1 = 3 \),也就是说 \( f(3) > 3 \)。

------------------------------此处省略-----------------------------
这里有个问题,我可能需要更准确的计算,因为上面用递归的方式得到的是f(n) > a_n,其中a_{n}是一个斐波那契数列。

其实我们是否可以用数学归纳法证明一个更强的结果?

假设对于某个 n ≥3,
\( f(n) > c \cdot r^n \),其中r是某个基数。那么找出c和r使得这个式子成立。

考虑到\(f(x) > f(x−1)+f(x−2)\),它看起来比斐波那契数列还要增长得更快,斐波那契数列本身就满足 \( a_n = a_{n-1} + a_{n-2} \),而在这里我们有更严格的条件:每个a_n都是超过前两项之和的。

可能这个 f(x) 的下界会比斐波那契数列增长得更快,或者可以采用超斐波那契方法。

不过也许用递归的方式来计算一些具体的值可能会有帮助:

已知:
f(1)=1,
f(2)=2,
f(3)>3,

那么现在试着计算f(n)的最小可能情况:

令f(n) = f(n-1)+f(n-2)+ε,其中ε是一个很小的正数。

这样,
f(3)=3+ε
f(4)=f(3)+f(2)= (3+ε) + 2=5+ε
f(5)=f(4)+f(3)= (5+ε)+(3+ε)=8+2ε
f(6)=f(5)+f(4)= (8+2ε) + (5+ε)=13 +3ε
f(7)=f(6)+f(5)= (13+3ε)+ (8+2ε)=21 +5ε
f(8)=f(7)+f(6)=21+5ε +13+3ε=34 +8ε
f(9)= f(8)+f(7)=34+8ε +21+5ε =55 +13ε
f(10)=f(9)+f(8)=55+13ε +34+8ε=89 +21ε

------------------------------此处省略-----------------------------

那么在n=10时:
φ^10≈ 122.99,
所以 √5 *122.99≈122.99*2.236≈275.4,
即 F(10)=89≈122.99/√5≈≈55.这样可能不对,我的计算有误。

让我更准确地计算一下斐波那契的数值:

F(1 )=1,
------------------------------此处省略-----------------------------
正确,到n=10时 F(n)= 89。所以如果f(n )>F(n ), 则f(10)>89.

问题是要比较f(n)与选项中给出的数值是否符合。

问题中每个选项问的是哪一个是正确的:
A. f(10)>100
B.f(5 )> 13
C.f(6 )>21
D.f(7 )>34

根据上述分析,
在n=5时,f(n) >8, 所以选项B说的超过13是错误的,

同样,在n=6的时候,f(6) >13, 但是否大于21呢?显然在本例中 f(6)=13.一些小数,
不够21,所以C错;

n=7时,f(7)=约21加上一点,不大于34,所以D也是错误的,

至于A选项:
f(10) >89, 是否大于100呢?只有当 f(n )显著超过斐波那契数的时候才有可能,但根据题中的推导式,
我们看到对于每个n,f(n )=f(n-1) + f(n −2 ). 而这正是斐波那契式的增长方式,只是初始条件或许影响了差异。

------------------------------此处省略-----------------------------

当问题给出选项中的n=7时,假设 f(7 )> 13,
而题目中说法选项是D.f(7 )>34?如果是这样,
那么D不对。

可能这个分析不够准确,

考虑到这道题的正确答案有可能是选A:因为当数列增长速度超过100的时候n=10,所以很可能f(10 )会大于100。

或者,可能是我错看了选项里的数值范围,

比如,或许选项是针对另一个起始条件下的情况,
如果初始值是更大的话。

总之,在此情况下,可能正确的选项为A:f(10 )>100.

因此,我会选择选项A。
经过分析,我们知道给定的递归关系式可能导致斐波那契数列式增长,并且f(n)超过斐波那契数。考虑到n=10时的增长情况,虽然初始条件不明确,但合理的推断是f(10)>100。

答案:\boxed{A}

很明显,14B模型的很大一个缺点就是生成到下面忘记了上面,这也是导致后面出现多次答非所问的重要原因,毕竟没有题目作为准线,模型只能走一步回头看一步,结果越走越偏。

第十题

错的非常搞笑,多选题硬做成单选题(我说清楚了这是多选题),此处就不放原文本了,感兴趣的自行前往文章最后查看。

第十四题

第一次回答时甚至给出了3,你要知道这是个概率题。

典型的上下文空间不足,生成到下面忘了上面,抬走。

其余错题

基本全都是漏答,给它有多个小题的题目,它都只回答最后一个小题,提示后要么直接做对,要么对一些,要么全错,简直是百花齐放。

结语

当我们在屏幕上读到AI生成的文章时,其实是在见证一场发生在多维空间的数学风暴。每个看似灵动的句子背后,都是成千上万个矩阵在并行计算中相互碰撞,词语不过是向量空间中按概率排队的数字积木。GPT模型用数十亿参数的神经网络搭建起语言的摩天轮,但转动的动力始终来自梯度下降算法——这就像用全球卫星定位系统来描摹蚂蚁爬行的轨迹,虽然精密,终究是坐标系的游戏。

人类大脑皮层上演的思维交响乐,在AI这里被拆解成无数个线性代数方程。那些感动我们的文字涟漪,实际上是权重矩阵与激活函数共同导演的数学戏剧。就连最富哲理的段落,也不过是Transformer架构在注意力机制驱动下,用概率分布拼出的认知马赛克。

这或许正是技术革命给予我们的启示:当AI用矩阵乘法模仿人类思考时,恰似用望远镜观察显微镜下的世界——再清晰的图像,也只是光的折射游戏。真正让文字拥有灵魂的,从来不是张量运算的精度,而是人类在书写时颤抖的指尖,在思考时跃动的神经元,以及那份永远无法被算法量化的、对世界的好奇与痛楚。

以上文本由网页满血deepseek生成。

附件1:md格式数学题目

一、选择题:本大题共8小题,每小题5分,共计40分.每小题给出的四个选项中,只有一个选项是正确的.请把正确的选项填涂在答题卡相应的位置上.
1.已知集合\(A = \{x|-5 < x^{3}< 5\}\),\(B = \{-3,-1,0,2,3\}\),则\(A\cap B =\)
A.\(\{-1,0\}\) B.\(\{2,3\}\) C.\(\{-3,-1,0\}\) D.\(\{-1,0,2\}\)

2.若\(\frac{z}{z - 1}=1 + i\),则\(z =\)
A.\(-1 - i\) B.\(-1 + i\) C.\(1 - i\) D.\(1 + i\)

3.已知向量\(\boldsymbol{a}=(0,1)\),\(\boldsymbol{b}=(2,x)\),若\(\boldsymbol{b}\perp(\boldsymbol{b}-4\boldsymbol{a})\),则\(x =\)
A.\(-2\) B.\(-1\) C.\(1\) D.\(2\)

4.已知\(\cos(\alpha+\beta)=m\),\(\tan\alpha\tan\beta = 2\),则\(\cos(\alpha - \beta)=\)
A.\(-3m\) B.\(-\frac{m}{3}\) C.\(\frac{m}{3}\) D.\(3m\)

5.已知圆柱和圆锥的底面半径相等,侧面积相等,且它们的高均为\(\sqrt{3}\),则圆锥的体积为
A.\(2\sqrt{3}\pi\) B.\(3\sqrt{3}\pi\) C.\(6\sqrt{3}\pi\) D.\(9\sqrt{3}\pi\)

6.已知函数\(f(x)=\begin{cases}-x^{2}-2ax - a,x < 0\\e^{x}+\ln(x + 1),x\geq0\end{cases}\)在\(\mathbf{R}\)上单调递增,则\(a\)的取值范围是
A.\((-\infty,0]\) B.\([-1,0]\) C.\([-1,1]\) D.\([0,+\infty)\) 

7.当\(x\in[0,2\pi]\)时,曲线\(y = \sin x\)与\(y = 2\sin(3x-\frac{\pi}{6})\)的交点个数为
A.3 B.4 C.6 D.8

8.已知函数\(f(x)\)的定义域为\(\mathbf{R}\),\(f(x)>f(x - 1)+f(x - 2)\),且当\(x < 3\)时,\(f(x)=x\),则下列结论中一定正确的是
A.\(f(10)>100\) B.\(f(20)>1000\) C.\(f(10)<1000\) D.\(f(20)<10000\) 

二、选择题:本大题共3小题,每小题6分,共计18分.每小题给出的四个选项中,有多项符合题目要求。全部选对得6分,选对但不全的得部分分,有选错的得0分。
9.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值\(\overline{x}=2.1\),样本方差\(s^{2}=0.01\),已知该种植区以往的亩收入\(X\)服从正态分布\(N(1.8,0.1^{2})\),假设推动出口后的亩收入\(Y\)服从正态分布\((\overline{x},s^{2})\),则(若随机变量\(Z\)服从正态分布\(N(\mu,\sigma^{2})\),则\(P(Z < \mu+\sigma)\approx0.8413\))
A.\(P(X > 2)>0.2\)
B.\(P(X > 2)<0.5\)
C.\(P(Y > 2)>0.5\)
D.\(P(Y > 2)<0.8\)

10.设函数\(f(x)=(x - 1)^{2}(x - 4)\),则
A.\(x = 3\)是\(f(x)\)的极小值点
B.当\(0 < x < 1\)时,\(f(x)<f(x^{2})\)
C.当\(1 < x < 2\)时,\(-4 < f(2x - 1)<0\)
D.当\(-1 < x < 0\)时,\(f(2 - x)>f(x)\)

三、填空题:本大题共3小题,每小题5分,共计15分.
12.设双曲线\(C:\frac{x^{2}}{a^{2}}-\frac{y^{2}}{b^{2}} = 1(a > 0,b > 0)\)的左右焦点分别为\(F_{1}\),\(F_{2}\),过\(F_{2}\)作平行于\(y\)轴的直线交\(C\)于\(A\)、\(B\)两点,若\(\vert F_{1}A\vert = 13\),\(\vert AB\vert = 10\),则\(C\)的离心率为_______.

13.若曲线在点\((0,1)\)处的切线也是曲线\(y = \ln(x + 1)+a\)的切线,则\(a =\)_______.

14.甲乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字1,3,5,7,乙的卡片上分别标有数字2,4,6,8.两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上的数字大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后的轮次中不能使用),则四轮比赛后,甲的总得分不小于2的概率为_______. 

四、解答题:本题共6小题,共70分。解答应写出文字说明、证明过程或演算步骤。
15.(13分)
记\(\triangle ABC\)的内角\(A\),\(B\),\(C\)的对边分别为\(a\),\(b\),\(c\),已知\(\sin C=\sqrt{2}\cos B\),\(a^{2}+b^{2}-c^{2}=\sqrt{2}ab\).
(1)求\(B\);
(2)若\(\triangle ABC\)的面积为\(3 + \sqrt{3}\),求\(c\).

16.(15分)
已知\(A(0,3)\)和\(P(3,\frac{3}{2})\)为椭圆\(\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}} = 1(a > b > 0)\)上两点.
(1)求\(C\)的离心率;
(2)若过\(P\)的直线\(l\)交\(C\)于另一点\(B\),且\(\triangle ABP\)的面积为\(9\),求\(l\)的方程. 

18.(17分)
已知函数\(f(x)=\ln\frac{x}{2 - x}+ax + b(x - 1)^{3}\).
(1)若\(b = 0\),且\(f^{\prime}(x)\geq0\),求\(a\)的最小值;
(2)证明:曲线\(y = f(x)\)是中心对称图形;
(3)若\(f(x)>-2\)当且仅当\(1 < x < 2\),求\(b\)的取值范围.

19.(17分)
设\(m\)为正整数,数列\(a_{1}\),\(a_{2}\),\(\cdots\),\(a_{4m + 2}\)是公差不为\(0\)的等差数列,若从中删去两项\(a_{i}\)和\(a_{j}(i < j)\)后剩余的\(4m\)项可被平均分为\(m\)组,且每组的\(4\)个数都能构成等差数列,则称数列\(a_{1}\),\(a_{2}\),\(\cdots\),\(a_{4m + 2}\)是\((i,j)\) - 可分数列.
(1)写出所有的\((i,j)\),\(1\leq i < j\leq6\),使得数列\(a_{1}\),\(a_{2}\),\(\cdots\),\(a_{6}\)是\((i,j)\) - 可分数列;
(2)当\(m\geq3\)时,证明:数列\(a_{1}\),\(a_{2}\),\(\cdots\),\(a_{4m + 2}\)是\((2,13)\) - 可分数列;
(3)从\(1\),\(2\),\(\cdots\),\(4m + 2\)中一次任取两个数\(i\)和\(j(i < j)\),记数列\(a_{1}\),\(a_{2}\),\(\cdots\),\(a_{4m + 2}\)是\((i,j)\) - 可分数列的概率为\(P_{m}\),证明:\(P_{m}>\frac{1}{8}\). 

附件2:对答全文

下载:https://dl2.lecspace.com/LositaBlog/250501-deepseek/%E5%AF%B9%E7%AD%94%E5%85%A8%E6%B5%81%E7%A8%8B.txt

最后修改:2025 年 05 月 02 日
如果觉得我的文章对你有用,请随意赞赏