ai16z 筹划代币经济大改版
Gemini 2.0 Flash实测|真的懂推理!1秒生成最佳解
Google推出最新AI模型Gemini 2.0 Flash。然而,实际上进步多少?本文将逐一实测,并与ChatGPT的生成内容一较高下。
Google(谷歌)近日在AI Studio平台上推出一款名为「Gemini 2.0 Flash Thinking Experimental」的实验性人工智能(AI)模型,旨在提升AI在多模态理解、推理和程式码编写方面的能力。
更懂推理的AI:可以把大问题拆解成小问题
据Google描述,这款新模型在经过训练后,可产生模型在回覆时会经历的「思考过程」。因此,Gemini 2.0 Flash Thinking的回覆,会比Gemini 2.0 Flash基础模型更能发挥推理能力。
更懂推理的AI:可以把大问题拆解成小问题
Google DeepMind 首席科学家Jeff Dean 于社群平台X发文进一步表示,该模型还受益于更快的Gemini Flash 2.0 模型带来的速度。 Dean也展示了Gemini 2.0 Flash Thinking 如何透过一系列步骤「思考」来回答物理问题,然后再提供解决方案。
从其示范影片来看,模型的推理过程与人类执行「推理」方式仍有差异。但关键是,这已经展示AI有能力将人类下的指令分解为「更小的任务」,从而产生更理想的结果。
事实上,Google于北京时间11日深夜发布的Gemini 2.0 Flash实验版,表现确实超出上一代的最高版本1.5 Pro不少,不但速度更快,面对问题的生成内容品质也大幅进步。以下为《数位时代》的实测结果:
测试一:「鸡兔同笼」数学题
鸡兔同笼示意图。图/ Grok 2 生成
「鸡兔同笼」几乎是所有学生必定会遇到的一次方程式数学考题。假设题目如下:
一个农场养了鸡与兔子共15只,兔子与鸡加总后共有40只脚,请问鸡与兔各有几只?
以下为Gemini 2.0 Flash Experimental回答:
方法一:假设法 (最常用)
假设全部都是鸡: 如果15只全部都是鸡,那么总共有15 * 2 = 30只脚。
计算差距:实际上有40只脚,比假设的少了40 - 30 = 10只脚。
转换:一只兔子比一只鸡多2只脚(4 - 2 = 2)。
计算兔子数量: 因为少了10只脚,而每只兔子可以补上2只脚,所以兔子有10 / 2 = 5只。
计算鸡数量总共有15只动物,兔子有5只,所以鸡有15 - 5 = 10只。
结论:兔子有5只,鸡有10只。
方法二:方程式法 (代数解)
设定变数:假设鸡有x只,兔子有y只。
建立方程式:
头的数量:x + y = 15
脚的数量:2x + 4y = 40
解方程式:
从第一个方程式得到x = 15 - y
将x代入第二个方程式:2(15 - y) + 4y = 40
简化方程式:30 - 2y + 4y = 40
继续简化:2y = 10
解出y:y = 5
将y代回x = 15 - y,得到x = 10
结论:兔子有5只,鸡有10只。
测验一小结:
相同的结果,其实提供给ChatGPT 4o会直接得到代数解法的推论过程。
但差异在于,Gemini 2.0提供三种以上的推论方案,其中第一种为国小以下可用的「假设法」,第二种才是国中以上的代数解。换句话说,AI已有假设提问者未必具有代数观念,因此进一步提供多种解题方案。
此外,Gemini 2.0对于自然语言的掌握度更高(更会说人话),因此推论过程说明的更仔细,对于没有数理基础的学生而言,应更有解题上的参考价值。
测试二:「电车难题」的法律见解
电车难题示意图。图/ 原作者:McGeddon
除了不会就是不会的数学题,Gemini 2.0对于抽象的伦理或法务问题能有见解吗?答案是可以。题目如下:
一辆失控的列车在铁轨上行驶。在列车正行进的轨道上,有五个人被绑起来,无法动弹。列车将要碾压过他们。你站在改变列车轨道的操纵杆旁。如果拉动此杆,则列车将切换到另一条轨道上。但是,另一条轨道上也有一个人被绑着。你有两种选择:
1. 什么也不做,让列车按照正常路线碾压过这五个人。
2. 拉下操纵杆,改变为另一条轨道,使列车压过另一条轨道上的那个人。
请问就法规层面,以上哪个选项更理想?
以下为Gemini 2.0 Flash Experimental回答:
这个问题并没有简单的答案,尤其在法律层面上更是复杂。以下我将从法律的角度来分析这两种选择,并说明为何没有一个绝对「理想」的答案:
选项一:什么也不做,让列车碾压五人
法律观点:在大多数法律体系中, 「不作为」通常不会构成犯罪,除非法律有明确规定必须采取行动的义务。例如,消防员有义务救火,医护人员有义务救治病人。在电车难题的情境中,你原本并没有责任去阻止列车,因此,若你选择什么都不做,法律上通常不会追究你的责任。
道德争议:虽然法律上可能没有责任,但在道德层面上,许多人会认为你眼睁睁看着五个人死去,是一种道德上的缺失。
选项二:拉下操纵杆,改变轨道,使列车碾压一人
法律观点:此选项涉及「主动行为」,你主动选择牺牲一个人来拯救五个人。这在法律上可能会构成犯罪,例如「杀人罪」。即使你的目的是为了拯救更多人,但你仍然直接导致了一个人的死亡。
例外情况:在极少数情况下,法律可能会考虑「紧急避难」原则。此原则允许在为了避免更大的损害时,采取一些看似违法的行为。然而,要符合紧急避难的条件非常严格,通常需要证明:
- 存在迫在眉睫的危险。
- 没有其他可行的解决方案。
- 所造成的损害必须小于所避免的损害。