速递|谷歌Gemini正在迫使承包商对超出其专业领域的AI响应进行评分
Google’s new guidelines for Gemini contractors require them to evaluate prompts regardless of their expertise, leading to concerns about the platform’s accuracy on certain topics.
Google’s new guidelines for Gemini contractors require them to evaluate prompts regardless of their expertise, leading to concerns about the platform’s accuracy on certain topics.
谷歌三位CEO联合宣布Gemini 2.0 Flash发布,性能超越Gemini 1.5 Pro,并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般,实测结果引人思考。
OpenAI的Grok 3、Meta的Llama 3.3以及谷歌的新Gemini模型相继发布,引发热议。Llama 3.3表现出色,70B版本能实现405B的效果,并且成本更低;Gemini则成为最新lmsys大模型竞技场的榜首。此外,马斯克xAI的Grok 3也在传言中即将推出。
ChatGPT 发布两年后,OpenAI 引领着 AI 发展潮流,但开源竞争者也在奋力追赶。扩散模型的成功推动了视觉生成模型的发展。小模型、多模态和具身智能等领域也备受关注。
OpenAI计划推出结合AI聊天机器人和浏览器的新产品,并且已经与多个网站进行了合作。此举被认为是对谷歌的挑战,可能会改变网络产品格局。