日期: 2025 年 3 月 14 日
AI能自主出“竞赛题”了!港大&蚂蚁让大模型学会生成难题,水平已接近AIME
港大和蚂蚁的研究人员提出PromptCoT方法,利用思维链生成高质量问题数据,提高了模型训练的效果。他们基于Llama3.1-8B训练了一个问题生成模型,并用合成的问题数据训练了DeepSeek-R1-Distill-Qwen-7B模型,使其在MATH-500、AIME 2024以及AIME 2025上的表现优于大模型。
Manus 没有秘密:70 页 PPT 深入解读 AI Agent
本内容由明浩老师提供,公众号回复:
「25
0314」,可获得完整 PPT。
明浩老师分享了关于AI Agent的定义、实现逻辑和使用案例等内容,并在音频中同步讲解。
一句话实现改图功能,谷歌Gemini 2.0新功能上线!
文章介绍了Gemini 2.0 flash experimental的主要功能包括图像编辑、一键生成文字和配图以及图片定制等内容,强调了其在图像处理方面的巨大进步,并指出尽管存在一些瑕疵,但仍对未来充满信心。
当谷歌的新AI模型可以在1个H100上运行,这对英伟达意味着什么?
谷歌发布Gemma 3模型挑战英伟达AI硬件主导地位。该模型能在多种硬件平台上高效运行,减轻开发者对英伟达GPU的依赖,打破了其80%市场份额的垄断局面。
Light-R1-32B之R1复现认识:兼看R1蒸馏模型所用800K数据细节问题
今天是2025年3月14日,星期五,北京天气晴。Light-R1-32B复现了R1的效果,但限定于数学领域AIME24、AIME25、GPQA Diamond等数据集;同时指出R1蒸馏模型所用800K数据是否来自训练还是由R1生成尚存争议。
机器人基座大模型–下一个“DeepSeek”从这里来?
Anthropic联合创始人Jack Clark指出,机器人行业即将迎来类似生成式AI模型的早期发展时期。中泰证券认为,这将推动具身智能技术的发展,预示着一个万亿级市场机遇的到来。