日期: 2024 年 12 月 17 日
开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law
Hugging Face团队利用Llama 1B模型在数学测试中超过8倍大模型的性能,并改进了搜索策略以提升模型表现。研究涉及多种方法,最终发现DVTS方法能显著提高简单/中等难度问题的性能。
OpenAI发布季第八天:ChatGPT搜索功能全面开放、新增语音搜索服务
OpenAI宣布ChatGPT搜索功能免费向全体用户开放。该服务基于GPT-4模型构建,提供对话式人工智能、实时信息更新等功能,并可集成地图服务和语音助手。
智谱AI获30亿融资、估值超200亿,2024商业化收入增长超100%
智谱AI宣布完成30亿人民币融资,主要用于大模型系列的研发和生态发展。这是智谱AI近期的第二轮融资,估值超过200亿元,并且正在开发涵盖视频生成、语音模型、多模态任务等产品线。
国产大模型智谱获新一轮 30 亿元融资,2024 商业化收入增长超 100%
智谱近期完成三十亿人民币融资,主要用于GLM大模型系列研发。业务涵盖多个行业并保持高速增长。公司推出多款产品如AI助手、开放平台等,并在技术上不断迭代提升性能。智谱致力于打造新一代认知智能大模型,加速迈向通用人工智能时代。
为多模态LLM引入ControlNet理念,开源插件解决灾难性遗忘 AAAI
IAA研究提出了一种全新的插件控制机制,内嵌语言模型实现多模态能力的插件化。该研究成果已被AAAI接收,并开源。IAA通过保持基座语言模型参数不变来解决灾难性遗忘问题,适用于多模态和专业任务处理。
宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学
宇树机器人开源强化学习代码支持MuJoCo仿真,并能迁移到实体机器运行。此项目名为RL GYM,包含详细教程与数据集,还发布了Point-LIO算法的源码。