加州大学伯克利分校
速递|伯克利团队450美元训练新推理模型,堪比OpenAI o1预览版
研究团队NovaSky发布Sky-T1-32B-Preview,这是一种在多个关键基准测试中与OpenAI的o1早期版本具有竞争力的推理模型。训练成本约为450美元,是经济高效复制高级推理能力可能的标志。
450美元训练一个「o1-preview」?UC伯克利开源32B推理模型Sky-T1,AI社区沸腾了
加州大学伯克利分校发布Sky-T1-32B-Preview,其训练成本不到450美元。该模型在多个关键基准测试中与OpenAI o1的早期版本相当,并且是首个开源的推理模型。
GPT-5涌现能力可预测?UC伯克利仅使用当前模型检查点预测未来模型
LLM 规模扩展面临挑战,加州大学伯克利分校团队提出预测涌现能力的任务,并通过拟合参数函数——’涌现定律’来验证和提前准确预测涌现点。研究使用四个标准 NLP 基准进行验证。
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男
加州大学伯克利分校的研究表明,不同语言模型在回复语气和风格上存在差异。研究通过VibeCheck方法评估了多个大模型的回复,发现这些模型在友好性、正式性等方面具有不同的特征,并能用于指导开发者选择合适的模型进行应用。
AI模仿人类看漫画,视频大模型时序定位能力新SOTA
NumPro通过为视频帧添加数字标识符的方式提升了视频大模型的时序定位能力。无需训练设置即可增强模型对事件发生时刻的理解,实验结果显示其显著优于现有方法,并且不影响模型通用视频理解能力。