蚂蚁集团
嚯!大语言扩散模型来了,何必只预测下一个token 人大高瓴&蚂蚁
人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。
重磅!8B「扩散」大语言模型挑战Llama,一次看清全局完爆传统模型
清华、中国人民大学与蚂蚁集团联合发布LLaDA模型,采用扩散方式打破自回归垄断,性能媲美Llama 3 8B。该模型颠覆大语言模型认知,采用掩码扩散模型训练范式,实现全局视角生成;在数学问题解答、多轮对话、代码生成等方面表现出色。相关资源包括论文和项目主页。
10 大中文医学数据集汇总:涵盖神农中医药、中医药古籍、医学推理、医学问答……
HyperAI超神经为大家整理了10个中文医学相关数据集,涵盖泌尿外科问答推理、中医古籍文本等。数据集预估大小从2.34MB到341.69MB不等,支持在线使用与加速下载,有助于推动机器视觉和大模型在医学领域的应用。
AI视频公司爱诗科技完成近3亿元A+轮融资,PixVerse用户量突破1200万
爱诗科技完成A2至A4轮融资,总金额近3亿元人民币。PixVerse用户量突破1200万,移动App在海外上线。公司提升技术研发能力、扩展算力资源以及建设人才团队,加速产品功能迭代与市场覆盖。
x 开源中国丨OSC源创会·上海站「AI Agent构建与应用」
「AI Agent 构建与应用」OSC源创会·上海站·第 108 期技术沙龙成功举办,特邀四位嘉宾分享 AI Agent 的构建和应用场景。