清华团队开源“赤兔Chitu”大模型推理引擎–推理成本降一半,性能翻番,GOOGLE快速深度研究报告生成工具

清华大学高性能计算研究所开源高性能大模型推理框架Chitu,实现国产AI芯片原生运行FP8精度模型。Gemini 2.0 Flash Image Generation and Editing利用Google Gemini 2.0 Flash生成和编辑图像。Deep Research快速生成深度研究报告,注重用户隐私本地存储数据。Xata Agent作为PostgreSQL数据库监控的开源AI助手。Agentic Radar用于扫描和分析Agentic系统安全性,识别漏洞并生成报告。

破解国产芯片FP8及DeepSeek部署难题,清华团队开源“赤兔Chitu”大模型引擎

专注AIGC领域的专业社区,聚焦微软&OpenAI、百度文心一言等大语言模型的发展与应用。清华大学高性能计算研究所团队开源了名为‘赤兔Chitu’的大模型推理引擎,首次实现在非英伟达H系列GPU及国产芯片上原生运行FP8精度模型,有效突破部署限制。

独家:清华系AI Infra明星企业“清程极智”完成新一轮融资|

清程极智获新一轮融资,由北京市人工智能产业投资基金、中科创星及考拉基金等投资。该公司专注于智能算力系统软件开发,致力于解决国产芯片使用不便和效率低等问题,并推出自研的高性能推理引擎。