GitHub
AI Agent成主打!谷歌发布超强多模态大模型—Gemini 2.0
谷歌发布全新多模态大模型Gemini 2.0,支持图像、视频和音频等多模态输入与输出,并能调用原生工具进行复杂任务处理。性能提升显著,新增AI Agent提供智能体自动化功能,增强用户交互体验。
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
腾讯混元大模型发布视频生成能力,引入超大规模数据处理系统、多模态大语言模型等技术改进。目前可支持130亿参数规模的模型在APP与Web端发布,并开源以增强应用拓展。
微软开源多语言翻译工具Co-op Translator
Co-op Translator 是一个Python包,利用Azure AI服务和先进的大语言模型自动翻译项目中的多语言文本及图像。它简化了技术文档的本地化过程,支持多种语言的技术开发、学习与研究。
人生搜索引擎免费用,开源版哈利波特“冥想盆”登GitHub热榜,支持中文
Pensieve(冥想盆)是一款免费的软件,能帮助用户回忆电脑屏幕上的内容。它允许用户完全控制自己的数据,并且已经在GitHub上获得了关注。对比了收费的记忆助手Rewind和微软的Windows Recall功能后,Pensieve因其隐私保护特性而显得更受欢迎。