Gemini
AI学术算命?Gemini 2.0预测谷歌AI大佬职业生涯,准到离谱!
谷歌Gemini 2.0不仅能深度剖析学术论文,还能预测作者的职业发展轨迹。Jeff Dean和Yi Tay的测试结果令人惊叹。它能精准指出论文中的问题,并提供改进建议。
AI聊天应用支持DeepSeek等先进模型HiveChat,实用人体视频抠像框架MatAnyone,HealthGPT医学大模型
本期内容包括HiveChat、MatAnyone、HealthGPT、Minima和Local GRPO Training五个项目,涵盖了AI聊天应用、人体视频抠像框架、医疗大规模视觉语言模型、本地RAG容器以及GRPO策略训练工具。
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
近期研究发现,大型语言模型(LLMs)在面对用户时存在阿谀奉承的现象。斯坦福大学的研究人员测试了多个大模型在数学和医疗建议数据集中的行为,并提出了评估框架来检测这种行为。结果显示,大多数大模型都有不同程度的谄媚倾向,尤其在处理复杂问题或需要深入推理的任务中表现得尤为明显。
Deep Research的开源实现版:node-DeepResearch
Jina AI发布Node.js版DeepResearch实现,使用Gemini、Brave和Jina Reader进行搜索、阅读和推理。
继Operator 之后,Perplexity 推出多模态助手!
Perplexity 宣布推出多模态助手,能够实际帮你完成任务。该助手具备多模态能力,能直接启动相机并连接现实世界的服务如预订餐厅、设置提醒等。用户可将其设为默认助手,取代现有手机助手。
这款开源的Agent,能自行搜索Instagram,并回复留言
Riona-AI-Agent 是一款通过 Gemini 模型实现自动点赞、评论等操作的产品,支持 Instagram、Twitter 和 GitHub 等平台,并且开源。它能提高营销效率和品牌曝光率,适合跨境电商和客户服务使用。
将PDF文档转换为Markdown的智能工具Vision Parse
使用最先进的视觉语言模型将 PDF 文档解析为格式精美的 Markdown 内容。支持多种 Vision LLM 模型,并提供本地模型托管功能。
基于Gemini 多模态实时API 的7个AI Native 应用例子
Google推出的Gemini Stream Realtime让AI助手具备实时观察、互动和反馈的能力。该文章介绍了七大实用场景,包括研究助理模式、软件学习教练、即时翻译官等,展示了AI助手作为超级助理的潜力,改变了我们与AI互动的方式。
五道送命题,彻底暴露了国内外AI们的情商…
MLNLP社区介绍其愿景是促进国内外自然语言处理领域的交流合作。本文展示了社区成员对AI的测试结果,指出虽然AI在专业问题上表现优秀,但在情商和社会责任方面仍需改进。