“烧掉94亿个OpenAI Token后,这些经验帮我们省了43%的成本!”
作者分享了在一个月内消耗94亿Token的经验和优化策略,包括选对模型、用好提示词缓存、优化提示词结构减少输出Token数量、使用Batch API处理非实时任务等方法。这些经验帮助将成本降低了约43%。
作者分享了在一个月内消耗94亿Token的经验和优化策略,包括选对模型、用好提示词缓存、优化提示词结构减少输出Token数量、使用Batch API处理非实时任务等方法。这些经验帮助将成本降低了约43%。
今天分享的DroidRun是一个基于大语言模型的开源框架,用于通过自然语言命令控制Android设备。它支持多种LLM,并结合DroidRun Portal应用实现自动化操作,如购物助手、社交媒体发布等。
通过实战展示MCP的强大拓展能力及其与外部工具如n8n的结合。介绍n8n作为一款开源工作流自动化平台,支持用户创建自定义自动化流程。文章重点介绍了如何在n8n中集成MCP协议以调用AI模型进行复杂任务处理,并总结了其带来的效率提升和灵活性优势。
香港科技大学研究人员提出「原子思维」(AOT)改进了GPT-4o-mini在HotpotQA上的性能至80.6%,超越了现有方法。该技术通过将复杂问题分解为独立的子问题,实现更高效和准确的推理。
初创公司DeepWriter宣布其AI生成的203页商业战略书籍,耗时不到4小时。该模型仅需提示词和相关AI模型即可完成创作,内容涉及小型SaaS公司的崛起策略。
一款名为Zerox的OCR工具通过集成GPT-4o-mini模型实现了高效文档处理。支持PDF、DOCX等多种格式文件,并能准确识别包含复杂布局(如表格、图表)的扫描文档,输出Markdown格式便于编辑和使用。
UC Berkeley发布Sky-T1-32B-Preview模型,在多个基准测试中与OpenAI的o1-preview平分秋色。该模型采用三步走战略:数据筛选、高效训练和全面评测,最终总成本不到450美元。研究显示高水平AI研发不需要天价预算,为社区开源贡献了力量。