视觉识别归档

OpenAI员工爆料：已抢先体验GPT-5！7月上线，疑似完全多模态

2025年6月27日16时作者新智元

用上了？就在今天，奥特曼在X上关注了一个神秘人，引起全网猜测。不止两人爆料，自己可能提前体验了GPT

2025年6月9日23时作者机器之心

本文研究知识蒸馏中FKLD和RKLD的次优表现，提出α-β散度框架ABKD来平衡难度集中与置信集中效应。通过实验验证了ABKD的有效性，并提出了敏感性分析以进一步优化模型性能。

2025年5月29日16时作者硅星人Pro

作者在北京最繁华商圈随机询问10位年轻人使用AI助手的习惯，发现大多数人因体验不佳而放弃。豆包推出视频通话功能后，用户可以直接与AI进行视频对话，体验提升显著。文章介绍了多场测试，展示了豆包在室内和室外环境下的表现及其带来的便利性，并强调了交互方式的改变对用户体验的影响。

2025年2月26日8时作者开源星探

腾讯元宝APP结合DeepSeek R1能解决PPT制作、会议纪要记录和日常问题解答等多方面需求，节省大量时间。它还能作为智能搜索引擎帮助用户解惑，特别适合老年人使用。

2025年2月2日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨Cameron R. Wolfe
来源丨机器之心
编辑丨极市平台

2024年12月25日12时作者 GitHubStore

一个能让 AI 像人类一样操作浏览器的 Python 工具库，支持网页自动化任务如订票、求职申请等。主要功能包括多标签页管理、数据提取和视觉识别，可自定义动作并行运行多个代理。

2024年12月17日14时作者 AI先锋官

Kimi近日推出视觉思考模型 k1，并宣布对标正式版o1。在数学及物理等多个基础科学领域的测试中，k1-preview均表现出色，甚至超越了OpenAI o1、GPT-4等强模型。同时，k1还具备强大的图像识别能力。