Sundar Pichai
谷歌发布MedGemma,基于Gemma 3构建,专攻医学文本与图像理解
HyperAI超神经上线教程板块,提供一键部署MedGemma-27b-text-it医学推理大模型教程。该模型支持医疗文本理解与临床推理任务,如病人问诊、分诊等。HyperAI还为新用户准备了注册邀请码福利。
早融合 VS 晚融合,Natvie 多模态大模型的 Scaling Law 有所不同吗?
本周解读机器之心PRO会员通讯第19期,涵盖2项专题解析及29项AI&Robotics要事速递。重点讨论了Native多模态模型的训练过程差异以及早融合晚融合的优劣。
NotebookLM 音频“说中文”了,AI帮助积累资料、生成大纲、挖掘洞见,网友:被低估的神器。
Google CEO Sundar Pichai 推出了NotebookLM新功能:Audio Overviews (音频概述),支持50多种语言,包括中文。NotebookLM能将上传的资料生成引人入胜的“深度探讨”音频总结,支持多种格式文件。
谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命
谷歌发布DolphinGemma大模型,基于30年海豚研究数据训练,能识别并预测海豚声音模式,参数仅400M,可在普通手机上运行。这是人类首次能够与动物进行实时交流的AI模型。
谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!
谷歌CEO Pichai抛出MCP协议问题,OpenAI、谷歌和Anthropic等纷纷支持。谷歌在4天内宣布支持MCP,并更新Gemini API文档。MCP是开放标准,用于连接AI应用与外部工具、数据源和系统。
谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
谷歌开源低成本大模型Gemma-3,参数从270B到10B不等。采用自注意力架构优化长上下文处理能力,并集成视觉编码器和图像嵌入压缩技术。
4K 视频生成!Google 版 Sora 深夜秀肌肉,再度狙击 OpenAI
Google Deepmind 推出的新视频模型 Veo 2 和 Imagen 3 提供了更高分辨率的视频生成能力,并改进了指令识别和物理现象模拟功能。Veo 2 还引入了不可见的 SynthID 水印以确保其 AI 生成属性,而 Imagen 3 在多个国家推出的同时支持多种艺术风格的图像创作。