大模型
大语言模型
虽迟但到:DeepSeek正式推出手机app,苹果安卓都支持!
木易在其公众号分享了DeepSeek移动端App的发布详情,并介绍了其功能和特点,包括iOS和安卓版本的下载链接、默认使用的底层模型DeepSeek V3以及支持的联网搜索等功能,强调与网页端一致。
通义文生视频模型升级,天工推理模型正式上线,微软开源小模型Phi-4!AI Weekly『1月6-1月12日』
阿里发布通义万相2.1及通义灵码AI程序员;昆仑万维上线天工大模型4.0 o1和4o版;Anthropic计划融资20亿美元;微软开源小模型Phi-4,谷歌Gemini团队并入DeepMind。
英伟达联合清华、MIT推出史上最快绘画大模型
英伟达联合清华大学、麻省理工大学推出Sana绘画模型,相比传统扩散模型在模型大小和推理速度方面有显著提升。其优势在于深度压缩自动编码器和高效的线性DiT模块。
马斯克xAI Grok iOS 应用,来了!
木易介绍了自己的公众号‘AI信息Gap’,专注于分享AI知识,并提到马斯克旗下xAI发布了名为Grok的iOS应用,该应用已在美区App Store上线,取代了Gmail和Outlook等应用成为’Productivity’版块第二名。同时介绍了xAI的Aurora文生图模型及免费使用的计划,附上下载链接,并强调正版识别的重要性。
再次更新:更完美可控的身体姿态
文章介绍了Illustrious系列动漫大模型的特点及一些成功作品,强调其高可控性和对文本描述的理解能力,并提到了THRILLustrious 4.0版本的一些出色实例。
AAAI 2025 川大提出首个基于介观表征的图像篡改检测新范式,定义IML任务SOTA新高度
Mesorch 模型首次提出从介观表征的角度融合非语义信息和语义信息,构建并行多尺度 CNN 与 Transformer 网络混合架构来提高图像篡改检测性能。
什么是神经网络?神经网络开发框架——PyTorch和架构Transformer的区别和联系
在文章中提到,通过PyTorch框架可以实现神经网络模型,并且PyTorch作为科学计算框架,主要用于进行数学运算。同时,文章也强调了Transformer架构的重要性及其与PyTorch的关系。总的来说,它说明了如何借助工具(如PyTorch)来构建和运行神经网络,并依靠理论(如Transformer)来指导其有效运作。
浙大女生AI造假被麻省理工开除!敲响学术警钟
木易作为互联网技术产品经理分享了关于AI学术造假事件的解读及反思,《浙江大学一女生用ChatGPT进行学术造假被MIT开除》引发舆论风暴。事件涉及背景优秀但违反学术诚信的行为,包括篡改研究数据、伪造原创性成果等。此事件敲响了AI时代‘学术诚信’警钟,提醒使用AI工具需谨慎。