AI探索时代，作者每时AI - 第9页共12页

怎么学习设计和训练一个大模型——也就是神经网络？

下午2时 2025/01/13 作者 AI探索时代

设计大模型需要先从技术点切入。建议初学者选择合适的工具（如PyTorch框架）和理论（如Transformer架构），专注于学习一种技术方向，并逐步理解其核心思想。

神经网络是怎么学习的？

下午2时 2025/01/11 作者 AI探索时代

本文讨论了神经网络在学习过程中的数学运算机制，并提出了模型如何通过矩阵运算和向量变换来学习数据特征的问题，指出其核心在于动态调整的数学关系（即f(x)）。

什么是神经网络？神经网络开发框架——PyTorch和架构Transformer的区别和联系

下午2时 2025/01/10 作者 AI探索时代

在文章中提到，通过PyTorch框架可以实现神经网络模型，并且PyTorch作为科学计算框架，主要用于进行数学运算。同时，文章也强调了Transformer架构的重要性及其与PyTorch的关系。总的来说，它说明了如何借助工具（如PyTorch）来构建和运行神经网络，并依靠理论（如Transformer）来指导其有效运作。

大模型之嵌入与向量化的区别是什么？

下午2时 2025/01/06 作者 AI探索时代

嵌入和向量化都是将数据转化为向量的过程，但嵌入更注重保留语义关系并能通过学习捕捉深层关系；向量化则侧重直接性，不需学习，通常基于规则或统计生成稀疏向量。二者可以结合使用以优化表示质量。

什么是序列到序列(Seq2Seq)模型？以及为什么图像理解领域主要使用的是CNN网络而不是Transformer网络？

下午2时 2025/01/01 作者 AI探索时代

大模型的核心在于特征提取和重建。Transformer架构在NLP领域表现突出，而CNN则适用于图像处理。序列到序列(Seq2Seq)用于具有连续性内容的生成，如机器翻译、语音识别及视频处理等领域。CNN擅长处理不连续且独立的图像数据。

Transformer编码器与解码器和神经网络之间的关系

下午2时 2024/12/31 作者 AI探索时代

编码器是神经网络模型的一部分，用于将输入数据映射到更紧凑的特征空间。它们通常是任务驱动的模块，由多个神经网络组件组成。

大模型Transformer架构之编码器(Encoder)和解码器(Decoder)

下午2时 2024/12/30 作者 AI探索时代

Transformer的编码器负责将人类可识别的数据转换为大模型可以处理的形式，并进行特征提取；解码器则用于重建模式，生成新的数据。其架构包括自注意力机制等多重数据处理步骤。

大模型的嵌入——Embedding与向量——Ve ctor

下午2时 2024/12/28 作者 AI探索时代

最近研究RAG后思考了嵌入与向量在大模型中的作用；嵌入解决数据向量化问题，向量则描述数据间关系；前者本质上是映射到高维矩阵中以捕捉语义关系，而后者则是数学概念中表示有方向和大小的量。

大模型语义分析之嵌入(Embedding)模型

下午2时 2024/12/26 作者 AI探索时代

本文探讨了大模型中的嵌入技术及其在RAG流程中的应用，强调了嵌入在将文本和图片等多模态数据转化为向量表示时的重要性及复杂性。

云计算与大模型训练的结合

下午2时 2024/12/25 作者 AI探索时代

文章介绍了如何利用第三方大模型平台而非自行开发来解决大模型高昂成本的问题，强调了云计算资源利用的优势，并举例说明了腾讯云等服务商提供的便捷服务。