一文入门Vision in Transformer(ViT)模型的架构

本文详细总结了Vision in Transformer模型的设计架构,以及图像其该模型架构中的完整处理流程,帮助建立对ViT模型的基础认识。 Transformer架构在自然语言处理领域(Natural Language Processing)中的各种大语言模型中的到了非常广泛的应用,而2020年Google的一篇论文《An Image is Worth 16×16 Words》,把Transformer架构引入了计算机视觉领域,利用其Patch Embedding和自注意力机制对计算机视觉领域中传统的卷积神经王CNN的统治地位造成了极大的冲击,从而在人工智能的各个领域中已经显示出一统江湖的态势。

如何理解Transformer架构中的多头注意力机制?

本文详细总结了Transformer架构中的自注意力及其多头自注意力机制背后的工作原理和计算流程,以助于更深入的理解完整的Transformer设计架构。

一文彻底搞懂Transformer模型的Encoder结构与计算流程

本文通过对一个标准的Encoder-Only类型的Transformer架构,详细的总结了Encoder类型的网络架构以及数据流在其中的计算流程。

YOLOv1输出信息以及NMS过滤算法详细解读

2025-10-07
AI
YOLO
本文对YOLOv1模型的输出信息,以及对模型推理输出进行的NMS算法过滤等方面的信息进行总结和学习,为后续阶段解读更近的YOLO模型打好基础。

YOLOv2模型网络架构解读

2025-10-06
AI
YOLO
本文对YOLOv2模型的BN层、Darknet-19主干网络,以及模型的总体结构进行了详细的总结和学习。

YOLOv1模型网络架构解读

2025-10-01
AI
YOLO
虽然YOLOv1早已过时,但是其为one-stage架构奠定了重要的基础,本文对该模型的架构进行了详细的总结,为学习YOLO后续版本的架构打好基础。

大模型的MCP到底是什么

MCP:Model Context Protocol,即模型上下文协议,是由Anthropic公司(也就是Claude大模型的开发商)在2024年11月份所开源的标准通信协议,其目的是为大语言模型(LLM)与外部服务之间的通信提供一个标准化的接口协议,实现与外部数据源、工具等的无缝连接,从而扩展大模型的能力。

对AI NVR的思考以及君正的AI NVR平台A1

君正的A1系列是针对NVR市场所推出的集成式解决方案,相比于传统的NVR方案,君正方案最大的特色是继承了较强的AI算力,所以君正在这个方案的命名上也刻意的以xVR这样的形式进行命名,以强调其AI算力。

对射频电路元器件的学习总结

本篇笔记对无线射频电路中常用的各种元器件电路的基本工作原理和应用进行简单的总结,为后续理解和设计完整的射频电路系统架构打好基础。

对双频WiFi天线复用理解的纠正以及对Duplexer和Diplexer的比较

总结起来: - Diplexer主要用于不同频段之间共享同一根天线或者传输链路来进行通信的应用,最典型的就是双频WiFi两个频段,以及LTE多个BAND之间。 - Duplexer则主要在用于同一个频段内,使用FDD模式下的不同上下行信道通信频点上,实现同时收发全双工通信的应用。最典型的应用就是LTE FDD模式的通信。

半波对称振子天线基础及其天线增益

半波振子天线是天线最基本的结构单位,相当于是化学中的分子。所以要想对不同形态和应用中的天线有完整的理解,就要从其源头,也就是半波对称振子天线的工作原理来开始。 本文对半波对称振子天线相关的各方面基础知识进行整理和总结,作为学习更复杂的天线系统技术的基础。

G-Sensor的工作原理及其应用总结

G-Sensor:Gravity Sensor即重力传感器,或者Accelerometer即加速度传感器,其作用主要是检测物体在运动过程中加速度的突然变化。GSensor最典型的应用就是在行车记录仪中,当GSensor检测到瞬间的加速、碰撞或者减速(例如急刹车)状态,会自动触发行车记录仪摄像头的内部记录事件,保存一个紧急录影文件作为后续进行事故分析的证据。