DETR论文 现代检测器必须要通过一大组提议、锚框或窗口中心实现回归和分类问题,他们的性能显著受到后处理步骤,为了简化这些流程,我们提出了一种直接端到端的集合预测方法,即2020年5月发表的DETR(End-to-End Detection with Transformers)。论文我将从结构剖析、创新点分析、论文收获以及根据pytorch进行代码复现。 一、模型剖析DETR模型训练的流程简述为以下四步: 用 2025-12-29 论文 #机器学习 #深度学习
YOLO11论文见解 一、论文地位yolo11主要是相对v8而言就是三个创新点 二、提出背景三、模型架构四、训练五、源码收获通过对源码进行解读收获以下的新知识 1 热力图概念:能够直观地反映模型在输入图像中“关注的区域”或者“激活强度”。 作用: 可解释性 通过热力图,你可以看到模型在判断一个图像是“猫”还是“狗”时,究竟关注的是耳朵、眼睛、背景,还是其他特征。 辅助调试与优化模型 如果模型总是检测不到某些物体, 2025-08-07 论文 #深度学习 #计算机视觉
ResNet论文+复现 ResNet(Residual Network)由何恺明等人于2015年提出(论文《Deep Residual Learning for Image Recognition》),是深度学习领域里程碑式的论文。其核心思想是残差连接,解决了训练极深神经网络时遇到的退化问题。 这是ResNet论文的地址:Deep Residual Learning for Image Recognition 一、论文核 2025-07-25 论文 #机器学习 #深度学习
YOLOv9论文 YOLOv9 是 YOLO 系列目标检测模型的最新版本之一,由 YOLOv7的原班团队Chien-Yao Wang等人2024年2月提出,其设计旨在进一步提升检测性能与推理效率。 一、论文地位阅读论文时我通常先查看摘要和结论,以快速把握其核心内容与研究方向。 1.1 核心技术创新:突破深度网络的信息瓶颈 可编程梯度信息(PGI) 为解决轻量级模型中从 I(X, X) 准确提取 I(Y, X) 的难 2025-07-17 论文 #深度学习 #计算机视觉
Transformer论文 Transformer 原始论文 《Attention is All You Need》,由 Vaswani 等人于 2017 年 6 月发布,是近年来最具革命性的深度学习论文之一,它不仅在自然语言处理领域带来了根本性变革,也为图像处理、音频处理、分子建模、强化学习等领域开辟了新的研究方向。 一、论文地位因为首先看论文的摘要和结果(结论)能让读者把握整篇论文的大致方向,因此我在读论文的时候基本也是 2025-07-16 论文 #机器学习 #深度学习
自然语言处理 一、Transformer1 概念Transformer是一种深度学习架构,它的核心思想是: 通过注意力机制(Attention)捕捉序列中不同部分之间的关系,而不是像以前的模型(如 RNN)那样一步步按顺序处理。 Transformer 的特点 并行计算:不像 RNN 需要一步步计算,Transformer 可以同时处理所有输入。 捕捉长距离依赖:通过注意力机制,Transformer 2025-07-09 深度学习 #机器学习 #深度学习
关于batch_normlization问题 一、问题“ValueError: Expected more than 1 value per channel when training, got input size torch.Size([1, 1024])”今天记录一下关于添加batch_normlization的小问题: ValueError: Expected more than 1 value per channel when t 2025-07-07 机器学习 #机器学习 #BUG
大模型应用开发 一、相关概念1 历史背景 传统AI:机器学习、深度学习、强化学习 2017年提出的Transformer架构,奠定了大模型领域主流算法架构的基石 大模型时代:神经网络、自注意力机制、Transformer 两者之间的区别: 模型结构和算法 灵活性和可扩展性 数据规模和多样性 任务范围和性能方面 计算资源和成本 2 什么是AI大模型 大语言模型(英文:Large Language Mode 2025-06-28 深度学习 #深度学习 #项目
仿斗鱼项目 一、项目技术点语言:java jdk17 数据库:MySQL 容器:Docker SpringCloudAlibaba基础框架:Netty()、SpringBoot(生态好)、Dubbo(良好的高并发)、MyBatis-Plus(CRUD精简)、ShardingJdbc、 缓存:Redis+Caffeine(本地缓存组件) 网关:Gateway 消息队列:RocketMQ 注册配置中心:Nacos 2025-06-27 java #项目
AlexNet论文+复现 在2012年时候,由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton在ImageNet LSVRC-2010图像分类竞赛中提出的一种经典的卷积神经网络,由于他的出现和在 ImageNet 大规模视觉识别竞赛中取得了优异的成绩,把深度学习模型在比赛中的正确率提升到一个前所未有的高度,他的结果在测试集上取得 top-1错误率37.5%、top-5错误率17. 2025-06-26 论文 #机器学习 #深度学习