2026年1月8日
下午
- 12:30 出宿舍,中午鸡腿饭,1点回实验室
- GLM Pro Plan 旺仔任务 ✅ 成功送货
- Discord 注册成功但进不了群,自动化流程卡住
- Telegram 搞到5积分,输入失败还被扣完了,血亏
- 来回折腾到3点,开始有点累
下午续
- 3点后转战个人博客搭建,解决了GitHub日历不显示 + 图片更新问题
- 4点搞定博客基础架构,后续规划:学习日志/日记/论文笔记全部托管,用 GLM API + Claude Code 自动化管理
- 研究极客时间内容转PDF脚本,找到开源方案并成功下载课程
- 学了 Claude Code 的 SDD 分层方法论(spec/plan/tasks/constitution),给自己的 API 项目定了大项目级别
晚上
- 5:30 吃饭,食堂快餐(胡萝卜牛腩 + 椒盐鸡柳)
- 7点散步,8点去好想来买了200块零食,来回溜达了1小时
- 继续推进课题:整理项目文档 + 论文知识点梳理 + 数据解法深入理解
状态
精力 7/10,情绪 5/10
事情太多,多线程并发把注意力打散了,心态有点崩。
健康打卡
- 早餐:❌ 没吃
- 午餐:鸡腿饭
- 晚餐:胡萝卜牛腩 + 椒盐鸡柳
- 散步:✅ 1小时
- 喝水:✅ 2000ml
今日收获
- 极客时间PDF下载流程跑通
- 博客GitHub日历问题解决
- SDD方法论入脑,给API项目定了架构方向
- FPN论文读完,串起了特征连接的进化线
今日卡点
- cookie认证下载一直出问题
- 昨晚微信读书忘打卡,泪目
感悟
一颗向上的心脏,不应该有一副向下的躯体。
不要精分,一段时间专注做一件事,效率自然会高。
明日计划
- 去50所好好上班
- 闲下来折腾小程序
今日论文 #day07
FPN《Feature Pyramid Networks for Object Detection》
CVPR 2017 | FAIR | Tsung-Yi Lin等
核心痛点
物体检测的多尺度困境——大物体需要浅层高分辨率特征,小物体需要深层强语义特征。传统方案要么只用单尺度特征(小物体看不清),要么搞图像金字塔(计算量爆炸)。
解法
既然输入金字塔太慢,那就构建特征金字塔。
FPN核心是”自顶向下 + 横向连接”:
- 自顶向下路径:从深层强语义特征开始,逐层上采样
- 横向连接:每层融合同分辨率的底层特征(1×1卷积后相加)
- 结果:每层都有”高分辨率 + 强语义”,大车小车都能看清
关键发现
几乎零成本的大幅提升:
- AP从31.6→33.9(+2.3)
- 小物体APs从13.2→17.8(+4.6)——FPN杀手锏
- 速度反而更快:FPS从3→6.7
消融实验证明:横向连接最关键,”分辨率”和”语义”缺一不可。
读后感
从Day04 ResNet的”+x” shortcut,到Day05 DenseNet的”[x0,x1,…]”密集拼接,再到Day07 FPN的金字塔融合——深度学习的进化史,就是一部”特征连接方式”的探索史。FPN把CNN不同层的特征串成了糖葫芦,每层都能吃到最甜的那一口。这个架构后来成了目标检测的”标配”,连YOLO系列都在用。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Leo的笔记本!
评论
ValineDisqus







