昨日计划完成情况

  • 小程序:最后两个bug收尾
  • 小程序:客户测试
  • 美赛:学核心内容,准备给学弟学妹讲
  • 论文Day15(DINO)
  • 散步 + 喝水2000ml

今日记录

上午

  • 8点起床,吃了牛肉饼 + 鸡蛋饼
  • 10点到公司
  • 组长聊天:项目都做完了,明年计划做小目标检测,可以融入大论文!肝硬化是医学影像方向,也是视觉模型,和实验室核心论文相关性很大
  • 中午和组长一起吃公司食堂四菜一汤,聊学习近况和科研方向——收获很大

下午 @ 公司

  • 整合笔记本和台式机的API(anyrouter失效改用glm,切换不麻烦)
  • 看了实验室最近6年的肝硬化论文(医学影像方向的视觉检测)
  • 整理美赛核心内容给学弟学妹,解析了近5年美赛真题

晚上

  • 在商场等andy下班,散步逛了1h
  • 和andy吃凑凑自助火锅(158元/位),第一次吃,还不错
  • 和y的产品头脑,andy的产品愿景很丰富,受益匪浅
  • 回来路上看论文,终于把今天的论文内容看完了

状态

精力 7/10,情绪 7/10

今天和组长、andy的对话都很有收获。

习惯打卡

项目 完成情况
论文 ✅ Day15 DINO
运动 ✅ 商场散步1h
喝水 ✅ 3L
饮食 午:四菜一汤 / 晚:凑凑自助火锅

今日论文 #day15

DINO《DINO: DETR with Improved DeNoising Anchor Boxes》
ICLR 2023 | 港科大 & 清华 & IDEA | Hao Zhang 等

核心痛点:DN-DETR用denoising加速训练,但只学习”从噪声重建GT”,没有学习”拒绝远离GT的anchor”,导致可能输出重复框。

核心解法:Contrastive DeNoising (CDN)

对每个GT同时生成:

  • Positive query(噪声 < λ₁):学习重建GT
  • Negative query(λ₁ < 噪声 < λ₂):学习预测”no object”

这教会模型:离GT近的anchor输出框,离得远的输出背景。

DINO三大改进

  1. Contrastive DeNoising:抑制重复框
  2. Mixed Query Selection:encoder特征初始化positional query
  3. Look Forward Twice:后层梯度回传前层,改进box refinement

关键结果:DINO-5scale(R50, 12 epochs)49.4 AP,SwinL预训练后达到63.3 AP。

感悟

人生第10000天 🎉

今天在daymaster上看到自己诞生10000天了,10000天 ≈ 27.4年。这是个人生里程碑。

和andy聊完,深有感触:还是要抓住这个AI时代。andy的产品头脑很棒,愿景也很丰富,让我对AI产品有了新的认识。

明天约了峰哥和攀哥在苏州碰面,走走停停,出去看看。

明日计划

  • 小程序:最后两个bug收尾(错题保存重做、收藏)
  • 小程序:客户测试
  • 论文Day16(RT-DETR)
  • 苏州之行:和峰哥、攀哥碰面,逛逛苏州
  • 吃顿好的(火锅自助补一下)
  • 散步 + 喝水2000ml