Visualized Reading

I turn papers and blogs I am actively reading into single-file, self-contained interactive HTML pages. Each entry below opens a standalone visualization; it is my way of forcing myself to restate what I just read in a form that someone else could also navigate.

The exact Cursor agent command I use to produce these pages lives at blog-to-html.

Ratchet 自进化 agent 经验手册到底哪些管理动作不能少

· paper · original

NudgeRL self-distillation 和 RL 的巧妙结合

· paper · original

Agent memory 调研

· paper · original

EAGLE 系列怎么一步步把 LLM 推理加速做到 6.5x

· paper · original

RoPE 介绍

· paper · original

MiMo 为什么选 MTP 和更高 SWA 比例而不是 MLA

· paper · original

AlphaEvolve: LLM based 算法自动改进(auto research)

· paper · original

Skill0 怎么用 RL 把 Agent 技能内化到模型参数里

· paper · original

MLA · 把 KV cache 联合压成一个 latent 向量

· paper · original

用分布几何看 SFT、RL、OPD 三种 post-training 怎么推模型

· blog · original

构造一个更懂用户的 Agent System · 三层设计

· blog

Manus 上下文工程 · 重写 4 次 Agent 框架的 6 条经验

· blog · original

Anthropic Skills

· blog · original

Hermes Agent 的记忆机制 · 双层结构与冻结快照

· blog · original

三个 bug 同时撞在一起 · Anthropic 的 Claude 质量下降复盘

· blog · original

Context Engineering by Anthropic

· blog · original

Anthropic 怎么设计长程编码 Harness

· blog · original

RLVR 的参数更新大多落在非主成分方向

· paper · original

verl 在训练的时候,发生了什么?

· blog

verl 的 batch 分发机制:balance batch 和 dynamic bsz

· blog

DeepSeek-V4 Report

· paper

Anthropic 怎么构建 multi-agent research system

· blog · original