稀疏特征电路 Sparse Feature Circuits
Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models (ICLR ’25)
卧底特工 Sleeper Agents
Sleeper Agents: 训练能在安全训练中持续欺骗的大语言模型
阶段性模型差异比较
Stage-Wise Model Diffing 阶段性模型差异比较
训练后的 Transformer 可以在上下文中学习线性模型
Trained Transformers Learn Linear Models In-context (JMLR ’24)
关西地区随便玩玩
2023 年 6 月在日本关西地区(大阪、奈良、京都和神户)
天津走一天
2023 年 6 月 10 日天津走走
干预,在何处及如何进行?大规模非线性 SCM 的主动因果发现
Interventions, Where and How? Experimental Design for Causal Models at Scale
DAD 与贝叶斯强化学习
翻译自 Deep Adaptive Design and Bayesian reinforcement learning by Adam Foster
厦门 Amoy !
2023 年 4 月在厦门
深度适应性设计 DAD
Deep Adaptive Design: Amortizing Sequential Bayesian Experimental Design
[Adversarial Robustness] 2 Linear models
翻译自 NeurIPS 2018 tutorial “Adversarial Robustness: Theory and Practice” by Zico Kolter and Aleksander Madry
[Adversarial Robustness] 1 Introduction to adversarial robustness
翻译自 NeurIPS 2018 tutorial “Adversarial Robustness: Theory and Practice” by Zico Kolter and Aleksander Madry
长沙吃吃逛逛
2023 年初在长沙和张家界
利用逆倾向分数 (IPS) 降低选择偏差
Recommendations as Treatments: Debiasing Learning and Evaluation
在大连
2022 年在大连的夏天 — 8503
[线性代数] 第2章 有限维向量空间
《线性代数应该这样学》第2章:有限维向量空间
[线性代数] 第1章 向量空间
《线性代数应该这样学》第1章:向量空间
数据不足下的学习 Part 1:半监督学习
翻译自 https://lilianweng.github.io/posts/2021-12-05-semi-supervised/
MapReduce
MapReduce: Simplified Data Processing on Large Clusters
支持向量机
ML Notes 03: Support Vector Machine(SVM)
[MySQL 04] 索引(上)
《MySQL实战45讲》04 | 深入浅出索引(上)
[MySQL 03] 事务隔离
《MySQL实战45讲》03 | 事务隔离:为什么你改了我还看不见?
[MySQL 02] SQL更新语句执行流程
《MySQL实战45讲》02 | 日志系统:一条SQL更新语句是如何执行的?
[MySQL 01] SQL查询语句执行流程
《MySQL实战45讲》01 | 基础架构:一条SQL查询语句是如何执行的?
贝叶斯模型
ML Notes 02: Bayesian Model
决策树
ML Notes 01: Decision Tree
2021 年广州的风
去年的风还会吹进我心里