MajorTom实在之路
  • 首页
  • 往期整理
    •   历史归档
    •   文章分类
    •   文章标签
  • 友情链接
  • 关于我
  • Ctrl+K
    首页
    往期整理
    历史归档
    文章分类
    文章标签
    友情链接
    关于我
    Keep learning
    🤔技术
    🏦 Bank Conflict Free问题建模,异或方法的数学原理
    🗒️ 从三极管到bank冲突,RAM原理学习
    🔍 TPU 脉动阵列 笔记
    ☯️ Deepseek EPLB Note
    🐬 DeepSeek-v3 Infra笔记
    🐬 DeepSeek-v3 模型笔记
    🖥️ 体系结构 ETH 2024笔记
    📏 torch memory planning
    🔢 torch代码笔记
    💾 Ansor论文笔记
    💾 TVM论文笔记
    ✅ Cuda Reduce优化笔记
    ↪️ RoPE 旋转位置编码
    📋 大模型推理加速手段整理
    🎰 地址对齐→Bank Conflict
    ☕ 饮茶与double buffer
    🐞 BiDebug: 二分debug工具
    💾 MLIR 公共子表达式消除
    💾 TVM Fuse
    🖼️ 卷积优化
    📏 MLIR Operation内存布局
    🙆‍♂️ 规范化(Canonicalization)
    ▶️ Windows 使用LDAC
    🤖 MLIR Pass机制
    ⌨️ 动态format的printf
    📔零散笔记
    🗒️ Reading Notes
    📕阅读
    Lazy loaded image 黑格尔
    MajorTom.
    © 2021-2025
    Powered By NotionNext 4.8.3

    实在之路

    2025-03
    •  Bank Conflict Free问题建模,异或方法的数学原理
    • 2025-03-14  从三极管到bank冲突,RAM原理学习
    • 2025-03-14  TPU 脉动阵列 笔记
    • 2025-03-10   Deepseek EPLB Note
    2025-02
    • 2025-02-11  torch memory planning
    • 2025-02-11  torch代码笔记
    • 2025-02-11  Ansor论文笔记
    • 2025-02-11  TVM论文笔记
    • 2025-02-11  Cuda Reduce优化笔记
    • 2025-02-10  DeepSeek-v3 模型笔记
    2025-01
    • 2025-01-23  体系结构 ETH 2024笔记
    • 2025-01-20  DeepSeek-v3 Infra笔记
    2024-08
    •  Reading Notes
    2024-07
    • 2024-07-25  RoPE 旋转位置编码
    •  大模型推理加速手段整理
    •  BiDebug: 二分debug工具
    •  TVM Fuse
    •  MLIR Operation内存布局
    •  MLIR Pass机制
    •  动态format的printf
    •  黑格尔
    •  地址对齐→Bank Conflict
    •  饮茶与double buffer
    •  规范化(Canonicalization)
    •  Windows 使用LDAC
    •  MLIR 公共子表达式消除
    •  卷积优化
    MajorTom.
    © 2021-2025
    Powered By NotionNext 4.8.3

    实在之路

    Article List
    Keep learning
    🤔技术
    🏦 Bank Conflict Free问题建模,异或方法的数学原理
    🗒️ 从三极管到bank冲突,RAM原理学习
    🔍 TPU 脉动阵列 笔记
    ☯️ Deepseek EPLB Note
    🐬 DeepSeek-v3 Infra笔记
    🐬 DeepSeek-v3 模型笔记
    🖥️ 体系结构 ETH 2024笔记
    📏 torch memory planning
    🔢 torch代码笔记
    💾 Ansor论文笔记
    💾 TVM论文笔记
    ✅ Cuda Reduce优化笔记
    ↪️ RoPE 旋转位置编码
    📋 大模型推理加速手段整理
    🎰 地址对齐→Bank Conflict
    ☕ 饮茶与double buffer
    🐞 BiDebug: 二分debug工具
    💾 MLIR 公共子表达式消除
    💾 TVM Fuse
    🖼️ 卷积优化
    📏 MLIR Operation内存布局
    🙆‍♂️ 规范化(Canonicalization)
    ▶️ Windows 使用LDAC
    🤖 MLIR Pass机制
    ⌨️ 动态format的printf
    📔零散笔记
    🗒️ Reading Notes
    📕阅读
    Lazy loaded image 黑格尔