
Da1sypetals
执炬迎风
置顶文章
DSL(Domain-Specific Language,领域特定语言)是一种专为特定问题领域设计的编程语言。
注:本文用LLM辅助写作的地方主要在:我认为LLM比我理解的更好的地方,会用LLM的表述代替。
免责声明:我主要在 Windows 上使用最新的稳定版 Rust 工具链和 CPython 3.13 进行开发和测试。
最近文章
注:$\odot$ 代表逐元素乘法。
DeepSeek发布了最新的魔改版Residual Connection:Manifold Constrained Hyper-Connection.
原本第一集应该是语法和随便找个bmm,flash-attn2的kernel来实现一下并且进行benchmark的,因为所以gpu编程博客都是这样的。
我决定删掉 bilibili.
首先,(在通常意义上来说)cuTile不是一个库,是一门语言,因为他劫持捕获了Python的源码并且使用了自己的编译器对这段代码进行编译、Lower、执行等操作。这一点在宏观上可以对比triton。