之前做 job 分发系统的时候(function 级别),参考了 ray 的框架(实际更多的是 ray-core),在最近了解 AI compiler 的时候【大佬 的评论里提到依赖了 ray】,发现 vLLM 推理框架分布式计算的时候也依赖了 ray 更上层的 AI 分发系统,所以重新认识一下,并记录在自己实现 job 分发系统的心得。
ray 来源于 UC Berkeley 的 Ion Stoica 在 2020 年写的一篇文章,总结下来就是 AI 和大数据的发展,对于分布式应用有了更高的挑战。