flash attention一直无法启用的问题

求助一下，孩子要被这个transformer计算速度折磨到崩溃了。

木白阳阳子

1078人浏览 · 2024-12-11 21:30:29

木白阳阳子 · 2024-12-11 21:30:29 发布

大佬们，安装flash attention后，我用代码检测我的版本号：

import flash_attn
print(flash_attn.__version__)  # 查看 Flash Attention 的版本

结果为：

2.7.0.post2

安装包是大佬发布的：Releases · bdashore3/flash-attention

我的cuda，torch，Python的型号分别为：

cuda = 12.4
torch= 2.5.1
python = 3.12

安装的红框里面的whl文件，参考的是这一篇文章：Windows系统安装flash-attn速度非常慢解决方法_flash-attn windows-CSDN博客

现在也不知道为什么，就还是报警：

D:\Worksoftware\Anaconda3\envs\py312_CUDA12_pytorch241\Lib\site-packages\torch\nn\functional.py:5560: UserWarning: 1Torch was not compiled with flash attention. (Triggered internally at C:\cb\pytorch_1000000000000\work\aten\src\ATen\native\transformers\cuda\sdp_utils.cpp:555.)
  attn_output = scaled_dot_product_attention(q, k, v, attn_mask, dropout_p, is_causal)

求助一下，孩子要被这个transformer计算速度折磨到崩溃了

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

UFW防火墙安全指南

UFW（Uncomplicated Firewall）是Ubuntu/Debian系统中简化防火墙管理的工具，通过直观命令帮助用户有效控制网络流量，提升系统安全性。文章详细介绍了UFW的基本命令，包括启停防火墙、添加规则、限制连接速率和日志配置等操作，并提供了安全最佳实践，如默认拒绝策略、IP地址限制和服务级规则管理。同时，还涵盖高级配置技巧，例如多网络接口设置、规则优先级调整、IPv6支持及与f