Protenix 使用与启动教程

Protenix A trainable PyTorch reproduction of AlphaFold 3. Protenix 项目地址: https://gitcode.com/gh_mirrors/pr/Protenix

1. 项目介绍

Protenix 是由字节跳动开源的一个基于 PyTorch 的 AlphaFold 3 的可训练再现。AlphaFold 是一种预测蛋白质结构的算法,Protenix 继承了其核心功能,并在此基础上进行了优化和扩展。该项目旨在为科研人员和开发者提供一个强大的工具,用于蛋白质结构预测和研究。

2. 项目快速启动

环境准备

在开始之前,请确保您的系统中已安装了 Python 3 以及必要的依赖项。以下命令将帮助您安装所需的库:

pip3 install torch
pip3 install -r requirements.txt

安装 Protenix

通过 PyPI 安装

推荐使用 PyPI 进行安装:

pip3 install protenix
使用 Docker

如果您对模型训练感兴趣,建议使用 Docker 进行安装:

docker pull bytedance/protenix
在 CPU-only 机器上安装

对于只在 CPU 上进行开发的情况,可以使用以下命令:

python3 setup.py develop --cpu

运行示例

以下命令将展示如何使用 Protenix 进行模型预测:

# 使用预计算的 MSA 目录进行预测
protenix predict --input examples/example.json --out_dir ./output --seeds 101

# 如果 JSON 文件中没有包含预计算的 MSA 目录,可以使用以下命令
protenix predict --input examples/example_without_msa.json --out_dir ./output --seeds 101,102 --use_msa_server

将 PDB/CIF 文件转换为 JSON

如果您输入的是 PDB 或 CIF 文件,可以将其转换为 JSON 文件进行推理:

protenix tojson --input examples/7pzb.pdb --out_dir ./output

3. 应用案例和最佳实践

使用 Protenix 进行蛋白质结构预测时,以下是一些最佳实践:

  • 确保输入的 JSON 文件格式正确,并且包含了所有必要的参数。
  • 利用预计算的 MSA(多重序列比对)可以提高预测的准确性。
  • 对于不同的预测任务,可能需要调整模型参数以获得最佳结果。

4. 典型生态项目

Protenix 作为开源项目,已经有一些生态系统项目在对其进行扩展和应用。以下是一些典型的生态项目:

  • Protenix-Dock:这是一个基于经典蛋白质-配体对接框架的实现,不使用深度神经网络即可提供有竞争力的刚体对接性能。
  • PyMOLfold:如果想要使用 PyMOL 进行 Protenix 推理,可以参考这个项目。

请根据具体需求选择合适的项目进行集成和使用。

Protenix A trainable PyTorch reproduction of AlphaFold 3. Protenix 项目地址: https://gitcode.com/gh_mirrors/pr/Protenix

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐