自学内容网 自学内容网

Ubuntu 18.04 中安装 RDKit(针对 Python 2.7)

在这里插入图片描述

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。
🍎个人主页:Java Fans的博客
🍊个人信条:不迁怒,不贰过。小知识,大智慧。
💞当前专栏:Python案例分享专栏
✨特色专栏:国学周更-心性养成之路
🥭本文内容:Ubuntu 18.04 中安装 RDKit(针对 Python 2.7)

引言

  在化学信息学和计算化学领域,RDKit 是一个不可或缺的工具,它为研究人员和开发者提供了强大的功能来处理和分析化学数据。无论是在药物发现、分子建模,还是在化学数据库的构建与查询中,RDKit 都展现出了其卓越的性能和灵活性。尽管 RDKit 的支持主要集中在 Python 3.x 上,但仍有一些用户和项目需要在 Python 2.7 环境中运行 RDKit。本文旨在为这些用户提供详细的安装指南,帮助他们在 Ubuntu 18.04 系统中顺利安装 RDKit。通过遵循本文的步骤,用户将能够快速搭建起一个功能齐全的化学信息学环境,从而更有效地进行相关研究和开发工作。

步骤 1: 安装依赖项

  在安装 RDKit 之前,首先需要确保系统具备必要的依赖项。这些依赖项包括编译工具、Python 2.7 及其开发包,以及 RDKit 所需的其他库。以下是每个依赖项的详细说明及其安装方法。

1. 更新系统

  在安装任何软件之前,确保你的系统是最新的。这可以通过更新软件包列表和升级现有软件包来完成。打开终端并运行以下命令:

sudo apt-get update
sudo apt-get upgrade

  这将确保你拥有最新的软件包和安全更新。

2. 安装编译工具

  RDKit 需要编译工具来构建和安装其组件。build-essential 包含了编译 C/C++ 程序所需的基本工具,包括 gccg++ 编译器。运行以下命令安装:

sudo apt-get install -y build-essential

3. 安装 Python 2.7 和开发包

  RDKit 需要 Python 2.7 及其开发包,以便能够编译和链接 C++ 扩展。运行以下命令安装 Python 2.7 及其开发包:

sudo apt-get install -y python2.7 python2.7-dev python-pip
  • python2.7:Python 2.7 的主程序。
  • python2.7-dev:包含 Python 2.7 的头文件和静态库,供编译扩展模块使用。
  • python-pip:Python 2.7 的包管理工具,用于安装其他 Python 库。

4. 安装 RDKit 所需的库

  RDKit 依赖于多个外部库来实现其功能。以下是需要安装的库及其用途:

  • Boost:一个广泛使用的 C++ 库,提供了许多功能,包括数据结构和算法。安装命令如下:

    sudo apt-get install -y libboost-all-dev
    
  • Eigen:一个高效的线性代数库,RDKit 使用它来进行矩阵运算。安装命令如下:

    sudo apt-get install -y libeigen3-dev
    
  • 图像处理库:RDKit 需要处理图像文件格式,以下库用于支持 PNG、JPEG 和 TIFF 格式:

    sudo apt-get install -y libpng-dev libjpeg-dev libtiff-dev
    
  • XML 和 XSLT 处理库:用于解析和处理 XML 文件:

    sudo apt-get install -y libxml2-dev libxslt1-dev
    
  • SQLite:一个轻量级的数据库,用于存储和查询化学数据:

    sudo apt-get install -y libsqlite3-dev
    
  • Boost.Python:Boost 库的一个组件,提供了将 C++ 代码与 Python 代码连接的功能:

    sudo apt-get install -y libboost-python-dev
    
  • Open Babel:一个开源的化学工具库,RDKit 可以与其集成以支持更多的化学数据格式:

    sudo apt-get install -y libopenbabel-dev
    

步骤 2: 安装 Miniconda

  Miniconda 是一个轻量级的 Anaconda 发行版,提供了一个简单的方式来管理 Python 环境和包。与 Anaconda 相比,Miniconda 只包含最基本的功能,用户可以根据需要安装额外的包。这使得 Miniconda 成为一个理想的选择,特别是在资源有限或需要特定环境的情况下。以下是详细的安装步骤。

1. 下载 Miniconda 安装脚本

  首先,你需要下载 Miniconda 的安装脚本。打开终端并运行以下命令:

wget https://repo.anaconda.com/miniconda/Miniconda2-latest-Linux-x86_64.sh

  这个命令将从 Anaconda 官方网站下载适用于 Linux 的 Miniconda 2 版本的安装脚本。请注意,这里下载的是 Python 2.x 版本的 Miniconda,因为我们将使用 Python 2.7。

2. 运行安装脚本

  下载完成后,你需要运行安装脚本。首先,确保脚本具有可执行权限,然后执行它:

bash Miniconda2-latest-Linux-x86_64.sh

  在运行脚本后,安装程序将提示你接受许可协议。你可以通过按下 Enter 键查看协议内容,最后输入 yes 以接受协议。

3. 选择安装路径

  接下来,安装程序会询问你选择安装路径。默认情况下,Miniconda 将安装在用户主目录下的 miniconda2 文件夹中。如果你希望使用默认路径,可以直接按 Enter 键。如果你希望更改安装路径,可以输入新的路径并按 Enter

4. 添加 Miniconda 到系统路径

  安装程序会询问你是否希望将 Miniconda 添加到系统的 PATH 环境变量中。选择 yes,这样你就可以在任何终端会话中直接使用 conda 命令。添加到 PATH 后,安装程序会提示你是否希望初始化 Miniconda。选择 yes 以完成初始化。

5. 完成安装

  安装程序将开始复制文件并设置环境。安装完成后,你会看到类似以下的提示:

Thank you for installing Miniconda!

  此时,你可以关闭终端并重新打开,或者运行以下命令以激活 Miniconda:

source ~/miniconda2/bin/activate

6. 验证安装

  为了确保 Miniconda 安装成功,你可以在终端中运行以下命令:

conda --version

如果安装成功,你将看到当前安装的 conda 版本号。

7. 更新 Conda

  为了确保你使用的是最新版本的 conda,可以运行以下命令进行更新:

conda update conda

  这将检查并安装可用的更新。

步骤 3: 创建 Python 2.7 环境并安装 RDKit

  在安装了 Miniconda 之后,接下来需要创建一个专门的 Python 2.7 环境,并在其中安装 RDKit。这种方法可以确保 RDKit 及其依赖项不会与系统中的其他 Python 包发生冲突。以下是详细的步骤。

1. 创建新的 Conda 环境

  首先,打开终端并使用以下命令创建一个新的 Conda 环境。我们将这个环境命名为 rdkit_env,并指定 Python 版本为 2.7:

conda create -n rdkit_env python=2.7
  • -n rdkit_env:指定新环境的名称为 rdkit_env
  • python=2.7:指定环境中使用的 Python 版本为 2.7。

  运行该命令后,Conda 会计算所需的依赖项并显示将要安装的包列表。你需要确认安装,输入 y 并按 Enter 键以继续。

2. 激活环境

  环境创建完成后,你需要激活该环境,以便在其中安装 RDKit。使用以下命令激活 rdkit_env

conda activate rdkit_env

  激活环境后,你的命令提示符会发生变化,显示当前激活的环境名称(例如 (rdkit_env)),这表明你现在处于该环境中。

3. 安装 RDKit

  在激活的环境中,你可以使用 Conda 安装 RDKit。运行以下命令:

conda install -c conda-forge rdkit
  • -c conda-forge:指定从 conda-forge 频道安装 RDKit。conda-forge 是一个社区驱动的 Conda 包管理频道,提供了许多科学计算和数据分析的库,包括 RDKit。

  运行该命令后,Conda 会解析依赖关系并显示将要安装的包列表。确认安装时,输入 y 并按 Enter 键以继续。

4. 等待安装完成

  RDKit 及其依赖项的安装可能需要一些时间,具体取决于你的网络速度和计算机性能。安装完成后,你会看到类似以下的提示:

Proceed ([y]/n)? 

  这表明 RDKit 已成功安装。

5. 验证 RDKit 安装

  安装完成后,建议验证 RDKit 是否正确安装。你可以通过在终端中运行以下命令来检查 RDKit 的版本:

python -c "from rdkit import Chem; print(Chem.__version__)"

  如果 RDKit 安装成功,你将看到 RDKit 的版本号输出。如果出现错误,请检查之前的安装步骤,确保没有遗漏。

步骤 4: 验证安装

  在成功安装 RDKit 之后,验证安装是确保一切正常工作的关键步骤。通过验证,你可以确认 RDKit 是否正确安装,并且可以在 Python 2.7 环境中正常使用。以下是详细的验证步骤。

1. 激活 RDKit 环境

  首先,确保你已经激活了之前创建的 rdkit_env 环境。如果你还没有激活环境,可以使用以下命令:

conda activate rdkit_env

  激活后,你的命令提示符应该会显示 (rdkit_env),这表明你当前处于该环境中。

2. 启动 Python 解释器

  在终端中输入以下命令以启动 Python 解释器:

python

  这将打开 Python 交互式环境,你将看到类似于以下的提示符:

Python 2.7.x (default, ...) 
[GCC ...] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>>

3. 导入 RDKit 模块

  在 Python 提示符下,尝试导入 RDKit 的 Chem 模块。输入以下命令:

from rdkit import Chem

如果没有错误消息,这表明 RDKit 模块已成功导入。

4. 检查 RDKit 版本

  接下来,检查 RDKit 的版本以确认安装的正确性。输入以下命令:

print(Chem.__version__)

如果 RDKit 安装成功,你将看到 RDKit 的版本号输出,例如:

2021.09.1

5. 测试 RDKit 功能

  为了进一步验证 RDKit 的功能,可以尝试执行一些基本的 RDKit 操作。例如,创建一个分子对象并输出其 SMILES 表示:

# 创建一个分子对象
mol = Chem.MolFromSmiles('CCO')  # 乙醇的 SMILES 表示

# 输出分子对象的描述
print(Chem.MolToMolBlock(mol))

  如果 RDKit 正常工作,你将看到乙醇分子的结构信息输出。

6. 退出 Python 解释器

  完成验证后,可以通过输入以下命令退出 Python 解释器:

exit()

注意事项

  • RDKit 在 Python 2.7 上的支持可能会逐渐减少,因此建议尽量使用 Python 3.x。
  • 如果在安装过程中遇到问题,请确保你的网络连接正常,并检查错误信息以获取更多线索。

总结

  在本文中,我们详细介绍了如何在 Ubuntu 18.04 系统中安装 RDKit,特别是针对 Python 2.7 的环境。通过分步骤的指导,我们首先安装了必要的依赖项,接着安装了 Miniconda 作为环境管理工具,然后创建了一个专门的 Python 2.7 环境并在其中安装了 RDKit。最后,我们验证了 RDKit 的安装,确保其功能正常。

  RDKit 是一个强大的化学信息学库,能够帮助研究人员和开发者处理和分析化学数据。尽管 RDKit 的主要支持集中在 Python 3.x 上,但通过本文的步骤,用户仍然可以在 Python 2.7 环境中顺利使用 RDKit。希望这篇指南能够帮助你顺利搭建化学信息学的开发环境,开启你的研究与探索之旅。无论是在药物发现、分子建模,还是在化学数据分析中,RDKit 都将是你不可或缺的得力助手。


  码文不易,本篇文章就介绍到这里,如果想要学习更多Java系列知识点击关注博主,博主带你零基础学习Java知识。与此同时,对于日常生活有困扰的朋友,欢迎阅读我的第四栏目《国学周更—心性养成之路》,学习技术的同时,我们也注重了心性的养成。

在这里插入图片描述


原文地址:https://blog.csdn.net/hh867308122/article/details/144109637

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!